这些年,作了很多分布计算、并行计算、大数据处理的项目,按照如今的称呼这些都属于云计算范畴。今天说说我作过的其中三个项目,只三个。
第一个是咱们接到的视频分享网站的视频转码的订单,网站名字就不说了,有替人宣传嫌疑。他们状况是这样,视频网站的内容用MP4格式在网页上播放,可是上传的格式多种多样,咱们必须把这些视频统一转换成MP4格式,视频转码的工做想必你们都在本身的电脑上试过,一般一个100M左右的视频转码须要20分钟以上。为了提升转码效率,让用户以接近实时获得结果,必须在收完视频后,当即将一个视频拆分红多个单元,分散到多台计算机上进行转码,而后回收全部转码视频,按照顺序再次组合成一个新视频。咱们这个团队最先作流媒体起家的,工做没什么难度,轻车熟路,很快就完成了。只要机器足够多,视频差很少能够以接近实时的状态完成转码。后来又再一次改进,从用户上传视频开始当即进行转码,收到一段转码一段,用户的视频上传完毕,咱们的转码工做也完成,用户能够立刻看到本身上传的转码后视频,基本上是零延时,而且稳定性、效率都高于对方提出的要求。作完这个,对方老板很满意,接着又给了一个CDN的项目。如今咱们仍保持着合做的关系。
第二个有点玄乎,项目能够写一篇论文,题目是《关于空中移动目标运行轨迹和落点的问题》。这个项目是XXX发下来的,实质就是炮弹打导弹,大概是想看看能不能打着,论证技术可行性。当时人还在科研单位,由于研究领域和空气动力学绝不相关,因此这方面的知识基本属于文盲,知道的也就是那么几个有限的名词和数学公式,可是这正好符合XXX的要求,不须要咱们懂这些高深的理论,他们派人和咱们合做这个项目。咱们的工做就是把不少传感器(XXX人说的,我想这东西应该是雷达)接收的数据,包括当前多少千米范围内的空气的风速、风向、地表的曲面率,还有其它一些指标在收集后(这些瞬间的三维数据量很是大),分散到一大堆计算机上去执行(咱们准备了100个节点),而且要很快计算出结果(必须比空中那个运动的目标快)。这个项目花了很长时间,主要是与合做方的沟通改进,而后是再沟通再改进,循环往复,周而复始。后来终于完成了,听说作了试验,可行性很高,上面领导很满意,还摆了庆功酒。反正我没见着也没喝着。其实他们怎么计算的,我到最后也没有搞明白,问过一次,说是秘密。
第三个和两桶油有关。他们要经过采集页岩中的油气样本,分析某个地区地下有没有油气资源,是否是具备开采价值。这套程序本来已是有的,艾克森.美孚石油公司开发的,跑在CARY-1向量机上。可是那套机器是上世纪八十年代初的超级计算机,已经赶不上时代要求,而且有些数据分析理论已通过时,须要调整。两桶油不满意的关键仍是速度太慢,一次计算常常几天才能出结果。这一次又是合做,两桶油出采油的技术专家,咱们出并行计算的码农,前先后后合做弄了大半年,算是完成了。此次咱们用了新的并行算法。和上次炮弹打导弹同样,整个项目静悄悄开始,静悄悄结束,后面是否是发现新的油气田就不知道了。算法