超级计算机制造商的勇敢旧世界 - 彭博社
bloomberg
对于计算机科学家伯顿·J·史密斯和他在西雅图的特拉计算机公司的65名员工来说,审判的时刻即将来临。在过去的九年里,他们一直在努力构建一种新型超级计算机。现在,足够多的定制设计芯片已经组合在一起,以确定史密斯的理论是否能够兑现其承诺。如果可以,史密斯相信特拉可能成为未来几代超级计算机的先锋,速度远超任何已建成的计算机。
问题是,当特拉的工程师们在辛勤工作时,外部世界发生了一些他们未曾预见的事情:超级计算机行业发生了根本性的变化。由超快的专有脑芯片构建的系统,以克雷研究公司的机器为典型,占据了全球500台最快计算机中的一个日益缩小的少数派(图表)。相反,客户正逐渐倾向于使用现成微处理器构建的超级计算机。虽然每个芯片相对较慢,但计算机通过利用数十个甚至数千个芯片来获得速度。
唐吉诃德?这种技术的海洋变化加上市场的翻转,私营行业在国防和情报界之前成为主要客户。政府过去不惜一切代价以获得更快的速度来设计核武器或破译密码。但随着冷战的结束,“核武器和间谍”的预算大幅缩减,几家明星供应商要么消失,要么转向其他业务,包括思维机器公司和肯德尔广场研究公司(表格,第74页)。
现在,Tera Computer 弹出,蔑视向现成芯片的趋势,推出基于专有芯片设计的新系统。难怪史密斯被一些人视为超级计算机的唐吉诃德。但史密斯坚称他的追求会得到回报,“因为我们正在解决正确的问题。”这些问题包括他所声称的系统设计,这将使他的计算机在大约 95% 的时间内以峰值速度运行。这将是一个巨大的进步,因为超级计算机通常仅在 10% 或 15% 的时间内达到最高速度。
一个关键是“多线程”,这是并行处理的一种花哨的术语。在大多数具有多个处理单元的超级计算机中,每个芯片同时处理的指令流或线程不超过几条。芯片在系统的其他地方等待某些事情发生时,花费了大量时间。一个原因是:系统可能会因协调其众多处理器之间操作所需的所有控制信号而窒息。程序员可以通过调整软件来减少通信堵塞,但这需要大量宝贵的时间。
相比之下,Tera 的芯片可以同时处理 128 个线程。因此,如果一个线程遇到障碍无法完成,芯片会处理其他线程。同时,处理器将未完成的操作停放在一个新颖的片上队列中,直到所需的数据到达。“我们的机器不会坐着等待任何数据,”软件副总裁布赖恩·D·科布伦茨说。Tera 还开发了一种所谓的编译器,自动计算分配指令的最佳方式。
史密斯声称,Tera 的技术对于克服现在困扰并行处理的收益递减至关重要。为了增加速度,供应商不断增加更多的微处理器。但这使得协调操作变得更加困难。因此,新的速度增量变得越来越昂贵。Tera 声称其系统不受收益递减的影响。因此,如果一个芯片组可以每秒进行 10 亿次浮点运算,或称为吉浮点,256 个芯片将进行 256 吉浮点。“Tera 的方法是独特的,”橡树岭国家实验室的超级计算机专家杰克·J·东加拉说。“这使得它在科学方面如此有趣。”
对于大卫·卡特勒,微软公司操作系统开发的经理,从商业角度来看,这也很有趣——以至于他购买了Tera的股份并在董事会中任职。卡特勒表示,Tera的多线程方法将在五年内成为新一代桌面的必要条件。“未来有真正的希望,”卡特勒说,他曾负责Windows NT多线程操作系统的开发。
一些投资者同意这一观点。在与价值1800万美元的五角大楼合同合作了八年后,Tera去年通过首次公开募股筹集了900万美元,并在今年夏天通过私募再筹集了800万美元。
在某种程度上,这证明了史密斯的声誉。在超级计算机的紧密圈子里,55岁的史密斯常常与于1985年去世的超级计算机之父西摩·克雷被提及。国家科学基金会高级科学计算主任罗伯特·R·博彻斯表示,如果有人能从帽子里变出惊喜,“那就是伯顿·史密斯。”许多Tera的员工决定冒险为一家前景不明的初创公司工作,只为能在史密斯身边。“伯顿是我来到这里的原因,”普雷斯顿·布里格斯说,他是一位天才少年,负责了编译器的大部分开发工作。
史密斯的概念在1970年代首次引起关注,当时他是科罗拉多州奥罗拉的Denelcor公司的首席科学家。Denelcor花费了17年和大约5000万美元试图开创一种具有基本多线程版本的超级计算机。尽管Denelcor在1980年代初期售出了少量系统,但它从未实现盈利,并在1985年崩溃。
史密斯在华盛顿的超级计算研究中心舔舐自己的伤口,同时继续追寻他的梦想。到1987年,他觉得自己已经掌握了缺失的细节。因此,他与前Denelcor财务和发展副总裁詹姆斯·E·罗特索克合作,创立了Tera Computer,由罗特索克担任首席执行官。
然而,甚至一些史密斯的崇拜者也担心他的创意到达的时间太长。如果Tera在两年前按时交付,圣地亚哥超级计算中心的副主任韦恩·菲弗说,“这显然会是一个卓越的系统。”现在他说,“不清楚它将如何与竞争对手相比。”
Tera不仅设计了一款定制微处理器——在标准型号崭露头角的时候——而且它还使用砷化镓来制造它。这种物质的速度本质上至少比硅快五倍,但低生产量将使芯片成本更高。“你无法与市场抗争并获胜,”伊利诺伊大学国家超级计算应用中心的主任拉里·L·斯马尔说。斯马尔只购买使用标准芯片的计算机——主要来自硅图形公司和惠普公司。
事实上,标准芯片因其在性能价格上的巨大优势而席卷整个领域。“十五年前,一台Cray-1的价格为1800万美元,性能略低于今天的Pentium Pro,而成本仅为0.01%,”英特尔公司副总裁、前Cray经理爱德华·A·马西说。即使是世界上最大、最昂贵的计算机,一台价值1.1亿美元的庞然大物,将于1998年末交付给洛斯阿拉莫斯国家实验室,也将由微处理器驱动——确切地说是3072个。这些将是与SGI工作站相同的MIPS Technologies Inc.芯片。它们将共同输出超过3万亿次计算,或每秒3万亿次计算。
下一个高原。Tera希望能名副其实,至少争取为能源部建造一个teraflops系统的工作。但由于连一个原型都没有来支持其声明,它不得不放弃。不过,Tera预计很快将开始提供一个小型的16处理器系统,售价为1200万美元,然后再增加最多256处理器的大型系统。
史密斯相信,最终的回报将来自超级计算机向速度的下一个高原推进——petaflops,或每秒万亿次计算。这将需要一种根本新的方法,史密斯确信Tera的系统指明了方向。“Tera要么是旧品种的最后一代,要么是新种类的第一代,”超级计算机分析师加里·P·斯梅比(Gary P. Smaby)说,他是明尼阿波利斯Smaby Group Inc.的总裁。有一点是明确的:巴顿·史密斯和Tera值得关注。