光子计算初创企业 Lightmatter 已筹得 4 亿美元,旨在彻底打破现代数据中心的一个瓶颈。
人工智能的发展及其相应巨大的计算需求为数据中心行业注入了强大动力,但这并非只是再插入一千个 GPU 那么简单。正如高性能计算专家多年来所知道的那样,如果超级计算机的每个节点有一半时间处于闲置状态等待数据输入,那么每个节点的速度有多快都无关紧要。
互连层其实就是将一排排的 CPU 和 GPU 有效地转变为一台巨型机器的关键——所以,互连速度越快,数据中心的工作速度也就越快。而且看起来 Lightmatter 利用自 2018 年以来一直在开发的光子芯片,在很大程度上构建了最快的互连层。
“超大规模企业清楚,如果他们想要一台拥有一百万个节点的计算机,靠思科交换机是没办法实现的。一旦离开机架,就从高密度互连变成了基本上如同一根粗线上的一个杯子,”该公司首席执行官兼创始人尼克·哈里斯(Nick Harris)对 TechCrunch 表示。(您可以在此处看到他就此问题所做的简短演讲。)
他说,最先进的技术是 NVLink,尤其是 NVL72 平台,在 FP4 精度下,其浮点运算能力最高可达 1.4 艾(exa)级。但没有一点一个机架是孤立存在的,所有这些计算能力都得通过 7 太比特的“扩展”网络来实现。听起来很多,确实如此,但无法让这些单元彼此之间以及与其他机架实现更快速的联网,这是提高性能的主要障碍之一。
“对于一百万个 GPU 而言,需要多层交换机,这会增加巨大的延迟负担,”哈里斯说。“你得从电转换到光,再从光转换到电……你所使用的电量以及等待的时间都是巨大的。在更大的集群当中,情况会急剧地恶化。”
那么 Lightmatter 带来了啥?是光纤。大量的光纤,通过纯光接口来进行路由。每根光纤高达 1.6 太比特(采用多种颜色),每个芯片多达 256 根光纤……好吧,只能说 7 太比特的 72 个 GPU 听起来确实显得有一点过时了。
“光子学的发展速度远超人们的想象,”哈里斯说。“多年来人们一直努力想让它发挥作用,不过我们成功了,”他补充道。
Lightmatter 目前提供的光子互连速度为 30 太比特,而机架上的光布线 个 GPU 在其专门设计的机架中同步工作。如果你想知道,这两个数字不会按类似的比例增加,因为在一个拥有一千个 GPU 的集群中,很多需要和另一个机架联网的内容可以在机架内部完成。(而且,无论如何,100 太比特即将到来。)
哈里斯指出,这一个市场非常巨大,从微软到亚马逊,再到像 xAI 和 OpenAI 这样的新进入者,每个主要的数据中心公司对计算都有着无穷无尽的需求。“他们正在把大楼连接起来!我不晓得他们能坚持多久,”他说。
这些超大规模企业中有许多已经是客户,不过哈里斯不愿透露任何一家的名字。“不妨将 Lightmatter 视作一家代工厂,就像台积电那样”,他说。“我们不偏袒谁,也不会把自家名字和别人的品牌挂钩”。我们为他们提供路线图和平台——只是帮助把蛋糕做大。”
但他含蓄地补充道:“要是不借助这项技术,您的估值可没法翻四倍”,这或许是在暗指 OpenAI 最近一轮融资中对该公司 1570 亿美元的估值,但这句话也可能同样是在说他自己的公司。
这一轮 4 亿美元的 D 轮融资让公司的估值达到了 44 亿美元,是其2023 年年中估值的好几倍,“这让我们成为了迄今为止最大的光子学公司。所以,这可太棒啦!”哈里斯说。此轮融资由 T. Rowe Price Associates 领投,现有投资者富达管理研究公司和 GV 参与。
接下来会怎样?除了互联之外,该公司正在为芯片开发新的基板,以便它们能够执行更紧密的(打个比方)用光的联网任务。
哈里斯推测,除了互联之外,每个芯片的功率将是未来的主要区分因素。他说:“十年后,每一个人都会有晶圆级芯片——要提高每个芯片的性能,没有别的办法。” Cerebras 当然已经在为此努力,不过他们在现阶段的技术中能否获取这一进步的真正价值还是一个悬而未决的问题。
但对于哈里斯来说,看到芯片行业碰到了发展瓶颈,他计划准备好等待下一步。他说:“十年后,互联就是摩尔定律。”
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
OpenAI最强推理模型o3发布!AGI测试能力暴涨,最难数学测试分数碾压同行
“吃出蚯蚓”的袁记云饺店店长已被开除,记者实探:涉事门店营业正常,一外卖员单日接了8单
索尼在赌城巨型球会场MSG Sphere投放30周年巨型广告,宇宙机器人出镜
德甲-拜仁5-1莱比锡先赛7分领跑 拜仁3人传射建功2024年完美收官
61岁穆帅江郎才尽?2亿赢不了3000万,又批球员 耻辱1-1,4轮1胜
史无前例!14小时!狂抢1064轮,三亚诞生新地王,楼面价21191元/㎡