全文 —— 黄仁勋:首先,,,,你说得对,,,,人工智能原生云厂商不自研、不自设计芯片,,,,也无法将零星组件组装成人工智能工厂,,,,它们对首个 Token 上线时间的要求极高,,,,对架构兼容性的需求极高,,,,需要运行所有模子、效劳全球客户,,,,因此英伟达的架构对它们而言堪称完善。。。
我们提供所有组件,,,,纵然我们不提供,,,,欧博abg官网生态相助同伴也会提供,,,,所有组件完全整合、协同运行。。。全球险些所有人工智能开发商、人工智能原生首创企业、软件即效劳公司、企业、工业企业都可以从人工智能原生云厂商租赁算力。。。
欧博abg官网架构是全球最易租赁、性能最强、最易安排、总拥有本钱最优、最易融资的盘算平台,,,,这些特征完善契合人工智能原生企业的需求,,,,它们与大型企业相似,,,,因此归入第二板块。。。
这一板块在人工智能生态和超大规模营业生长之后才最先增添,,,,缘故原由许多:它们拥有优异的盘算机科学人才、精彩的数据中心能力,,,,且主要聚焦消耗级应用,,,,纵然保存小问题也不会造成严重效果,,,,只需提升效劳质量即可。。。

因此第二板块的生长慢于超大规模营业,,,,数据也能体现这一点。。;;迫恃篖PX 专为低延迟和高 Token 速率设计,,,,但其吞吐量较低,,,,模子容量有限,,,,上下文处置惩罚能力较弱,,,,例如在软件编码、智能体事情负载等需要处置惩罚大宗上下文的场景中体现缺乏。。。
因此其挑战很显着。。。我之前已经诠释过,,,,LPX 的应用场景并不普遍,,,,主要面向拥有大宗差别 Token 效劳组合的客户,,,,针对高 Token 速率的高端效劳,,,,客户数目未几,,,,但 Token 速率极高。。。
这与我此前的表述完全一致,,,,我仍维持这一判断。。。我预计 LPX 和其他基于流解码、专注高 Token 速率天生的加速器,,,,在未来一段时间内仍将是小众产品。。。
如你们所知,,,,Grace Blackwell和Vera Rubin支持人工智能的全生命周期,,,,从数据处置惩罚、训练准备、预训练、微调、强化学习一直到推理。。。
Grace Blackwell是全球完成所有这些使命的最佳平台。。。在某些情形下,,,,只要效劳提供商已拥有高 Token 速率效劳,,,,我们就可以搭配 LPX,,,,让其效劳体现更精彩。。。
第一板块是超大规模云厂商,,,,资笔僻出达万亿美元,,,,并将朝着 3-4 万亿美元的偏向增添。。。第二板块是所有人工智能原生云厂商,,,,它们遍布全球各地区,,,,有大宗首创企业提供支持;;尚有全球 25 万家企业,,,,其中许多企业必需或希望搭建自己的人工智能工厂;;众多工业企业必需将算力安排在现。。。,,无法依赖云端,,,,需要可靠、迅速、稳固的响应,,,,芯片工厂等场景不可能毗连云端效劳,,,,这完全不现实。。。
别的尚有主权人工智能云,,,,这一整个数据中心板块不适用半定制芯片,,,,由于这些数据中心需要直接购置并运行系统,,,,而非自行设计搭建。。。