公众号
关注微信公众号
移动端
创头条企服版APP

黄仁勋最新访谈实录:全程硬怼"恶意提问",力挺中国AI狠批美国出口管制

68
2026-06-02 11:28 抢发第一评

日前,黄仁勋接受了德瓦克什·帕特尔(Dwarkesh Patel )的深度访谈。后者是一位年仅 25 岁的印度裔美国播客,在硅谷享有盛名。

访谈中,黄仁勋一一回应了TPU 威胁、Anthropic 芯片选择、中国出口管制等尖锐问题,同时坦承自己对 Anthropic 投资失误的后悔。

640.jpg

以下为访谈全文实录——

德瓦克什·帕特尔:我们看到大批软件公司估值暴跌,原因是市场认为人工智能会让软件产品同质化。

人们有一种想法可能过于天真:英伟达向台积电发送GDS2文件,台积电制作逻辑芯片、开关组件,再搭配上SK海力士、美光、三星生产的高带宽内存完成封装,之后芯片被送往中国台湾的原始设计制造商进行整机机架组装。

本质上,英伟达负责软件设计,硬件制造全部外包。如果软件行业走向同质化,英伟达会不会也随之失去独特优势?

黄仁勋:归根结底,必须有技术实现电能到token 的转化。这种电能向 token 的转化,以及持续提升 token 价值的技术,很难完全实现同质化。

电能转化为 token 的技术链路极为复杂。提升 token 价值,就好比让一种分子比另一种分子更具价值,让一个 token 优于其他 token。

为实现这一点所投入的工艺、工程技术、科学研究与技术创新,我们如今正亲眼见证整个过程。其中涉及的转化技术、制造工艺、各类底层科学原理,人类至今尚未完全吃透,整个技术发展之路也远未走到终点。

我认为英伟达很难被同质化替代。

当然,我们会持续提升技术效率。你刚刚提出的问题,恰好就是我对公司发展的底层认知模型:输入端是电能,输出端是 token,英伟达处在中间环节。

我们的使命,是在完成这项转化的前提下,做到必要之事全力以赴,多余之事绝不插手,以此实现极致的算力能力。我所说的“尽量少做多余之事”,意思就是所有非核心业务,我们都寻找合作伙伴,纳入自身生态体系。

如今的英伟达,拥有全球规模最大的合作伙伴生态,覆盖上下游全供应链、各大计算机厂商、应用开发者与模型研发企业。

可以说人工智能产业是五层架构的蛋糕,我们的生态贯穿全部五层。我们坚持非核心业务不涉足,可即便如此,我们必须亲自攻克的核心技术,难度依旧超乎想象,这部分优势永远不会被同质化。

事实上,我认为企业级软件厂商、各类工具开发商也不会被同质化。如今大多数软件公司都属于工具开发商,一部分并非如此,属于工作流系统化平台。

比如Excel、演示文稿软件是工具,楷登电子、新思科技也主营工具开发。

我的看法和大众截然相反:未来智能体的数量会呈指数级增长,工具使用者的数量也会指数级暴涨,各类工具的使用规模势必会大幅激增。

未来新思科技(synopsys) 设计编译器的使用量会暴涨,同时使用布局规划工具、芯片版图工具、设计规则检测工具的智能体数量也会大幅增长。如今行业受工程师数量限制,未来这些工程师都会拥有大量人工智能智能体辅助工作。人类将会以前所未有的广度探索芯片设计领域,并且依旧沿用现有工具体系。

工具使用需求的爆发,会带动软件公司迎来高速增长。目前这一趋势尚未到来,原因是现有智能体使用工具的能力尚且不足。未来要么是软件厂商自主开发适配自身工具的智能体,要么是智能体技术成熟到可以熟练操作各类工具,我认为两种情况会同时发生。

德瓦克什·帕特尔:我注意到贵公司最新备案文件显示,你们与晶圆代工厂、存储芯片厂商、封装企业签订的采购协议规模接近1000亿美元。半导体分析机构SemiAnalysis测算,这类采购承诺总额将达到2500亿美元。有一种解读认为,英伟达的护城河,就是锁定了未来多年的稀缺零部件产能。其他企业即便能自研AI加速芯片,能拿到配套存储芯片吗?能拿到核心逻辑芯片产能吗?未来数年,这是否就是英伟达最核心的壁垒?

黄仁勋:这确实是我们独有的、其他企业难以复刻的优势之一。我们在上游产业链进行了巨额产能锁定,一部分是你提到的公开采购协议,还有大量隐性合作。

比如上游产业链企业的诸多产能扩建投资,都是基于我们的沟通。我会向各厂商首席执行官阐明行业未来规模、增长逻辑,和他们共同推演行业前景,展示我预判的行业发展趋势。
正是通过和各行业上游企业充分沟通、达成共识、协同发展,这些厂商才愿意大胆扩产。他们愿意为我们投资,却不轻易为其他企业扩产,原因很简单:他们确信我们有能力消化全部产能,并通过下游渠道完成产品变现。英伟达下游产业链体量庞大、市场需求充足,这是上游厂商敢于投资扩产的底气。
大家参加过英伟达GTC大会就会明白,这场展会的规模、参会阵容令人惊叹,是完整闭环的人工智能全产业盛会,全行业上下游齐聚于此。各方齐聚,本就需要相互对接。

我搭建这个平台,就是让下游企业看见上游产能,上游厂商看清下游需求,全行业共同见证人工智能技术进展。

更重要的是,行业原生AI企业、各类初创公司都汇聚于此,各方能直观看到我此前预判的所有行业趋势。我大部分精力,都在直接或间接向供应链、合作伙伴、整个生态普及行业机遇。

总有人说:“黄仁勋,你每场主题演讲全是接连不断的新品发布。”我们的演讲有很大篇幅更偏向行业科普,看起来略显枯燥,而这正是我刻意为之。我必须让上下游全产业链、整个生态体系都清晰知晓行业未来趋势、发展原因、到来时间、市场规模,让所有人都能用系统化的思维研判行业,和我的思考逻辑保持一致。

回到你所说的供应链护城河,我们具备布局未来的能力。若未来数年行业市场规模达到万亿美元级别,我们拥有匹配该规模的完整供应链。

企业发展不仅需要资金流,同样需要供应链流转效率、业务稳定性。若业务发展不稳定,没有厂商会为其专属架构搭建供应链。我们能维持庞大产业规模,核心正是下游海量稳定需求。上游厂商都看清了行业发展前景,这支撑我们实现当前乃至未来的产能规模。

德瓦克什·帕特尔:我想更具体地确认,上游产业链产能能否跟上发展速度。多年来贵公司营收连年翻倍,对外输出的算力浮点运算能力,每年增幅更是超过三倍。

黄仁勋:

如今在如此庞大的基数上还能实现营收翻倍,本身已经十分惊人。

德瓦克什·帕特尔:确实如此。但再看芯片逻辑制程,英伟达是台积电N3制程的最大客户,同时也是N2制程的核心大客户。据SemiAnalysis数据,今年人工智能产业将占据台积电N3制程60%的产能,明年占比将升至86%。既然你们已经占据绝大多数产能,要如何继续实现翻倍增长,并且连年保持增速?上游产能受限,是否意味着AI算力增速必然放缓?你认为有解决办法吗?长期来看,要如何实现晶圆厂产能连年翻倍?

黄仁勋:当下全球上下游产业链的瞬时需求,本身就超过整体供给。任何时刻,行业都可能遭遇各类资源短缺,比如实操技术工人短缺,这类情况真实存在。

德瓦克什·帕特尔:这些技术工人,明年GTC大会都该请来参会。

黄仁勋:这个提议很好。不过需求大于行业总供给,本身是良性行业状态,反之才是行业困境。一旦某类核心零部件供需缺口过大,全行业都会扎堆争抢产能。比如大家如今很少再热议CoWoS先进封装产能紧缺的问题。

原因很简单,过去两年我们疯狂抢占该产能,连续多次翻倍扩充用量。目前CoWoS产能供需已经趋于稳定。台积电如今也明确,CoWoS封装产能扩张速度,会和逻辑芯片、存储芯片产能增速保持同步。这是极好的转变,此前很长一段时间,CoWoS封装与高带宽内存都属于小众专用技术,如今已经成为主流算力基础设施。

如今我们对整个供应链的话语权范围也大幅提升。人工智能产业兴起之初,我五年前就预判到的诸多趋势,当时就已经对外讲过。当时部分企业选择相信并加大投资,比如美光的桑杰及其团队。

我至今记得那次会议,我清晰预判了行业走向、内在逻辑以及如今实现的各类成果,他们果断加大投入。我们与美光在低功耗内存、高带宽内存领域深度合作,他们持续扩产布局,如今收获巨大。其余企业后续陆续跟进,如今全部入局布局。

过往每一个供应链瓶颈,都会引发全行业关注。现在我们会提前数年预判瓶颈、提前布局解决。比如过去数年我们与 lumentum、coherent,以及 silicon photonics的深度合作,彻底重塑了相关供应链。我们围绕台积电搭建完整配套产业链,合作研发COUPE技术,自主攻克大量专利技术,并对外开放授权,保障生态开放共赢。

我们通过自研新技术、优化产业流程、新型检测设备(比如双面探针检测)、战略投资企业、助力厂商扩产等方式完善供应链。我们一直在主动构建生态,保障产业链产能足以支撑行业高速扩张。

德瓦克什·帕特尔:看起来不同环节的产能瓶颈,解决难度差异很大,比如CoWoS扩产对比其他环节……

黄仁勋:我先先说最难解决的瓶颈。

德瓦克什·帕特尔:是哪一个?

黄仁勋:技术工人,管道技工与电气工程师。这也让我对部分末日论者的观点十分不解,他们宣称人工智能会终结工作、消灭大量岗位。

如果大众都不愿成为软件工程师,未来我们终将面临软件工程师短缺。十年前就出现过同类荒谬言论,当时部分人鼓吹:“千万别当放射科医生”,网络上至今还能找到相关视频,声称放射科会是首个被AI取代的职业,未来不再需要放射科医师。可如今现实如何?全球正极度缺乏放射科医生。

德瓦克什·帕特尔:回到产能问题,部分环节可以扩产,部分环节难以突破。芯片逻辑芯片产能要如何实现连年翻倍?归根结底,存储与逻辑芯片都受极紫外光刻设备限制,要如何实现极紫外光刻机数量连年翻倍?

黄仁勋:这些产能全部都可以快速扩充,不存在绝对瓶颈,两到三年内就能完成大规模扩产。唯一需要的就是明确的市场需求信号。一旦验证一条产线可行,就能快速复制十条、百条、上百万条,这类产线技术极易规模化复刻。

德瓦克什·帕特尔:你们会向下游供应链延伸到哪一步?会不会直接找到阿斯麦,提出:“未来三年,英伟达年营收要达到2万亿美元,需要海量极紫外光刻机”?

黄仁勋:部分环节我们直接对接沟通,部分通过间接合作,还有部分只需说服台积电,阿斯麦自然会跟进扩产。我们只聚焦核心卡点环节。只要台积电确定扩产需求,未来数年极紫外光刻机产能完全充足。

我想强调的是,所有供应链瓶颈,持续时间都不会超过两三年。

与此同时,我们算力效率持续大幅提升,提升幅度达到十倍、二十倍;从 hopper 架构到 blackwell 架构,算力能效提升更是达到三十至五十倍。依托CUDA架构极强的灵活性,我们持续自研全新算法、优化技术,在扩充硬件产能的同时,不断提升算力使用效率。

这些问题我完全不担忧。真正需要关注的,是我们下游的产业环节,尤其是能源政策限制。发展新兴产业离不开能源,全新制造业产业崛起更是高度依赖能源。

我们希望美国实现产业回流,重振芯片制造、计算机整机制造、封装产业,布局新能源汽车、机器人、人工智能算力中心等全新产业。所有这些产业发展都依赖能源,而能源基础设施建设周期漫长。芯片产能扩充、CoWoS封装产能提升,都只需要两三年周期。

德瓦克什·帕特尔:很有意思。我过往采访的嘉宾,观点常常截然相反,而我本身缺乏相关技术知识,无法分辨对错。

黄仁勋:好在你现在对话的是该领域最专业的从业者。

德瓦克什·帕特尔:确实。我想聊聊竞争对手。目前全球排名前三的大模型,有两款(claude、gemini)均依托谷歌 tpu 完成训练。这对英伟达未来发展意味着什么?

黄仁勋:英伟达的技术路线和其完全不同。英伟达深耕加速计算,并非单纯的 tpu。加速计算应用场景极广:分子动力学、量子色动力学、数据处理、结构化与非结构化数据运算、流体力学、粒子物理,人工智能只是其中一个应用领域。

加速计算的场景包容性极强。如今人工智能是行业焦点、影响力巨大,但算力应用远不止于此。英伟达彻底重构了算力模式,从通用计算走向加速计算,市场覆盖范围远超所有专用 tpu、定制ASIC芯片。我们是全球唯一能够为全领域应用提供算力加速的企业,生态体系极其庞大,所有算法框架、各类算法均可在英伟达平台运行。

我们的硬件平台设计初衷就是开放通用,任何运营方都可采购使用。而大部分企业自研的专属算力芯片,封闭性极强,仅能自身内部调试使用,适配灵活性极差。正因平台开放通用,英伟达算力覆盖全球所有云厂商,包括谷歌云、亚马逊云、微软Azure、甲骨文云。

若是云厂商对外租赁算力,就需要覆盖多行业海量客户消化产能;若是企业自用算力,我们也能全程提供技术支持,就像我们为埃隆·马斯克的xAI提供服务一样。凭借适配全行业、全企业的算力支持能力,我们可以为礼来制药搭建科研超算中心,助力药物研发与生命科学研究,支撑全领域生物科研算力需求。

谷歌 tpu 无法覆盖的海量应用场景,均是英伟达的优势领域。CUDA架构不仅能实现极致 tpu 运算,还能覆盖数据处理、算力运算、人工智能全流程环节。我们的市场空间更广、布局更深。依托全场景适配能力,英伟达硬件落地全球各地,都有对应的市场需求,二者本质完全不同。

德瓦克什·帕特尔:我接下来的问题比较长。英伟达营收规模暴涨,并非依靠医药、量子计算领域,全部来自人工智能——这项发展速度史无前例的颠覆性技术。

那么核心问题:专门针对人工智能而言,何种算力硬件最优?我并非技术专业,但和AI科研人员交流得知:谷歌 tpu 采用大规模脉动阵列架构,极度适配矩阵乘法运算;而GPU灵活性更强,在分支运算、不规则内存访问场景优势显著。

但人工智能核心训练,本就是重复、规律化的海量矩阵乘法运算。tpu 无需为线程调度、线程与内存模块切换预留芯片面积,完全针对当前AI核心算力需求、营收增长场景做极致优化。你如何看待这一观点?

黄仁勋:矩阵运算只是人工智能的一部分,绝非全部。若要研发全新注意力机制、创新模型拆分方式、全新架构(比如混合状态空间模型),就需要可编程的通用算力架构。若要融合扩散模型与自回归模型技术,同样依赖通用可编程架构。英伟达平台可以运行所有前沿算法,这就是核心优势。架构可编程,更利于全新算法创新迭代。

人工智能技术飞速突破的核心动力,正是全新算法的持续涌现。和所有硬件一样,谷歌 tpu 同样受摩尔定律约束,目前算力每年仅提升25%左右。想要实现十倍、上百倍的算力跨越,只能依靠每年底层算法、计算方式的根本性革新。

这就是英伟达的核心优势。我们实现 hopper 到 Blackwell 架构五十倍能效提升,根源就在于此。

我最初宣布 blackwell 架构能效相较 hopper 提升35倍时,无人相信,后续行业分析文章测算实际提升达到五十倍。

单纯依靠摩尔定律,完全无法实现如此跨越式提升。我们依靠混合专家模型这类全新算法,实现算力并行化、分布式拆分、全系统分布式部署。没有CUDA底层自定义算子开发能力,根本无法实现这类技术突破。

英伟达的优势,是架构可编程性与全链路协同设计能力的结合。我们可以将部分计算任务下沉至互联总线(NVLink)、网络架构(Spectrum-X),同步优化处理器、硬件系统、互联总线、算法库、底层算法全环节。缺少CUDA体系,这一切优化都无从谈起。

德瓦克什·帕特尔:这就牵扯到英伟达客户结构的核心问题。贵公司60%营收来自全球五大云巨头。在早期,科研院校研究者这类客户,高度依赖CUDA架构,无法替换其他加速芯片,仅需基于CUDA运行PyTorch并完成优化即可。

但头部云厂商具备自研底层算子的技术与资金实力。为适配自身架构榨取最后5%的性能,他们必须自研算子。Anthropic、谷歌主要使用自研芯片 tpu、Trainium;即便是全部采用英伟达GPU的开放人工智能研究中心,也自研了Triton算子框架,脱离官方cuBLAS、NCCL库,基于CUDA C++搭建自主技术栈,甚至可适配其他硬件。既然核心大客户均能自研替代CUDA技术,CUDA究竟还能否支撑英伟达在前沿AI领域的绝对优势?

黄仁勋:CUDA的核心价值是完整丰富的生态。所有开发者开展技术研发,首选CUDA平台都是最明智的选择,生态完善、全框架兼容适配。

即便客户自研自定义算子,我们也深度参与技术优化,比如Triton框架底层大量核心技术均来自英伟达。

我们乐于助力所有算法框架实现技术升级。如今行业各类框架层出不穷:Triton、vLLM、SGLang,还有全新强化学习框架verl、NeMo RL,模型微调、强化学习领域技术正在爆发。无论选择何种架构研发,CUDA都是最优选择,生态优势无可替代。

依托成熟生态,开发过程中出现问题,基本可以确定是自身代码问题,而非底层平台框架漏洞。

AI系统开发涉及代码量极其庞大,开发者需要完全信任底层硬件平台。尽管我们平台仍存在少量漏洞,但整体技术体系经过长期打磨稳定可靠,开发者可安心基于底层架构二次开发。这是第一点:生态丰富度、可编程性、综合技术能力。

第二点,对于所有开发者而言,最重要的资源就是硬件装机保有量。

开发者都希望自研软件、模型可以在海量设备上运行,而非仅适配自有设备。框架开发者更是需要适配全行业算力集群。英伟达CUDA生态,是我们最宝贵的资产。

目前全球英伟达GPU装机量数以亿计,覆盖所有云厂商,从A10、A100、H100、H200,到L系列、P系列全型号硬件,形态、规格齐全。机器人领域开发者也希望CUDA技术直接部署于终端设备。英伟达算力布局无处不在。庞大装机量意味着,开发者自研的模型、软件可全球通用,价值无限放大。

第三,我们硬件覆盖全部云平台,这是独一无二的优势。AI企业、开发者无法确定长期合作的云厂商,而英伟达算力可部署于所有公有云、私有本地服务器。生态丰富度、全球装机规模、部署场景通用性三者结合,让CUDA具备不可替代的价值。

德瓦克什·帕特尔:逻辑十分通顺。我真正好奇的是,这些优势对你们核心大客户的价值究竟有多大。大量普通开发者十分依赖CUDA,但贡献营收的核心客户,大多具备自研完整技术栈的能力。尤其未来AI在闭环验证、强化学习场景持续突破,算子优化(注意力机制、多层感知机极致高效运算)具备极强可量化反馈。

各大云厂商是否都能自研全部核心算子?即便英伟达硬件性价比依旧领先,客户依旧优先选用。但未来行业竞争会不会沦为单纯参数比拼:同等成本下,谁的浮点算力、内存带宽更高?此前英伟达凭借CUDA护城河,占据AI软硬件领域70%以上超高毛利率。若核心客户均可自研替代技术,你们还能维持该毛利率吗?

黄仁勋:我们派驻大量工程师对接各大AI实验室,全程协助优化技术栈。

原因很简单:没有企业比我们更懂自身硬件架构。英伟达GPU、加速芯片并非像CPU那样通用。CPU如同豪华巡航轿车,运行平稳、易用性强,所有用户都能轻松操作;而英伟达加速芯片,堪比一级方程式赛车。

所有人都能低速运行,但若要压榨硬件极限性能,需要极强专业技术能力。我们依托AI技术自研底层算子,技术底蕴深厚。

我坚信行业长期依旧离不开英伟达。我们的技术支持,常常能帮助合作客户算力性能直接再翻倍。完成技术栈、专属算子优化后,模型运行速度提升2倍、3倍甚至50%都十分常见。对于客户庞大的 hopper 、Blackwell 算力集群而言,性能翻倍直接等同于营收翻倍,收益极为显著。

英伟达算力体系,是全球单位总拥有成本性能最优,没有之一。目前没有任何厂商硬件能在综合性价比上超越我们,所有公开测评数据均可验证。我们开源的InferenceMAX推理优化工具,所有厂商均可免费使用,但谷歌 tpu、亚马逊Trainium均未参与对标测评。

我欢迎所有厂商使用该工具公开自身推理成本数据,但至今无人应战。在MLPerf基准测试中,我也期待亚马逊验证其宣传的40%性能优势,期待谷歌公开 tpu 成本优势。从底层原理分析,这些宣传优势均不成立。

我们能保持行业领先,核心就是极致的综合性价比。

你提到60%营收来自五大云厂商,但这些算力绝大多数并非云厂商自用,而是服务外部客户。亚马逊云上绝大多数英伟达算力面向外部客户,微软Azure、甲骨文云全部英伟达硬件均对外服务。云厂商青睐英伟达,正是因为我们覆盖全球海量客户,所有客户均基于英伟达平台搭建业务。而全球企业均选择英伟达,根源就是我们覆盖面广、适配性强。

这就是正向飞轮效应:全球庞大硬件装机量、架构可编程性、丰富生态、海量AI企业入局。如今全球AI初创企业数以万计,对于初创企业而言,必然选择市场保有量最高、生态最完善的硬件架构,而英伟达三者全部占优。

除此之外,我们硬件单位功耗算力全球顶尖。合作客户搭建吉瓦级算力数据中心,必然追求功耗约束下算力最大化、数据令牌产出最大化,直接关联营收。英伟达是全球单位功耗令牌产出最高的硬件架构。若客户对外租赁算力,我们依托全球海量客户资源,优势进一步放大,飞轮持续正向循环。

德瓦克什·帕特尔:很有意思。核心问题还是市场格局。即便存在其他硬件厂商,本可以出现数万AI企业均分算力市场的局面。但如今算力基本集中在五大云厂商手中,而亚马逊云上的算力使用者,大多是安特罗皮克、开放人工智能研究中心这类头部大模型企业,这些企业本身就有能力自研、适配其他加速芯片。

黄仁勋:不,你的前提本身就是错误的。

德瓦克什·帕特尔:或许吧。我换一个问题。

黄仁勋:你说完问题,我再纠正你的认知误区,这个问题对人工智能、科学发展、行业未来都至关重要。

德瓦克什·帕特尔:好,我换个角度提问。

黄仁勋:你尽管提问,我依旧会纠正你错误的前提,这件事十分关键。

德瓦克什·帕特尔:我先完整提问。结合此前性价比、能效比所有优势均成立的前提,为何 anthropic 日前宣布,与博通、谷歌达成吉瓦级算力合作,大规模采购谷歌 tpu 作为自身核心算力?

谷歌内部更是以 tpu 为绝对主力。曾经头部企业全部采用英伟达算力,如今份额逐步分流。纸面数据英伟达全方位占优,企业却转向其他硬件,原因是什么?

黄仁勋:anthropic 属于个例,并非行业趋势。抛开这家企业,谷歌 tpu 几乎没有新增市场需求,其增量100%来自 anthropic;亚马逊Trainium增量同样全部依靠 anthropic。行业内定制ASIC芯片机会极少,仅此一家特例。

德瓦克什·帕特尔:但 OpenAI 与 AMD 达成合作,还自研了 titan 加速芯片。

黄仁勋:确实存在这类合作,但其绝大部分算力依旧采用英伟达硬件,双方依旧有大量深度合作。其他企业选用别家硬件、开展技术尝试,我完全不介意。不对比,如何知晓英伟达技术优势?行业也需要通过对比认清差距。我们必须持续精进,稳固自身行业地位。

行业各类自研定制芯片项目层出不穷,中途终止的项目同样数不胜数。想要自研芯片超越英伟达,难度极大,几乎不具备可行性。除非英伟达出现重大技术路线失误。依托规模优势、技术迭代速度,我们是全球唯一每年实现算力技术跨越式突破的企业。

德瓦克什·帕特尔:他们的思路大概是:芯片性能不必超越英伟达,只要不比英伟达差超过30%即可,毕竟英伟达整体毛利率高达70%。

黄仁勋:你忽略了一点,定制ASIC芯片厂商毛利率同样极高。英伟达毛利率70%,这类厂商毛利率也能达到65%,客户实际成本节省幅度极小。

德瓦克什·帕特尔:你是指博通这类厂商?

黄仁勋:没错。客户依旧需要向上游厂商支付高额溢价,从行业现状来看,定制芯片厂商利润空间依旧丰厚,厂商自身也十分满意该盈利水平。

回到你最初的问题。早期我们没有能力满足这类企业的巨额算力投资需求。当时我并未意识到, OpenAI 、anthropic 这类顶级大模型实验室,发展需要上游硬件厂商巨额战略投资,风投资本无法支撑其体量。彼时我们资金体量无法向 anthropic 投入数十亿美元资金,换取其优先选用英伟达算力。而谷歌、亚马逊具备该实力,早期大额投资绑定了它们的算力需求。

这是我的决策疏漏。当时我并未认清,顶级大模型发展无法依靠常规风投融资,风投资本不会为单家AI实验室投入百亿美元级资金。即便当时我认清现状,受限于公司规模,依旧无力完成这类投资,但我绝不会再犯同类错误。

如今我十分乐意投资 openai,助力其规模扩张,我认为这是必须布局的战略。后续 anthropic 寻求合作时,在我们资金体量充足后,我同样果断投资、深化合作。早年只是受限于企业规模无法布局,若时光倒流、彼时英伟达具备如今体量,我必然会提前完成全部布局。

德瓦克什·帕特尔:这个问题很有意思。多年来英伟达是人工智能领域盈利最高的企业,且利润持续暴涨,如今大量资金用于战略投资。公开信息显示,英伟达向 openai 投资规模达300亿美元,向 anthropic 投资100亿美元。如今两家企业估值大幅上涨,且未来仍有升值空间。

多年来你们持续输出算力,早已预判行业发展前景,这些企业如今估值相较数年、甚至一年前翻涨数倍,而英伟达本身资金储备充足。从理论上来说,英伟达完全可以自建顶级大模型实验室,或是更早以当前估值完成大额投资。我很好奇,为何没有更早布局?

黄仁勋:我们在能力范围内,第一时间就完成了布局。但凡更早具备条件,我一定会提前投资。anthropic 需要投资的阶段,我们当时完全不具备资金与战略条件,从未有过大规模对外股权投资的规划,也并未意识到该布局的必要性。

我此前一直认为,这类科技企业和普通公司一样,依靠风投融资即可。如今才明白,顶级大模型实验室的发展体量,根本无法依靠风投支撑。 OpenAI anthropic 均是如此。

这正是这些企业的远见之处,他们很早就认清了这一点。我十分欣慰企业能顺利发展,即便早期 anthropic 只能选择其他厂商算力合作,我依旧乐见其成。这类顶尖企业的存在,对全球行业发展都有益处。

德瓦克什·帕特尔:即便如此,英伟达季度营收利润依旧持续暴涨。

黄仁勋:即便如此,依旧会留有遗憾。

德瓦克什·帕特尔:回到核心问题:如今英伟达现金流充裕、利润持续增长,巨额资金该如何规划使用?目前行业已经诞生大量中间服务商,为AI实验室实现资本开支转经营性租赁,提供算力租赁服务。AI芯片造价高昂,但模型价值持续提升、芯片全生命周期收益极高,前期部署成本高、长期盈利空间大。英伟达本身完全具备承担资本开支的实力,公开信息显示,你们为核心编织云厂商CoreWeave提供最高630亿美元资金兜底,且直接投资20亿美元。

既然资金充足,英伟达为何不自建云平台,转型为顶级云厂商,自主开展算力租赁业务?

黄仁勋:这源于公司长期坚守的经营理念,且我认为该理念十分合理:必要之事全力以赴,多余之事绝不插手。

这句话的含义:英伟达算力平台相关核心业务,若我们不去攻克,全球没有任何企业能够完成。无论是NVLink互联技术、完整软硬件技术栈、生态体系搭建、长达二十年持续亏损深耕CUDA技术,这些布局除我们之外,无企业愿意承担。

我们自研全套CUDA-X领域专用算法库,布局光线追踪、图像生成、早期人工智能、数据处理、结构化数据、向量数据运算领域。

十五年前我们就坚定布局领域库,因为我深知,若我们不研发,全球无企业涉足。包括计算光刻技术库cuLitho,若非英伟达自研,至今不会诞生。没有我们的深耕,加速计算不可能发展至今。这些核心使命,我们必须全力完成。

但全球公有云业务,即便英伟达不涉足,依旧有大量企业布局。结合公司经营准则,所有战略决策均围绕“核心必做、非核心不做”展开。

以新兴AI专属云厂商为例,若我们不扶持CoreWeave,这类新型云厂商、AI专属云平台根本无法诞生;不助力CoreWeave发展,其无法成长;不扶持Nscale、Nebius,两家企业也无法达到如今规模。如今这些企业均发展势头极佳。

我们坚持聚焦核心、精简业务模式,通过战略投资扶持生态伙伴成长。我的愿景是,英伟达硬件架构、人工智能技术赋能全球各行各业、各个国家,助力全球依托美国技术体系搭建人工智能产业。这就是我们始终坚守的发展方向。

另外,全球顶尖大模型企业数量众多,我们坚持全面投资、不刻意挑选行业赢家。这既是企业发展布局,也是经营原则。我们不赌单一企业,均衡扶持全行业优质初创企业。

德瓦克什·帕特尔:为何刻意不挑选单一行业赢家重仓?

黄仁勋:第一,这本就不是英伟达的业务范畴。第二,回顾企业发展历史,英伟达早期涉足3D图形领域时,全球有60家同类图形芯片企业,最终仅英伟达存活。

在当时,几乎所有人都不看好英伟达。我们早期图形架构路线完全错误,并非小幅偏差,架构设计不符合行业需求,开发者适配难度极高,理论上毫无存活可能。我们基于严谨底层原理推演,最终却得出错误技术方案,所有外界机构都会判定我们出局。但我们坚持调整,存活至今。

这段经历让我始终保持谦逊,绝不随意判定企业成败。要么让所有企业自主发展,要么均衡扶持全部优质企业,绝不单独押注。

德瓦克什·帕特尔:我有一点无法理解。你一方面表示并非刻意扶持新兴云厂商,只是顺应合作;一方面又坦言,CoreWeave等企业离开英伟达扶持无法存活。两种观点如何统一?

黄仁勋:首先,这些企业自身具备发展意愿、商业规划、专业能力与行业热情,本身拥有核心技术实力。仅依靠自身无法完成起步阶段资金与产能落地,我们仅在初创阶段提供必要投资支持,助力其自身商业飞轮运转。

你想问的核心是:英伟达是否要转型专业投资机构?答案是否定的。全球专业投资机构众多,我们更愿意与各类投资方合作,而非自身涉足投资业务。我们坚守主业,精简商业模式,全力扶持生态伙伴。

诸如 OpenAI ,尚未上市且需要数百亿美元级投资,我们坚定布局,源于企业长期价值、行业不可或缺的地位。这类企业发展前景广阔,全球行业需要其存在,我们理应助力规模扩张。这类必要投资我们会完成,但依旧坚守尽可能少做非核心业务的原则。

德瓦克什·帕特尔:有一个显而易见的问题。全球GPU长期供不应求,且随着大模型迭代,缺口持续扩大。外界普遍认为,英伟达芯片配额分配并非价高者得,而是刻意倾斜份额给各类新兴云厂商,比如 Crusoe、Lambda、CoreWeave。这对英伟达有何益处?你是否认可外界所说的“人为割裂市场”?

黄仁勋:完全不认可,你的前提依旧错误。我们配额分配具备严谨规则。

首先,所有合作均以正式采购订单为依据,口头需求不产生任何配额倾斜。芯片、数据中心建设周期极长,我们首要工作是协同所有合作方做好需求预测,实现供需精准匹配。

其次,即便前期完成需求预估,最终依旧以企业正式下单为准。

部分客户因自身数据中心未完工、零部件不到位无法收货,我们会优先满足已具备上机条件的客户,最大化自身工厂产能利用率,仅据此微调配额。除此之外,所有配额严格遵循先到先得原则,无额外倾斜。

网络诸多传言均为不实信息,比如流传的拉里·埃里森、埃隆·马斯克与我会面索要GPU的消息完全虚假。

我们确实共同用餐,交流十分愉快,但二人从未索要芯片配额,只需正常提交采购订单,我们便会尽全力保障产能。我们合作规则公开透明。

德瓦克什·帕特尔:也就是说配额遵循排队顺序,依据下单时间、数据中心完工进度分配,并非出价最高者优先。为何不直接采用价高者得的分配方式?

黄仁勋:我们从不采用该模式,这并非健康的商业经营模式。

我们统一固定定价,客户自主决定采购量即可。行业其他芯片厂商会随需求涨价,我们始终坚守定价稳定,从不随行就市调价。合作方可以完全信任我们,我立志成为行业底层基础设施,定价稳定、履约可靠,报价一经确定始终不变,即便市场需求暴涨也不调价。

德瓦克什·帕特尔:这也是你们与台积电长期稳固合作的原因吧?

黄仁勋:没错,英伟达与台积电合作即将满三十年。双方甚至无刚性法律合约,全靠长期默契合作。偶尔我方获利更多,偶尔对方让利更多,整体合作极为互信,彼此完全依托、相互信赖。

合作伙伴可以始终信赖英伟达:今年Vera Rubin架构产品性能强劲,明年推出Vera Rubin超极版,后年推出Feynman架构,逐年迭代新品。全球没有任何一家定制芯片厂商,能让客户笃定长期稳定供货、每年芯片令牌成本大幅下降,像时钟一样稳定可预期。

我对台积电同样有这份信心。无论采购量大小,一台芯片、十亿美元订单,全部按流程规划履约。如今全球仅有英伟达能做到全体量订单承接,无论单卡、单机架、千万美元、千亿美元算力采购需求,全部均可满足。

英伟达用数十年沉淀,成为全球人工智能产业底层基础设施。依靠长期坚守、全身心投入技术深耕,企业发展始终稳定连贯,这是核心优势。

德瓦克什·帕特尔:接下来聊聊中国相关话题。我自身暂无明确立场,习惯以反方视角与嘉宾探讨观点。此前支持出口管制的达里奥做客访谈时,我反问过:为何中美不能各自拥有顶尖算力数据中心?如今你立场相反,我以反向角度提问。

anthropic 日前发布Mythos Preview.,该模型暂不公开发布,原因是其具备极强网络攻击能力,企业认为全球尚未做好防护,需先修补全部系统零日漏洞。该模型检测出全球各大操作系统、浏览器海量高危漏洞,甚至在以安全性著称、几乎无漏洞的OpenBSD系统中,发现一个存在长达27年的安全漏洞。

由此引发疑问:若中国企业、科研机构、官方获得高端AI芯片,训练同级别具备网络攻击能力的大模型,并大规模部署运行,是否会威胁美国企业安全、美国国家安全?

黄仁勋:首先, anthropic 训练该模型所用算力规模、硬件等级,在中国境内完全能够实现。首先要明确一个事实:中国本身拥有大量芯片产能。

中国占据全球60%以上成熟制程芯片产能,本土半导体产业规模庞大,且拥有全球顶尖计算机科研人才。

全球过半AI科研人员均为华裔,大量顶尖实验室核心研究者均来自中国。中国能源储备充足、芯片存量充足、科研人才充足。

基于现有全部资源,想要判断如何构建安全全球环境,单纯遏制、对立、将其塑造为竞争对手,绝非最优解。

中美存在技术竞争关系,我们必然希望美国保持领先地位,但我认为双方需要保持学术沟通、科研交流。当前对立态势,导致两国AI科研界交流完全断层,这一问题极为严重。中美AI研究者必须开展技术对话,共同划定人工智能禁用危险应用场景,达成技术安全共识。

至于AI挖掘软件漏洞,本就是人工智能正向应用价值。AI本就用于检测系统缺陷,全球软硬件本身存在海量漏洞,包括AI自身框架漏洞。AI技术能够大幅提升系统安全运维效率,我十分认可该技术价值。

目前行业忽视了一点:网络安全、AI安全、数据隐私安全领域生态正在快速崛起。大量AI初创企业布局安全防护技术,未来会形成“核心强能力智能体+海量安全防护智能体”的体系,全方位约束高危AI应用,该未来必然实现。

任由强能力AI智能体无监管自主运行,本身极不现实。安全防护生态发展至关重要,且该生态依赖开源技术、开源模型、开源技术栈,全球科研人员均可基于开源体系搭建安全防护系统。大量开源技术成果源自中国,我们不应遏制该领域发展。

我们自然希望美国占据全球最大算力规模,目前美国能源确实存在约束,但大量企业正攻坚能源解决方案。

更重要的是,我不希望全球形成两套割裂技术生态:开源体系仅适配他国硬件,闭源体系仅适配美国硬件。该局面对于美国而言,是最坏结果。我们需要全球所有AI开发者,均基于美国技术栈开发,所有开源技术突破、行业成果反哺美国生态。

德瓦克什·帕特尔:我梳理一下你的观点。外界担忧核心算力差距:受高端制程设备出口管制影响,中国仅具备7nm芯片产能,无高端极紫外光刻设备,现有总算力仅为美国十分之一。

基于此,中国未来确实能训练出同级别模型,但美国实验室凭借算力优势,能够率先实现技术突破。就像 anthropic 率先研发出高危能力模型后,优先向美国企业开放、完成全行业漏洞修补,之后再对外公开。

除此之外,模型大规模部署推理算力同样至关重要。网络攻击型模型部署规模越大,危害越强,推理算力价值极高。美国顶尖实验室发展瓶颈正是算力,而中国大量顶尖AI科研人才能力极强,算力恰好是放大其技术能力的核心要素。

因此疑问在于:既然美国算力领先,率先掌握高危模型技术、完成本国防护准备,本就占据优势;若中国算力受限、突破速度更慢,难道不是更符合美国安全利益?

黄仁勋:我们理应始终保持领先、拥有更多算力,这一点毋庸置疑。但你该观点的前提过于极端,认为中国必须完全无算力才安全。可中国本身算力规模极其庞大,是全球第二大算力市场,完全具备大规模算力聚合能力。

德瓦克什·帕特尔:但多方测算显示,中芯国际制程工艺严重落后。

黄仁勋:我接下来详细说明。中国能源储备极为充足,而人工智能本就是并行算力场景。为何不能通过堆叠海量芯片补足制程差距?中国拥有大量闲置满配数据中心,如同闲置空城一般,存在大量空闲算力基础设施。即便仅采用7nm芯片,大规模堆叠整合,算力总量依旧十分可观。

中国成熟芯片制造产能全球顶尖,垄断全球大量通用芯片产能,自身产能严重过剩。因此“中国无法获得AI算力芯片”本身就是谬论。

当然你会反问:难道全球无任何算力、仅美国拥有算力才最优?现实本就不存在该场景,中国现有算力早已突破你担忧的安全风险阈值。

人工智能产业分为五层架构,底层基础是能源。充足能源可以弥补芯片制程差距,充足芯片也能弥补能源不足。美国目前能源紧张,因此英伟达必须持续优化架构、全链路协同设计,以有限芯片、有限能源实现极致单位功耗算力。

若能源供给充足甚至近乎免费,便无需极致追求能效比,老旧制程芯片完全可用。7nm芯片性能对标霍珀架构,如今主流大模型均基于霍珀架构训练,7nm芯片完全能够满足基础训练需求。充足能源就是中国核心算力优势。

德瓦克什·帕特尔:可中国高端芯片自主制造产能依旧不足。

黄仁勋:实际产能完全充足。证据十分明显:华为全年出货量创下企业历史新高。

德瓦克什·帕特尔:出货芯片数量有多少?

黄仁勋:数量极大,达数百万片,远超 anthropic 所用芯片总量。

德瓦克什·帕特尔:争议点在于中芯国际逻辑芯片产能、高端存储芯片产能,尤其是高带宽内存产能。

黄仁勋:我明确告诉你,中国逻辑芯片、HBM2产能均十分充足。

德瓦克什·帕特尔:但模型训练、推理的核心瓶颈是内存带宽,第二代高带宽内存对比英伟达最新产品,带宽差距接近一个数量级,影响极大。

黄仁勋:华为本身是网络通信巨头。

德瓦克什·帕特尔:但 HBM2 制造依旧依赖极紫外光刻设备。

黄仁勋:该观点完全错误。完全可以借鉴英伟达NVL72方案,多芯片互联堆叠补足性能差距。中国企业早已实现硅光互联技术,可将海量分散算力整合为巨型超算中心。你的前提认知本身有误。

当下中国人工智能技术发展十分顺利。顶尖AI科研人才即便受算力限制,也能研发出极致高效算法。此前我提及摩尔定律年增速仅25%,而顶尖计算机算法优化可实现十倍性能提升。技术突破核心杠杆,本就是算法科研。

混合专家模型、各类创新注意力机制,均可大幅降低算力消耗。必须认清:人工智能绝大多数突破源自算法创新,而非单纯硬件算力。全球过半AI科研人才均在中国,这本身就是其核心优势。 deepseek 模型技术突破意义重大,若中国本土硬件率先适配国产前沿大模型,对美国极为不利。

德瓦克什·帕特尔:为何不利?如今开源模型可适配所有硬件平台,未来为何会改变?

黄仁勋:即便模型开源,若深度适配本土专属硬件架构,会导致美国硬件丧失适配优势。你此前认为模型优先适配美国技术栈是利好,我完全认同;反之,全球模型优先适配非美国硬件,便是美国核心劣势。

德瓦克什·帕特尔:但美国实验室模型可跨云、跨硬件通用适配,几乎无平台绑定。

黄仁勋:我就是最直接的例证。专为英伟达优化的模型,迁移至其他硬件运行性能均会下降。

英伟达的行业地位就是最好证明:全球模型均基于我们技术栈研发、最优运行于我们硬件,道理显而易见。

anthropic 模型可适配GPU、特宁芯片、tpu,但迁移适配需要海量工程优化工作。放眼全球广大发展中国家,原生开箱最优适配他国硬件,对于美国绝非利好。

德瓦克什·帕特尔:我依旧无法理解逻辑。假设中国率先研发出同级别高危安全模型,即便基于英伟达硬件运行、对外输出至全球,又如何损害美国利益?

黄仁勋:自然存在损害。我们理应阻止该局面发生。

德瓦克什·帕特尔:你此前认为芯片算力完全可替代,我方不供货,华为本土芯片会直接填补缺口。但华为芯片性能仅为英伟达产品三分之一至二分之一,差距显著。

黄仁勋:现实证据已经摆在眼前:中国本土芯片产业规模极其庞大。

德瓦克什·帕特尔:对比H200与华为昇腾910C,浮点算力、内存带宽差距极大。

黄仁勋:他们可以靠海量堆叠芯片补足性能差距。

德瓦克什·帕特尔:你的观点存在矛盾:一方面称中国能源富余、产能充足,可大规模填补算力缺口;一方面又认为我们对华出口芯片,依旧能稳固美国长期优势。

黄仁勋:二者完全不矛盾,逻辑十分通顺。无更优选择时,便会选用现有唯一方案,这怎么会不合理?中国采购英伟达芯片,正是因为产品更优。性能更优意味着算力更强,更强算力可训练更优模型。

但我们依旧能从中获益:全球开发者持续依托美国技术栈研发,所有模型技术成果适配美国硬件,美国技术持续全球扩散、保持主导地位。这本身就是正向价值,是美国技术领导力的核心根基。

你此前提及的行业政策,曾导致美国通信产业彻底丧失全球市场,如今全球通信领域美国丧失主导权,该短视政策后果显著,弊端早已显现,你至今难以理解其中隐患。

德瓦克什·帕特尔:我们回归核心:存在潜在收益,也存在潜在安全风险,核心判断收益是否覆盖风险。我希望你正视潜在风险:算力是大模型训练基础,强模型具备网络攻击高危能力。美国率先掌握该技术、完成本国系统防护、漏洞修补,再对外开放模型,本就是安全优势。

若中国凭借更多算力提前突破、大规模部署高危模型,会造成巨大安全隐患。而美国现有算力优势,根源正是英伟达本土技术领先。对华出口芯片,本质就是牺牲该安全优势。

黄仁勋:我同样向你阐明另一方巨大潜在风险:若遏制对华贸易,美国将放弃全球第二大芯片市场,直接助力中国搭建本土完整技术生态,未来全球大模型全部适配中国硬件架构。

随着AI技术全球普及,其技术标准、底层架构将会反超美国体系。

德瓦克什·帕特尔:我始终相信英伟达工程师、CUDA技术实力,即便对方短期开源模型领先,也难以形成长期技术绑定。

黄仁勋:人工智能技术远不止底层算子优化。模型蒸馏、架构适配均可实现硬件优化,但生态长期格局依旧关键。

目前客观事实:中国是全球开源软件、开源大模型第一大贡献主体。而如今全部开源成果,均基于美国英伟达技术栈。

人工智能五层技术架构全部至关重要,美国需要在每一层均保持领先,尤其是直接落地应用层,该层从产业革命中获益最多。但每一层都需要均衡发展,不可偏废。

若大众过度渲染AI危险性,将其等同于核武器,引发全行业恐慌、抵触技术发展,完全不利于美国长远利益。若民众因担忧AI替代岗位,抵触软件工程师行业,未来本土人才断层,损害国家发展。

此前放射科医生行业恐慌便是前车之鉴。大众混淆职业与工作任务:放射科医生核心工作是患者诊疗,影像阅片只是单一任务。盲目恐慌导致专业人才断层,直接影响医疗服务质量。

你全程观点均走极端,非零即全,认为少量算力输出便会全盘失利,该思维并不客观。我们必然追求美国全球领先、全技术架构主导地位,这一点坚定不移。但领先不代表封闭排他,无需极端封锁。

多年后美国若想要技术、标准、产品向亚非拉、中东、东南亚全球出口,今日激进封锁政策,会直接导致届时美国丧失庞大海外市场,无理由主动放弃全球市场份额。

无人主张无限制全部对华出口,我们依旧保障本土优先供给、最高端技术本土独占、产能优先满足美国需求。同时保持全球市场竞争布局,兼顾安全与海外市场,需要理性权衡、成熟决策,而非绝对化极端封锁。

德瓦克什·帕特尔:核心争议点:美国制程技术持续迭代,从3nm迈向1.6nm费曼架构,而中国长期停留在7nm制程。中国本土能源充足,可大规模堆叠7nm芯片补足算力,且自主芯片对外出口参与全球竞争。

届时其芯片性能落后,但模型深度适配本土硬件,全球厂商选用其硬件运行模型,体验甚至优于英伟达先进制程硬件。

黄仁勋:我们先以客观数据反驳: Blackwell 对比 hopper 架构,光刻制程提升幅度极小,仅75%,三年制程进步有限。外界夸大制程作用, Blackwell 五十倍能效提升,根本不是来自制程工艺,而是架构设计、计算机算法优化。

摩尔定律作用持续减弱,架构创新、计算机科学价值远超单纯物理制程进步。英伟达CUDA体系价值,正是全链路算力架构优势,灵活适配混合专家模型、扩散模型、分布式架构所有前沿技术。

人工智能发展,上层算法软件与底层硬件架构同等重要。全球开发者依旧首选CUDA开发,中国科研人员同样如此。

若强制全面退出中国市场,属于重大战略失误。该政策已经产生负面后果:加速中国本土芯片产业发展,倒逼其搭建自主封闭生态。目前补救尚且不晚,但损害已经形成。

你认为中国会永久停留在7nm制程,观点错误。中国制造业实力强劲,制程工艺必然持续向上突破。5nm与7nm性能差距极小,架构优化、网络互联、能源利用率的价值,远大于微小制程差距。英伟达收购Mellanox,正是看重互联技术的核心价值。整体产业并非你简化的单纯制程比拼。

德瓦克什·帕特尔:中国话题到此结束,刚好引出新问题。此前我们聊到台积电产能、存储芯片各类瓶颈,英伟达已经占据台积电N3制程绝大多数产能,未来也将占据N2制程主要份额。

你是否考虑复用老旧制程(N7)富余产能,基于现有全部技术优化经验、数值运算改进,复刻升级版 hopper 、 ampper 架构芯片?领先制程产能无法满足需求,依托成熟制程扩产补足,该布局会在2030年前实现吗?

黄仁勋:完全没有必要。每一代架构升级,优势都不止是晶体管制程缩小,还包含工程优化、封装堆叠、数值计算、系统架构全方位革新。

若前沿产能不足,回头重启老旧制程架构,需要投入巨额研发成本,全行业无企业能够承担。我们资金全部投向前沿技术迭代,无力回溯老旧架构重做。仅做极端假设:若全球未来永久无新增先进制程产能,我会毫不犹豫重启7nm制程扩产。

德瓦克什·帕特尔:有人提出疑问:英伟达资金、人才储备充足,为何不同步并行研发多款完全差异化架构?比如Cerebras芯片、特斯拉Dojo巨型封装架构、非CUDA纯定制架构,多路线布局分散风险,毕竟人工智能未来技术路线、硬件架构走向未知。

黄仁勋:我们完全有能力研发全部架构,但所有方案内部仿真验证均性能劣于现有路线,因此不会布局。我们仅深耕验证后的最优技术路线。仅当未来行业算力场景发生根本性变革,并非算法小幅迭代,而是市场需求整体改变时,我们才会新增其他加速芯片产品线。

近期我们收购格 grok,并且将其技术全部融入CUDA生态。原因是当前数据 token 商业价值大幅提升,客户需求分层明显。

仅数年之前, token 使用成本极低甚至免费,如今不同行业客户需求差异显著。比如软件开发者对算力响应速度要求极高,极致低时延能大幅提升工作效率,客户愿意为此支付高价。

该细分市场近期才成型。未来同一模型可按响应速度划分服务层级,此前行业始终追求算力吞吐量最大化,如今出现高溢价低时延推理需求:即便单芯片吞吐量下降,高服务溢价足以覆盖损失。这就是我们拓展技术边界、布局细分架构的原因。除此之外,所有资金依旧全部深耕英伟达自有核心架构。

德瓦克什·帕特尔:高端高溢价算力服务、推理市场细分拆分,这个方向确实极具潜力。

黄仁勋:本质是算力市场分层化。

德瓦克什·帕特尔:好,最后一个问题。假设深度学习技术革命从未发生,英伟达如今会发展成什么样?除了游戏业务之外。

黄仁勋:我们依旧深耕加速计算,和如今核心主业完全一致。公司成立底层逻辑本就如此:摩尔定律后劲不足,通用CPU无法满足大量专业算力场景需求。

我们将GPU架构、CUDA技术与CPU结合,实现通用处理器算力卸载,各类算法、代码算子迁移至GPU加速,实现应用百倍、两百倍性能提升。应用场景覆盖工程科研、物理学、数据处理、图形图像、生成计算等全部领域。即便没有人工智能,英伟达规模依旧会极为庞大。

底层原理十分简单:通用计算性能增长已经触及瓶颈,唯一破局路径就是领域专用算力加速。我们最初从图形计算切入,后续拓展海量其他领域:粒子物理、流体力学、结构化数据处理、各类适配CUDA算法场景。

公司初心始终是:将加速计算普及全球,突破通用计算能力边界,赋能前沿科学领域突破。早期落地场景包括分子动力学、能源勘探地震数据处理、图像运算等,通用CPU效率无法胜任的场景,均是我们的领域。

即便没有人工智能,我固然会感到遗憾,但英伟达发展根基不受影响。我们的技术普及了深度学习,让全球科研人员、学生、普通研究者,仅凭个人电脑、消费级显卡就能开展前沿科学研究,这一核心使命从未改变。

观看GTC大会便能发现,开场大量技术发布均与人工智能无关:计算光刻、量子化学、数据处理技术,全部独立于AI领域,且价值重大。大众目光全部聚焦人工智能,但英伟达在非AI领域依旧有大量核心技术突破。tpu 并非唯一算力形态,我们致力于赋能所有领域计算需求。

德瓦克什·帕特尔:黄仁勋,非常感谢。

黄仁勋:不客气,本次交流十分愉快。

德瓦克什·帕特尔:我也受益匪浅。

声明:该文章版权归原作者所有,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本网联系。
您阅读这篇文章花了0
转发这篇文章只需要1秒钟
喜欢这篇 0
评论一下 0
凯派尔知识产权全新业务全面上线
相关文章
评论
试试以这些内容开始评论吧
登录后发表评论
凯派尔知识产权全新业务全面上线
宁波城市站
金华城市站
×
#热门搜索#
精选双创服务
历史搜索 清空

Tel:18514777506

关注微信公众号

创头条企服版APP