作者|赵赛坡
头图|视觉中国
本期焦点议题:
万亿美元市值的英伟达,面临哪三大下行风险?
中美芯片对抗持续,日本企业、ARM、中东地区成为新前沿阵地?
不缺钱的 OpenAI 最缺什么?
2023 AI 现状报告解读;
接下来,欢迎和我一起复盘围绕数据与智能的产业关键事件。
计算·英伟达
2023 年,谈论 AI(特别是大模型)、云计算产业时无法避开的就是英伟达公司。关于英伟达如何成功的分析、故事已经很多,站在 AI 发展的角度去看,以下几个方面,构成了英伟达目前的优势地位:
大语言模型还处于在早期阶段,除了几个较大科技公司之外,其他行业甚至科技行业的小公司,并没有真正踏入到这个领域;或者我们可以说,当前大语言模型集中在科技巨头们使用英伟达 GPU 进行训练的阶段,谁能买到最新的 GPU,谁的训练效率就高,谁就能获得更多融资或关注度,这让英伟达 GPU 供不应求;
英伟达的平替还没有完全出现——至少现阶段还没有,从 AMD 到 Cerebras 以及 Google/AWS 的自研芯片,这些可替代英伟达 GPU 的产品要么表现不稳定,要么没有良好的软件生态,现阶段一个能打的也没有;
但产业永远处于动态发展之中,我们也应该使用发展的视角重新梳理英伟达所面临的市场环境,下面是几个潜在的趋势,或将影响英伟达的市值以及产品统治力:
其一,当大模型训练进入平稳期后,“推理”将成为产业发展的主流,这意味着,整个 AI 产业的计算需求会转向对“推理”芯片的需求;
其二,在面向“推理”的场景里,CPU 在成本、生态方面的优势不容忽视,无论是 x86、ARM 还是 RISC-V,都有可能成为大模型推理层面的算力提供者;
其三,大模型从“训练”到“应用”的转换,不仅将使得“研究”让位于“工程”(或者是从“论文”变成“产品”),还会影响大公司——包括科技巨头——对于大模型投资的决策,现阶段不惜一切代价买卡的历史终会终结。
当然,正如我在上面所谈到的动态视角,我们也不能假设英伟达没有注意到上述趋势,只是在现阶段巨大的利益面前,一家大公司能有多大勇气投入一个还未明朗的未来,我们无从知晓。但接下来一段时间,透过上述趋势来观察英伟达以及算力供应商的布局调整,会变得格外有趣。
计算·地缘政治
路透社援引消息人士的话称,白宫或将出台一项新措施,禁止中国公司从其海外公司那里买到禁售清单里的高端芯片。
此举意味着两点:短期内,美国政府对中国高端芯片的禁售还将持续,也将进一步影响中国大模型产业的发展;其二,过去一年,白宫多次发布“补丁更新”,充分展现出半导体产业的复杂性,仅靠一纸禁令,并不能完全切断产业链的流动。
值得玩味的是,台积电上周宣布,该公司已经获得美国商务部许可,可无限期向中国工厂提供来自美国的芯片制造设备;同时获得许可的,还包括三星和 SK 海力士两家韩国公司。
佳能上周表示,旗下芯片制造工具在纳米压印光刻技术方面取得突破,该技术可直接在晶圆上制造电路图案,无需光刻技术。既可成为 ASML 公司昂贵产品的低成本替代品,又避开了现阶段美国政府的对华芯片限售令,或将成为中美新一轮技术对抗的新阵地。
另一个新阵地则是 ARM。该公司不久前在美国完成 IPO,但 ARM 在中国市场面临中国公司控制权争议的难题,另外部分 ARM 中国员工在华成立新半导体公司的事件也在引发 ARM 股东的担忧。
第三个阵地出现在海湾地区。沙特阿卜杜拉国王科技大学与中国高校、科技公司合作,利用英伟达 GPU 研发大模型的举措,正在引发美国政府的关注,过去几年,该学校和中国学术较为密切。
巨头·市场
OpenAI 的收入的确在大幅增长。付费媒体 Information 援引消息人士的话称,OpenAI CEO Sam Altman 告诉员工,该公司的年收入按照年化速度计算将达到 13 亿美元。
这意味着 OpenAI 每月可获得至少 1 亿美元的收入,而在一年前的 2022 年,这家公司全年的营收仅为 2800 万美元。
但这不意味着 OpenAI 已经盈利,作为一家私人公司,OpenAI 没有披露成本——特别是研发成本(或者说大模型训练、运维成本)——的义务。根据此前分析机构的测算,OpenAI 一天运营的成本高达 70 万美元,以此折算,每个月的运维成本达到 2100 万美元。
对于 OpenAI 而言,钱并不是真正的问题。一方面它的背后站着微软这样的巨头,两家公司尽管有各种理念不合的传闻,但双方的深度绑定,是现阶段唯一而且正确的决定;另一方面,OpenAI 自然也不必担心其在一级市场的融资能力,它有足够耐心去挑选自己欣赏的投资机构。
OpenAI 最大的挑战如何从越发拥挤的基础大模型赛道上的突围。随着包括 Anthropic、Infection 等公司获得巨额融资,这些基础模型服务商所提供的产品并无本质的区别。即便 OpenAI 现在提供公开或企业私有版产品,但核心还是大模型的 API 能力,个人开发者或企业,还是要花费时间和精力,将这些 API 接入到自己的产品里。
这也使得三周后的 OpenAI 首次开发者大会具有众多看点。路透社援引消息人士的话称,此次大会旨在吸引更多开发者加入到 OpenAI 的生态圈,目前可知的一些更新:
在开发者工具添加内存存储功能,该功能将大幅降低模型使用成本;
提供视觉 API 的能力,该功能已经在 ChatGPT Plus 产品里发布,效果惊人;
如果你仔细去看一些海外大模型应用的价格,可以发现一个有趣的现象,绝大多数产品的价格都是 20 美元/月,比如:
ChatGPT Plus
Poe
Claude
Perplexity
除此之外,GitHub Copilot、Notion AI 为每月 10 美元,WSJ 的一篇报道指出,这些看似不菲的价格远不能覆盖大模型的成本。原因很简单,大模型应用无法像真正意义的软件产品那样实现规模效应,相反,付费用户越多,成本越高,反而困损的越多。
文章里的一个数据称,微软推出 GitHub Copilot 的付费产品后,每名订阅者每月还会导致微软损失 10 美元,甚至有的订阅者让这家公司承担每月 80 美元的额外损失。
这个数字真实程度如何还有待验证,但却也从一个侧面展现出现阶段大模型应用到底有烧钱了,而科技公司的开源节流之道也很多:
降低免费额度,比如 Claude 对免费用户进行限流;
将大模型集成到更多产品里,通过提高其他产品的销量平摊成本,比如微软现在各种“Copilot”产品;
AI 现状报告
投资人 Nathan Benaich 每年 10 月份都会发布一份“State of AI Report”,上周,2023 的报告如约而至。
和往年类似,今年的报告依然分为基础研究、产业、政策、安全四大类别进行盘点和总结,内容非常丰富,基本覆盖了过去十二个月全球 AI 领域的产业事件和关键趋势。
鉴于篇幅限制,我仅仅对这份报告的几个要点做一些延伸思考,更多内容,建议各位通过我分享的这个链接获取该报告的 PDF 版本。
首先,GPT-4 是目前毫无疑问的“王者”,这一点不需要过多质疑,甚至可以说,当你看到诸如“某某模型可媲美 GPT-4”的说法时,直接忽略就可以了,基本不可能。
其次,算力和数据的竞争越发激烈,二者在物理层面又存在天然的限制,想象一下英伟达 GPU 计算能力的边界在哪里?以及,大模型的优秀训练数据——特别是人类产生的数据——没有了怎么办?
其三,如果你关注大语言模型的应用场景,生命科学领域是一个非常关键的切入点。这个领域的职业道德与行业特点,决定了其研发进程更谨慎小心,而一旦能够实现大规模应用,对人类社会的影响非常大。
其四,AI 安全是一个极其广泛的政治议题,从国家到地区,从不同政党到各大企业,短期内——甚至在几年之内——都不可能达成一致。
值得一提的是,每年“State of AI Report”的最后都会有十个预测,今年的预测分为以下几类:
应用:一部利用生成式 AI 制作的好莱坞级别的大片、AI 生成的歌曲进入 billboard 100 或 Spotify Top Hit 榜单;
安全与监管:一家大模型公司因选举遭到调查、美英两国启动对微软和 OpenAI 合作的垄断调查;
资本市场:至少一家 AI 公司上市、GPU 债务基金取代风险投资;
训练与推理:大模型训练领域继续烧钱,用 10 亿美元训练一个模型,而在“推理”领域,大模型公司收购推理芯片公司;
结果如何,我们明年再看。
应用·政策
两家大公司上周发布面向医疗领域的大模型产品:
生成式 AI 领域的落地应用如何会成为该技术发展的关键,在很多大公司的 CIO 看来,该技术仍在发展阶段,企业正寻求早期概念验证来证明其价值。
如果说 CIO 们侧重于成本管理,那么 CSO——首席安全官——都需要考虑大模型应用应用来到的潜在法律问题,比如版权纠纷,上周,Google 宣布,如果企业客户使用该公司 Duet AI、Vertex AI Search 出现版权问题,Google 会为其辩护。
这些承诺反映出当下生成式 AI 市场的潜在问题,大量企业因为版权等法律问题而不敢或不愿意大规模部署相关技术,但大公司的承诺并不可能完全解决这个问题,它更像是一种市场营销行为,或者说,是一系列面向政府游说行为的组成部分。
除此之外,保险公司也盯上了这个领域。北美一些保险公司计划推出一系列面向大模型失败场景的保险业务,WSJ 的报道指出,这些保险参考了网络安全保险的做法,能够一定程度帮助 IT 决策者进行风险管理。
最后看两项监管政策:
评论