全球半导体政策与芯片竞争揭秘｜AI内参

作者｜赵赛坡

头图｜视觉中国

本期“计算”专栏关注英国半导体政策、美国百亿美元芯片补贴分配、中国公司与中东国家抢购英伟达芯片。

“巨头”部分透过阿里云财报和分析师会议，解析大模型带给云计算公司的启示；AWS 自研芯片如何成为其竞逐大模型赛道的“秘密武器”，也是这部分探讨的议题。

“市场”专栏分享第二季度全球 AI 投融资洞察以及一份 AI 风险投资的思考框架，通过数据和投资人的视角，进一步了解 AI 市场的真实一面；与此同时，你还会看到大模型的“对抗式攻击”、麦肯锡 AI 适应性报告分享等。

接下来，欢迎和我一起复盘近期围绕数据与智能的产业关键事件。

大模型·计算

在半导体成为国家竞争关键的当下，各国政府也在相继加大对半导体的资金和政策扶持，英国政府近期出台的一系列政策表明，该国不会效仿美国、欧盟等国家为半导体工厂提供巨额补贴，而是基于现有产业优势，比如利用 ARM 公司的芯片设计能力，强化英国在半导体产业链中的优势地位。

看几个数字对比：

· 美国“芯片法案”提供高达 520 亿美元的补贴；

· 欧盟为半导体产业准备了 430 亿欧元的预算；

· 德国政府向英特尔一座工厂补贴数十亿欧元；

· 英国未来十年的半导体预算为 10 亿磅；

与此同时，英国政府还公布了半导体咨询委员会名单，包括树莓派创始人、ARM 公司架构师在内的半导体产业专业人士位列其中，该委员会的目的是向英国政府提供半导体国家战略的咨询和建议。

再来看美国数百亿芯片刺激计划——特别是面向芯片制造的资金——如何分配。美国商务部从华尔街投行、咨询机构等招募了一支团队，在商务部部长雷蒙德的领导下，这个小组更像是一家“政府里的投资机构”，其工作方式也和华尔街投行类似，比如有专门的投资人负责每个项目，根据申请信息进行数据收集、建立定量模型等。

在德国，台积电将与英飞凌、恩智浦和博世合作，共同建设一座位于德累斯顿的芯片制造工厂。该工厂的总投资预算超过 110 亿欧元，德国政府为这个工厂的补贴高达 55 亿欧元，台积电也为此投资 35 亿欧元。

台积电拥有这座工厂 70％的股权，英飞凌、恩智浦和博世将分别持有 10％的股权。工厂计划在 2027 年底之前开始制造芯片，重点是生产汽车和工业领域的芯片。

尽管包括德国在内的欧洲多个国家都在强调在本地建立芯片工厂，但人才短缺的现实已经成为各国构建芯片产业链的重要难题。在德国萨克森州的众多芯片工厂，巨大的技术人员和工程师需求只能通过从其他国家聘请工人来解决。

最近的一项研究指出，德国半导体行业存在 6.2 万名工人短缺，尤其是电气工程和软件开发领域的工人更为稀缺，由此也引发了是否开放技术移民的讨论。

再来聊聊英伟达。上周英伟达发布了面向服务器、并集成 GPU 和 CPU 的 GH200 Grace Hopper 超级芯片，其最高 141 GB 的 HBM3 内存以及每秒 5TB 的带宽，可以说是一款专门面向 ChatGPT 等大语言模型训练的芯片。

该芯片将于 2024 年第二季度开始生产，其战略意义可能比纸面的参数更大，毕竟，英伟达直接竞争对手的 AMD，正在努力在今年内正式发售最新款的 MI300 芯片，并在 2024 年提供足够的产量。下图是 MosaicML 公司展示的两家公司在软硬件方面的产品布局：

回到市场的角度，现阶段更多还是如何“抢购”更多英伟达已经发售的 AI 芯片，比如，包括百度、字节跳动、腾讯和阿里巴巴在内的中国科技巨头，已经至少为英伟达支付了 50 亿美元的订单，未来两年获得专为中国市场定制的 A800 芯片。

中国公司“抢购”的原因也不难理解。其一，在算法相对公开（大量论文）、数据训练集门槛不高（可以用钱解决的问题从来都不是问题）的背景下，算力就成为各大公司推进大模型产品的瓶颈，英伟达的 AI 芯片已经在 OpenAI、微软等公司的大模型训练中展示了作用，自然而言成为其他公司的选择，几个细节：

· 字节跳动内部已经储备了至少 1 万个英伟达 GPU，并已经订购了近 7 万个 A800 芯片，2024 年交付；

· 字节内部研发了一个名为“Grace”的 AI 聊天机器人，目前还在内测；

· 阿里巴巴已收到数千个英伟达的 A800 芯片；

一位百度员工更是直言，“没有这些芯片，我们无法进行大语言模型训练”。

另一方面，在中美地缘政治冲突短期内无解的背景下，半导体领域的任何政策调整都会对企业发展产生巨大影响，利用现阶段相对清晰的政策环境，赶快囤货才是关键。

中东国家也加入“抢购”英伟达芯片的阵营。沙特 Kaust 大学目前购买了至少 3000 个英伟达最新的 H100 芯片。价值 1.2 亿美元，值得一提的是，这所大学还拥有 200 个英伟达 A100 芯片，并在建造一台名为“Shaheen III”的超级计算机。

阿联酋也获得了数千个英伟达芯片，该国的开源大型语言模型 Falcon，就使用了 384 个英伟达 A100 芯片进行训练。

FT 从供应链处获得的数据显示，英伟达预计在 2023 年销售 50 万个 H100 芯片，主要供应给美国公司。

大模型·巨头

阿里云上周发布新一季度财报，营收同比增长 4% 至 251.23 亿人民币，经调整 EBITA 利润增长 106% 至 3.87 亿元人民币。

大语言模型显然给阿里云带来不小的增长机遇，新闻稿里强调，AI 热潮带来的算力和模型服务需求，推动本季营收的增长；与此同时，阿里巴巴架构调整后的并表业务及金融服务、教育、电力和汽车行业的客户驱动，也是本季度营收增长的关键。

在随后的阿里巴巴财报分析师会议上，张勇进一步解读了阿里云所面临的情况，一方面，需要理性看待阿里云增长放缓的状况，这很大程度与疫情期间的企业数字化选择有关，“我们正在调整策略聚焦公有云和核心客户，以实现长期稳定增长。预计在AI等新业务带动下,今年下半年增速将逐步回升”。

其次，为了更好应对云计算增速放缓的情况，阿里云将“积极推进公有云转型，因为公有云用户量大、需求稳定，有利于实现规模化效益”，同时优化运营流程和供应链来提升效率，以实现规模经济。

值得一提的是，就在财报发布后，多家媒体援引阿里内部的消息称，钉钉或将从阿里云内部独立，回归到阿里巴巴的体系里。此举意味着“云钉一体”战略的终结，而通过削减钉钉的运营成本，阿里云可以继续追求大客户和高利润，从而在上市的时候获得更好的市场回应。

第三，阿里云在大模型领域的布局包括两个方面：

· 开源：深耕开源社区，继续升级自研模型，并开源部分模型。

· 商业化：通过提供底层计算力实现变现，在鼓励客户提供二次产品的同时，积极推出面向行业的垂直模型；

透过阿里云财报和分析师会议记录，我们也可以一窥大模型带给云计算产业的几点启示：

· 算力需求正在激增，阿里云现阶段也只能满足部分客户对于大模型训练的算力需求，这凸显出大模型时代计算能力的竞争会成为关键，这也从另一个侧面展示英伟达等芯片公司为何持续被追捧；

· 通用大模型的价值远不如行业模型，原因在于，前者缺乏落地实际场景，还需要更多“Know How”以及工程化的工作，而后者能给企业快速带来价值。

算力成为云上大模型的竞争的关键之一，这也是 AWS 的核心竞争力之一，过去几年，AWS 在自研芯片领域进行了大量布局：

· 2013 年发布一款名为 Nitro 的专用硬件，你可以将其理解为 AWS 的计算加速器，目前已经部署到 AWS 所有云服务器；

· 2015 年，随着亚马逊收购以色列芯片创业公司 Annapurna Labs，AWS 的自研芯片进入快车道；

· 2018 年 AWS 发布首款基于 ARM 架构的服务器芯片 Graviton；

· 也是在 2018 年，AWS 发布 AI 推理芯片 Inferentia；

· 2021 年，AWS 发布 AI 训练芯片 Trainium，并在 2022 年发布第二代；

利用自研芯片，AWS 能够减少对于上游服务器芯片公司——英特尔、AMD——的依赖，从而为云产品的降价提供空间；而自研硬件也能够与软件产品实现更好的协同，进一步优化云服务的体验。

不过，自研芯片是否能够应对大模型时代的算力需求，目前还是一个未知数，就像 AWS 从来不会透露云服务中的自研 CPU 和英特尔 CPU 之间的比例一样（除特定芯片的计算实例外），外界也不会轻易知道 AWS AI 芯片在 AI 云服务中的比重。

对于 AWS 和阿里云这两大中美云计算巨头来说，过去十几年在产品、客户层面的积累，才是他们接下来利用大模型发展机遇，实现新一轮增长的关键。毕竟，任何一个大模型应用都需要数据、算法的加持，如果客户此前就使用 AWS 或阿里云的服务，那么数据就存储在 S3 或 OSS（对象存储）里；而大模型应用的部署，也需要和其他产品——包括但不限于 CDN、数据库——实现协同，这些复杂而真实的开发场景，远非一家大模型公司——即便是 OpenAI——所能覆盖。

从这个角度去看，我依然看好云计算公司会成为大模型竞争的受益者，甚至是比英伟达等一众芯片公司更长期的受益者。

大模型·市场

先看关注两笔投融资案例：

· 德国创业公司 Deepset GmbH 获得 3000 万美元融资，这家公司面向开发者提供可方便构建自然语言应用的开源框架 Haystack，Alphabet 旗下的投资部门 GV 参与了此次投资；

· 明星创业公司 Anthropic 日前获得韩国 SK 电信的 1 亿美元投资，并共同开发面向电信市场的大语言模型；韩国 SK 电信参与过 Anthropic 公司今年 5 月的一笔总额 4.5 亿美元的融资，不过 SK 电信并未透露其投资比例；

CB Insights 统计了 2023 年第二季度全球 AI 市场投融资案例，给出以下一组发现：

其一，全球第二季度 AI 领域的投融资交易总额为 94 亿美元，环比下降 38%，主要是因为 OpenAI 在一季度获得 100 亿美元融资，如果减去 OpenAI 的这笔巨额融资，二季度增长了 81%。

其二，第二季度融资最高的 5 笔融资里，有 4 笔流入生成式 AI 领域；而本季度新增加的 7 个 AI“独角兽公司”（估值超过 10 亿美元的创业公司）里，生成式 AI 公司占了 5 个：Cohere、Replit、Runway, Synthesia、Typeface。

对于生成式 AI 市场的发展，风险投资公司 Mosaic 上周发布了一份投资思考框架，提到几个关注角度：

· 市场机会：一家公司提供的产品要么是增强现有产品、要么是替代现有方案，如何理解这其中的机会与困难？

· 产品：大模型从来不是产品，提示词也不是产品，真正的产品是如何把大模型、提示词落地到用户使用情景之中；

· 护城河：这是一个古老的命题，但在大模型时代格外需要注意，毕竟有大量产品建立在对大模型调参的基础之上，这几乎没有多少“防御能力”；

· 从关注开发到聚焦市场：大模型领域的快速发展，不断降低基于模型创业的门槛，开发门槛、成本也在大幅下降，如何商业化运营产品，并在市场、营销层面进行迭代创新，正在变得越来越重要。

几家明星创业公司近期都遭遇一些争议。文本生成图像创业公司 Stability AI 面临内部一系列动荡。3 月份以来，至少有 6 名高管离职，关于该公司 CEO Emad Mostaque 能力、人品的质疑也层出不穷，受此影响，Stability AI 新一轮高达 40 亿美元的融资过程面临诸多困难。

OpenAI 的 ChatGPT 成为“对抗性攻击”的研究对象，与之前的“越狱”不同，后者可通过自动化的方式构建，攻击者可创建无限量的内容。

和图像类的“对抗性攻击”类似，研究者在一些开源大模型以及 ChatGPT 等闭源模型上，仅使用一些后缀字符串就能让模型“变坏”，下图是研究者的示例（有可能包含令你感到不适的内容）：

你可以在这里阅读这篇研究论文。

这项研究至少有两个方面的价值：其一，过度关注所谓“模型对齐”——简单理解为模型和人类在核心价值观上基本一致——意义不大，系统输出的稳定性更重要；其二，任何时候都不要让大模型自行做决定，因为这类“对抗性攻击”基本无解。

最后分享一份咨询公司麦肯锡的 AI 适应性报告，数据和图表较多，感兴趣的朋友可以通过这里详细查看。如果用一句话总结：2023 生成式 AI 的应用快速增长，但整体使用还处于早期阶段，鉴于该技术的不确定性，大公司的部署使用非常谨慎。

评论

最新评论