作者|赵赛坡
头图|视觉中国
本期“计算”专栏关注英国半导体政策、美国百亿美元芯片补贴分配、中国公司与中东国家抢购英伟达芯片。
“巨头”部分透过阿里云财报和分析师会议,解析大模型带给云计算公司的启示;AWS 自研芯片如何成为其竞逐大模型赛道的“秘密武器”,也是这部分探讨的议题。
“市场”专栏分享第二季度全球 AI 投融资洞察以及一份 AI 风险投资的思考框架,通过数据和投资人的视角,进一步了解 AI 市场的真实一面;与此同时,你还会看到大模型的“对抗式攻击”、麦肯锡 AI 适应性报告分享等。
接下来,欢迎和我一起复盘近期围绕数据与智能的产业关键事件。
大模型·计算
在半导体成为国家竞争关键的当下,各国政府也在相继加大对半导体的资金和政策扶持,英国政府近期出台的一系列政策表明,该国不会效仿美国、欧盟等国家为半导体工厂提供巨额补贴,而是基于现有产业优势,比如利用 ARM 公司的芯片设计能力,强化英国在半导体产业链中的优势地位。
看几个数字对比:
· 美国“芯片法案”提供高达 520 亿美元的补贴;
· 欧盟为半导体产业准备了 430 亿欧元的预算;
· 德国政府向英特尔一座工厂补贴数十亿欧元;
· 英国未来十年的半导体预算为 10 亿磅;
与此同时,英国政府还公布了半导体咨询委员会名单,包括树莓派创始人、ARM 公司架构师在内的半导体产业专业人士位列其中,该委员会的目的是向英国政府提供半导体国家战略的咨询和建议。
再来看美国数百亿芯片刺激计划——特别是面向芯片制造的资金——如何分配。美国商务部从华尔街投行、咨询机构等招募了一支团队,在商务部部长雷蒙德的领导下,这个小组更像是一家“政府里的投资机构”,其工作方式也和华尔街投行类似,比如有专门的投资人负责每个项目,根据申请信息进行数据收集、建立定量模型等。
在德国,台积电将与英飞凌、恩智浦和博世合作,共同建设一座位于德累斯顿的芯片制造工厂。该工厂的总投资预算超过 110 亿欧元,德国政府为这个工厂的补贴高达 55 亿欧元,台积电也为此投资 35 亿欧元。
台积电拥有这座工厂 70% 的股权,英飞凌、恩智浦和博世将分别持有 10% 的股权。工厂计划在 2027 年底之前开始制造芯片,重点是生产汽车和工业领域的芯片。
尽管包括德国在内的欧洲多个国家都在强调在本地建立芯片工厂,但人才短缺的现实已经成为各国构建芯片产业链的重要难题。在德国萨克森州的众多芯片工厂,巨大的技术人员和工程师需求只能通过从其他国家聘请工人来解决。
最近的一项研究指出,德国半导体行业存在 6.2 万名工人短缺,尤其是电气工程和软件开发领域的工人更为稀缺,由此也引发了是否开放技术移民的讨论。
再来聊聊英伟达。上周英伟达发布了面向服务器、并集成 GPU 和 CPU 的 GH200 Grace Hopper 超级芯片,其最高 141 GB 的 HBM3 内存以及每秒 5TB 的带宽,可以说是一款专门面向 ChatGPT 等大语言模型训练的芯片。
该芯片将于 2024 年第二季度开始生产,其战略意义可能比纸面的参数更大,毕竟,英伟达直接竞争对手的 AMD,正在努力在今年内正式发售最新款的 MI300 芯片,并在 2024 年提供足够的产量。下图是 MosaicML 公司展示的两家公司在软硬件方面的产品布局:
回到市场的角度,现阶段更多还是如何“抢购”更多英伟达已经发售的 AI 芯片,比如,包括百度、字节跳动、腾讯和阿里巴巴在内的中国科技巨头,已经至少为英伟达支付了 50 亿美元的订单,未来两年获得专为中国市场定制的 A800 芯片。
中国公司“抢购”的原因也不难理解。其一,在算法相对公开(大量论文)、数据训练集门槛不高(可以用钱解决的问题从来都不是问题)的背景下,算力就成为各大公司推进大模型产品的瓶颈,英伟达的 AI 芯片已经在 OpenAI、微软等公司的大模型训练中展示了作用,自然而言成为其他公司的选择,几个细节:
· 字节跳动内部已经储备了至少 1 万个英伟达 GPU,并已经订购了近 7 万个 A800 芯片,2024 年交付;
· 字节内部研发了一个名为“Grace”的 AI 聊天机器人,目前还在内测;
· 阿里巴巴已收到数千个英伟达的 A800 芯片;
一位百度员工更是直言,“没有这些芯片,我们无法进行大语言模型训练”。
另一方面,在中美地缘政治冲突短期内无解的背景下,半导体领域的任何政策调整都会对企业发展产生巨大影响,利用现阶段相对清晰的政策环境,赶快囤货才是关键。
中东国家也加入“抢购”英伟达芯片的阵营。沙特 Kaust 大学目前购买了至少 3000 个英伟达最新的 H100 芯片。价值 1.2 亿美元,值得一提的是,这所大学还拥有 200 个英伟达 A100 芯片,并在建造一台名为“Shaheen III”的超级计算机。
阿联酋也获得了数千个英伟达芯片,该国的开源大型语言模型 Falcon,就使用了 384 个英伟达 A100 芯片进行训练。
FT 从供应链处获得的数据显示,英伟达预计在 2023 年销售 50 万个 H100 芯片,主要供应给美国公司。
大模型·巨头
阿里云上周发布新一季度财报,营收同比增长 4% 至 251.23 亿人民币,经调整 EBITA 利润增长 106% 至 3.87 亿元人民币。
大语言模型显然给阿里云带来不小的增长机遇,新闻稿里强调,AI 热潮带来的算力和模型服务需求,推动本季营收的增长;与此同时,阿里巴巴架构调整后的并表业务及金融服务、教育、电力和汽车行业的客户驱动,也是本季度营收增长的关键。
在随后的阿里巴巴财报分析师会议上,张勇进一步解读了阿里云所面临的情况,一方面,需要理性看待阿里云增长放缓的状况,这很大程度与疫情期间的企业数字化选择有关,“我们正在调整策略聚焦公有云和核心客户,以实现长期稳定增长。预计在AI等新业务带动下,今年下半年增速将逐步回升”。
其次,为了更好应对云计算增速放缓的情况,阿里云将“积极推进公有云转型,因为公有云用户量大、需求稳定,有利于实现规模化效益”,同时优化运营流程和供应链来提升效率,以实现规模经济。
值得一提的是,就在财报发布后,多家媒体援引阿里内部的消息称,钉钉或将从阿里云内部独立,回归到阿里巴巴的体系里。此举意味着“云钉一体”战略的终结,而通过削减钉钉的运营成本,阿里云可以继续追求大客户和高利润,从而在上市的时候获得更好的市场回应。
第三,阿里云在大模型领域的布局包括两个方面:
· 开源:深耕开源社区,继续升级自研模型,并开源部分模型。
· 商业化:通过提供底层计算力实现变现,在鼓励客户提供二次产品的同时,积极推出面向行业的垂直模型;
透过阿里云财报和分析师会议记录,我们也可以一窥大模型带给云计算产业的几点启示:
· 算力需求正在激增,阿里云现阶段也只能满足部分客户对于大模型训练的算力需求,这凸显出大模型时代计算能力的竞争会成为关键,这也从另一个侧面展示英伟达等芯片公司为何持续被追捧;
· 通用大模型的价值远不如行业模型,原因在于,前者缺乏落地实际场景,还需要更多“Know How”以及工程化的工作,而后者能给企业快速带来价值。
算力成为云上大模型的竞争的关键之一,这也是 AWS 的核心竞争力之一,过去几年,AWS 在自研芯片领域进行了大量布局:
· 2013 年发布一款名为 Nitro 的专用硬件,你可以将其理解为 AWS 的计算加速器,目前已经部署到 AWS 所有云服务器;
· 2015 年,随着亚马逊收购以色列芯片创业公司 Annapurna Labs,AWS 的自研芯片进入快车道;
· 2018 年 AWS 发布首款基于 ARM 架构的服务器芯片 Graviton;
· 也是在 2018 年,AWS 发布 AI 推理芯片 Inferentia;
· 2021 年,AWS 发布 AI 训练芯片 Trainium,并在 2022 年发布第二代;
利用自研芯片,AWS 能够减少对于上游服务器芯片公司——英特尔、AMD——的依赖,从而为云产品的降价提供空间;而自研硬件也能够与软件产品实现更好的协同,进一步优化云服务的体验。
不过,自研芯片是否能够应对大模型时代的算力需求,目前还是一个未知数,就像 AWS 从来不会透露云服务中的自研 CPU 和英特尔 CPU 之间的比例一样(除特定芯片的计算实例外),外界也不会轻易知道 AWS AI 芯片在 AI 云服务中的比重。
对于 AWS 和阿里云这两大中美云计算巨头来说,过去十几年在产品、客户层面的积累,才是他们接下来利用大模型发展机遇,实现新一轮增长的关键。毕竟,任何一个大模型应用都需要数据、算法的加持,如果客户此前就使用 AWS 或阿里云的服务,那么数据就存储在 S3 或 OSS(对象存储)里;而大模型应用的部署,也需要和其他产品——包括但不限于 CDN、数据库——实现协同,这些复杂而真实的开发场景,远非一家大模型公司——即便是 OpenAI——所能覆盖。
从这个角度去看,我依然看好云计算公司会成为大模型竞争的受益者,甚至是比英伟达等一众芯片公司更长期的受益者。
大模型·市场
先看关注两笔投融资案例:
· 德国创业公司 Deepset GmbH 获得 3000 万美元融资,这家公司面向开发者提供可方便构建自然语言应用的开源框架 Haystack,Alphabet 旗下的投资部门 GV 参与了此次投资;
· 明星创业公司 Anthropic 日前获得韩国 SK 电信的 1 亿美元投资,并共同开发面向电信市场的大语言模型;韩国 SK 电信参与过 Anthropic 公司今年 5 月的一笔总额 4.5 亿美元的融资,不过 SK 电信并未透露其投资比例;
CB Insights 统计了 2023 年第二季度全球 AI 市场投融资案例,给出以下一组发现:
其一,全球第二季度 AI 领域的投融资交易总额为 94 亿美元,环比下降 38%,主要是因为 OpenAI 在一季度获得 100 亿美元融资,如果减去 OpenAI 的这笔巨额融资,二季度增长了 81%。
其二,第二季度融资最高的 5 笔融资里,有 4 笔流入生成式 AI 领域;而本季度新增加的 7 个 AI“独角兽公司”(估值超过 10 亿美元的创业公司)里,生成式 AI 公司占了 5 个:Cohere、Replit、Runway, Synthesia、Typeface。
对于生成式 AI 市场的发展,风险投资公司 Mosaic 上周发布了一份投资思考框架,提到几个关注角度:
· 市场机会:一家公司提供的产品要么是增强现有产品、要么是替代现有方案,如何理解这其中的机会与困难?
· 产品:大模型从来不是产品,提示词也不是产品,真正的产品是如何把大模型、提示词落地到用户使用情景之中;
· 护城河:这是一个古老的命题,但在大模型时代格外需要注意,毕竟有大量产品建立在对大模型调参的基础之上,这几乎没有多少“防御能力”;
· 从关注开发到聚焦市场:大模型领域的快速发展,不断降低基于模型创业的门槛,开发门槛、成本也在大幅下降,如何商业化运营产品,并在市场、营销层面进行迭代创新,正在变得越来越重要。
几家明星创业公司近期都遭遇一些争议。文本生成图像创业公司 Stability AI 面临内部一系列动荡。3 月份以来,至少有 6 名高管离职,关于该公司 CEO Emad Mostaque 能力、人品的质疑也层出不穷,受此影响,Stability AI 新一轮高达 40 亿美元的融资过程面临诸多困难。
OpenAI 的 ChatGPT 成为“对抗性攻击”的研究对象,与之前的“越狱”不同,后者可通过自动化的方式构建,攻击者可创建无限量的内容。
和图像类的“对抗性攻击”类似,研究者在一些开源大模型以及 ChatGPT 等闭源模型上,仅使用一些后缀字符串就能让模型“变坏”,下图是研究者的示例(有可能包含令你感到不适的内容):
你可以在这里阅读这篇研究论文。
这项研究至少有两个方面的价值:其一,过度关注所谓“模型对齐”——简单理解为模型和人类在核心价值观上基本一致——意义不大,系统输出的稳定性更重要;其二,任何时候都不要让大模型自行做决定,因为这类“对抗性攻击”基本无解。
最后分享一份咨询公司麦肯锡的 AI 适应性报告,数据和图表较多,感兴趣的朋友可以通过这里详细查看。如果用一句话总结:2023 生成式 AI 的应用快速增长,但整体使用还处于早期阶段,鉴于该技术的不确定性,大公司的部署使用非常谨慎。
评论