作者 | 赵赛坡
头图 | 视觉中国
本周,半导体的地缘政治再起新变化,本期关注中美、中韩之间的半导体博弈,同时日本政府开始介入半导体产业链,引发行业热议。
与此同时,ASML 公司披露供应链情况、英特尔介绍代工模式发展,都是本期“计算”专栏的焦点议题。
Databricks 13 亿美元的收购邀约、汤森路透 6.5 亿美元的现金支票,都在显示 AI 领域的并购速度正在加快,本期将给出一些分析。
漫威新剧《秘密入侵》因为采用 AI 生成的片头而成为文化媒体以及科技媒体关注的头条,在一系列偶然或必然里,这件事意外地创造了一种观察 AI,特别是生成式 AI 发展的角度,本期提供一些思考。
接下来,欢迎和我一起复盘近期围绕数据和智能的产业事件。
计算·地缘政治
继续关注围绕计算的地缘政治议题。WSJ 的独家消息称,美国政府正在考虑加强对中国的芯片出口限制。消息人士透露,新的政策将作为 2022 年 10 月芯片出口限制的“加强版”,比如此前英伟达可以不受约束地向中国提供“阉割版本”的 A800 GPU,但在最快下月出台的新规定里,A800 的出口将需要得到美国商务部的许可。
WSJ 援引另外的消息源称,美国政府也在考虑是否限制中国公司使用美国云计算公司的云服务,因为这也是避开芯片制裁的一种方式——通过租用云计算公司的 GPU 计算实例快速部署自己的大模型或相关服务。
不过上述传闻还有待更多消息源的证实,截止本期内容发稿前,英伟达、AMD 等能够提供 GPU 的芯片公司还未向媒体发表新消息,考虑到半导体巨头在华盛顿拥有庞大的游说团体,接下来政策的走向或许也会发生一些变化,而且在国务卿“破冰式”的访华之后,传闻美国财长也将在近期前往中国,这一系列外交层面的接触也为后续政策调整预留了非常多的空间。
但在一个更广泛的产业格局里,中美、中欧之间的博弈关系还将持续下去,比如:
· 日本、荷兰同意美国政府的提议,在诸多半导体技术、产品方面制定了严格的出口审核政策;
· 韩国与中国台湾(主要是台积电)半导体公司在华运营暂时不会受到美国政府相关禁令的影响;
· 美国政府还在计划限制美国资本投资包括中国在内的某些“竞争国家”的企业;
FT 的报道称,过去几个月来,美国、欧盟一直在着手推进“去风险化”,也就是改变诸如供应链、市场等高度依赖中国以及特定国家的格局,中国释放出的一个信号是:“去风险化是一个伪命题”。
回到企业层面,在光刻机巨头 ASML 看来,所谓“脱钩”即便是一件可能的事情,也是昂贵且困难的事情。
ASML CEO Christophe Fouquet 的表态可谓滴水不漏,他并没有指名道姓地谈到哪个国家,但又是在“教育”所有国家。比如他说,任何单个国家要建立自己完全自给自足的芯片产业都会面临巨大困难,同时他还明确指出,合作是在半导体领域取得成功的唯一途径。
作为整个欧盟市值第三大的公司,同时是唯一可以提供制造先进芯片工具的公司,ASML 现在的确有底气做这番表态。如果你对这家公司感兴趣,还可以看看这部 ASML 纪录片,制作团队得到众多拍摄与采访的权限,很值得一看。
接着看企业,英特尔上周向分析师分享了在代工领域的发展情况,几个要点:
· 创建一个名为“制造集团”的新部门,全面负责芯片工厂的制造工作;
· 英特尔内部将“(芯片)制造”与“(芯片)设计”转为两个独立核算的部门,比如“设计”需要向“制造”付费,才能进行芯片的生产工作;
根据英特尔的测算,通过设立这样的部门以及新的工作流程,有望带来最高 100 亿美元的成本节约。
英特尔发布此消息的背景可谓意味深长。过去半年以来,借助 ChatGPT 等大语言模型带来的巨大产业红利,包括英伟达、AMD 在内的一众半导体公司股价、市值大幅上涨,与之相比,英特尔显得极为落寞:
这背后所反应的是一个极其残酷但真实的事实:英特尔已经在 AI 领域已经完全落后了。
事实上,自 2021 年 9 月开始,英特尔一直在推进“新复兴计划”,即通过全面、加倍投资代工业务,重新成为一家兼具“芯片设计+制造”的半导体公司,但正如我在当时的“AI 内参”里所言:
加码芯片代工,意味着英特尔要进入到一个“客户为中心”的商业氛围里,台积电能够快速崛起,除了技术突破之外,其对客户需求的拿捏也是重要原因,而这些与英特尔的公司文化并不一致,此前英特尔在代工领域的失败也是这个原因……
如今,英特尔通过一项组织架构的变革,更进一步展示自己对于代工业务的决心;与此同时,英特尔还在疯狂建厂,仅在过去一个月:
· 将德国两座芯片工厂的投资总额从 170 亿欧元提高到 300 亿欧元;
· 计划投资 250 亿欧元在以色列建立芯片工厂;
但对英特尔而言,提出“新复兴计划”、成立制造集团以及与各国政府博弈从而拿到巨额建厂补贴,所有这些都仅仅是英特尔转型的开始,它还需要时间向资本市场证明这个决策的正确性。
关注两个东亚国家在半导体领域动态:
· 由日本政府支持的一个基金计划收购半导体产业链公司 JSR,该公司在光刻胶领域占有 30% 的全球份额,英特尔、三星和台积电都是其客户,此举被认为是日本政府介入半导体产业链的重要布局;
· 围绕韩国芯片专家 Choi Jin-seok 是否通过窃取三星公司的技术,并在中国建立芯片工厂的讨论,各方都给出了不同方向的解读,但一个明确的结论是,在中美技术对抗的背景下,韩国处在一个非常关键却也是尴尬的位置;
大模型·资本
AI 市场的“instagram 并购”或已经开始,这是 Box 公司创始人 Aaron Levie 对 Databricks 公司以 13 亿美元收购生成式 AI 创业公司 MosaicML 时的评价。
这笔交易发生在以 ChatGPT 为代表的大模型正在深刻影响各个行业的背景下,也一定程度反应出市场的躁动情绪。
首先是机遇。OpenAI 不会一家独大,这既是市场的需求,也是各国监管机构时刻关注的领域,因此对于 OpenAI 及微软以外的巨头或创业公司而言,围绕大模型、生成式 AI 还有巨大的增长机遇。
特别是在企业市场。大模型需要海量的训练数据,但企业客户对于数据合规、安全的要求很高,这意味着,面向企业市场的大模型应用与各类 ChatGPT 类的消费级应用完全不同。这也是 Databricks 收购 MosaicML 的原因之一,使企业能够使用专有数据创建自己的语言模型,而不是依赖于在公共数据上训练的第三方模型,类似的收购还包括一个月前 Snowflake 收购 Neeva,后者是一家将大模型引入搜索的创业公司。
其次是挑战。很多时候,收购是巨头公司快速切入某个领域的关键策略,利用收购可以快速获取该领域的人才和相关技术,从而启动或加速内部业务的发展,这在欧美成熟市场有诸多成功的案例,比如典型的就是Facebook 2012 年以 10 亿美元收购 Instagram,当时引发行业震动,很多批评家将其看作是一场炒作游戏,但后面的历史证明了这可能是扎克伯格做的最正确决定之一。
但收购也面临一系列挑战,比如市场上存在大量获得巨额融资的“三无”——无营收、无产品、无研究——创业公司,这无形中也提升了收购的成本和风险。但在人才或技术的现实需求之下,接下来的并购速度可能会越来越快,而大额收购也会增多,谁的出手快或出价高,谁就有可能获得一支团队及其背后的技术与客户,就在 DataBricks 宣布收购 MosaicML 的第二天,路透社的母公司,汤森路透宣布以 6.5 亿美元的现金收购一家旧金山的 AI 公司 Casetext。
根据汤森路透(Thomson Reuters)首席执行官 Steve Hasker 的说法,这次收购的目标之一是为客户提供生成式 AI。
再关注一组近期 AI 创业公司的融资案例:
· 能源技术创业公司 KoBold Metals 近期完成 1.95 亿美元的融资,估值达到 11.5 亿美元,投资方包括 a16z、Breakthrough Energy Ventures(由多位富翁支持),这家公司的技术是利用 AI 算法优化能源挖掘、开采的效率;
· 英国 AI 语音创业公司 ElevenLabs 获得包括 a16z、GitHub CEO Nat Freidman 等机构或个人领投的 1900 万美元 A 轮融资,这家公司自今年以来已经拥有超过 100 万注册用户;
· 以色列创业公司 Deepchecks 完成 1400 万美元的种子轮融资,该公司的产品是为客户提供围绕大模型的全生命周期测试服务,确保大模型在各个阶段都能满足客户的需求。
大模型·产品
训练大语言模型需要巨大的算力,除了向英伟达、AMD 购买 GPU 之外,通过租借云服务商或超算服务商的计算能力,也成为当下众多公司的一个选择。
拥有全球最强超算产品 HPE Cray EX235A 的惠普企业上周正式踏入大语言模型赛道,结合自身在计算层面的巨大优势,该公司推出一个名为“HPE Greenlake for large language models”的产品,满足企业客户私有化模型训练、调参和部署的现实需求。
该产品已经向部分早期客户提供,计划今年年底在北美市场正式发布,根据惠普企业的说法,这个产品仅在几周之内就收到 26 亿美元的订单需求。
AWS 也在积极推进生成式 AI 在企业市场的应用,该公司上周宣布将投资 1 亿美元建立一个生成式 AI 创新中心,其主要工作包括:
· 组建一支由数据科学家、工程师、架构师组成的团队,深入到企业内部,结合客户的业务需求和 AWS 在生成式 AI 领域的布局,构建定制化的方案;
· 充分推广 AWS 生成式 AI 的各项服务,比如代码生成工具 Amazon CodeWhisperer 和大模型平台 Amazon Bedrock 等;
在 AWS 生成式 AI 高管 Sri Elaprolu 看来,很多客户迫切需要使用生成式 AI,但不知道如何入手。这番表态不仅适用于 AWS 客户,也适用于其他国家、地区(也包括中国市场)的客户,生成式 AI 快速增长的需求还需要一定时间的消化。
由 LinkedIn 联合创始人 Reid Hoffman 创建的 Inflection 公司上周发布了一个新模型,这个名为 Inflection-1 的大语言模型,在规模和功能上可媲美 GPT-3.5,该模型的基准测试表现可在这里查看。
值得一提的是,Inflection-1 模型就是 Pi 聊天机器人所使用的模型,感兴趣的朋友,也可以直接通过网页体验这个机器人,目前还不支持中文交互。
接着看聊天机器人,Google DeepMind CEO Demis Hassabis 表示,该公司正在基于强化学习的技术开发一款名为 Gemini 的语言模型。该模型的一大特点是可以实现更好的对话效果,而相比于 OpenAI 的 GPT-4,Gemini 将结合 DeepMind 长期投入研发的强化学习技术,从而让大模型具备诸如规划或系统解决问题的能力。
目前尚不可知 Gemini 还有多久才会发布,但结合 Google 近期组建全新 Google DeepMind 公司以及 Demis Hassabis 的这番表态,我们有理由期待 Gemini 在未来会成为 Google 对抗 OpenAI、微软以及其他生成式 AI 公司的重要布局。
作为以聊天机器人起家的产品,ChatGPT 接下来的发展方向一直以来都备受关注,Information 的独家消息称,OpenAI CEO Sam Altman 私下告诉一些开发者,OpenAI 希望将 ChatGPT 打造成一个“超智能工作的个人助理”,不仅可以快速学习个人生活与工作场景中的知识,还可以结合这些知识推荐、生成一些内容。
当然这个愿景也有一些挑战。比如如何确保个人数据的安全性,特别是用户越来越多依赖智能手机的时候,将模型计算能力放在本地设备或许可以解决数据安全与体验延迟的问题,但小模型能否拥有和大模型一样的“智能”,目前还是一个未知数。
另一方面,这样的产品规划也会和微软产生利益冲突,微软现在正全力将“Copilot”推广到各个产品线,这本质上也是一类智能助理,通过对话的方式,帮助用户快速使用微软的产品。
当然,OpenAI 与微软的利益冲突并不仅仅在智能助理方面,另有消息称,OpenAI 也在考虑构建一个模型交易平台,允许企业将训练好的模型放在平台上进行销售,这可能会和微软企业市场的部分产品产生重合。
最后看一个有趣但颇具代表性的事件。上周,漫威新电视剧《秘密入侵》上架迪士尼流媒体平台,有观众指出,第一集的两分钟片头完全由生成式 AI 制作完成,这两分钟像是在交代剧情背景,混搭着人类、外星人、故事地点等图像,图像的呈现和编排方式故意模糊和扭曲。
这个事件在社交媒体上引发热议,众多艺术从业者表达了厌恶想法,甚至有参加该剧集制作的从业者认为“AI 对于艺术家是不道德与危险的”。
我无意过多评价这些评价,但这件事在一系列偶然或必然里,意外地创造了一种观察 AI,特别是生成式 AI 发展的角度:
· 《秘密入侵》讲述的是外星族群斯克鲁尔人通过变形为人类外貌的方式秘密来到地球搞破坏,这和各类生成式 AI 应用假冒人类生成文本、图像的情景非常类似;
· 这 2 分钟的片段使用了哪些技术、由哪家公司提供,迪士尼和漫威拒绝透露任何详细信息,这也和 OpenAI 拒绝分享 GPT-4 技术细节的做法异曲同工;
· 普通观众一边观看着《秘密入侵》,一边又在现实里经历“秘密入侵”,剧集中的人类救世主是尼克·福瑞以及一众超级英雄,那现实里呢?
这可能是 2023 年最有趣的文化/技术事件了。
评论