揭密大模型巨额融资的幕后细节｜AI内参

作者｜赵赛坡

头图｜视觉中国

本期首先聚焦大模型市场的融资情况，两笔巨额融资的背后有哪些显著特点，这些特点又将如何影响这个市场的发展，本期会提供几个思考方向。

微软发布 Azure OpenAI 服务更新、Azure 营收规模遭受质疑以及云服务商面临的地缘政治压力等，也是本期讨论的议题。

与此同时，本期还将关注英伟达面临 AMD 的芯片挑战、AI 创业公司对数据的贪婪、围绕 AI 监管的不同声音等。

接下来，欢迎和我一起复盘近期围绕计算与智能的关键产业事件。

大模型·市场

过去一周，大模型市场依然充满了“金钱”的味道。先看两笔巨额融资：

· 大模型服务商 Inflection 获得 13 亿美元融资，距离该公司推出自己的聊天对话产品 Pi 刚刚过去了两个月；

· 文本转图像创业公司 Runway 宣布以 1.41 亿美元完成 C+轮融资；

这两笔投资极具市场代表性。其一，一如我在之前几期 AI内参里所言，“寻找下一个 OpenAI”会成为资本市场的一个重要投资方向，此前 Cohere、Anthropic 等明星创业公司，以及这次获得 13 亿美元融资的 Inflection，都在这个赛道上。

Inflection 最近刚刚发布了自己的大模型产品 Inflection 1，根据官网介绍，这是一个可媲美甚至超越 GPT-3.5 的基础大模型。这家公司也表示，未来将继续推出比肩 GPT-4 的基础大模型。

其二，来自科技巨头公司的支持成为目前众多创业公司的资金来源，仔细去看这两笔投资的投资方：

· Inflection：微软、英伟达；

· RunWay：Google、英伟达、Salesforce；

这些科技巨头对于生成式 AI 公司的投资，并不像传统 VC 那样仅仅开出支票、派高管加入董事会这么简单，常常会将自身的业务与创业公司进行绑定，比较有代表性的就是微软此前投资 OpenAI，在真金白银之外，还为 OpenAI 提供了 Azure 云服务上的算力支持。

类似地，在 Inflection 公司发展的过程里，英伟达的作用功不可没。福布斯的报道称，英伟达和 CoreWeave 合作，为 Inflection 公司开发了适用于大模型训练的 H100 GPU 计算集群，并在近期完成了相关测试，能够大幅缩短训练 GPT-3 参数规模的大模型时间。

通过与这些提供算力（芯片服务商）、云服务的科技巨头合作，创业公司技能大幅减少创建基础模型的时间，还能利用海量的云上资源，快速部署、上线自己的产品；而在科技巨头的“算盘”里，押注一个新赛道或许比赌注一家创业公司更有战略意义，比如英伟达的投资策略，与其说是追求从创业公司获得回报率，倒不如说是在构建一个个 GPU 能力展示的“样板间”，在不断推动市场火热的同时，最终让包括 A100、H100 在内的一众芯片卖得更好。

其三，大额融资或收购的交易才刚刚开始。Box 公司创始人 Aaron Levie 在 Databricks 公司以 13 亿美元收购生成式 AI 创业公司 MosaicML 时说了一个词：这是一笔“instagram 并购”。

这意味着，随着生成式 AI 技术的快速迭代与应用场景的扩大，市场会出现越来越多的并购交易，通过收购，一家公司可快速获取创业公司的人才、技术以及潜在客户资源，从而加速公司战略的转移。

更进一步来看，当下这个阶段还处在大模型或其他生成式 AI 发展的早期阶段，接下来，无论是训练出更高效的模型，还是像 OpenAI 那样发布面向 C 端的产品，抑或是推出基于 SaaS 的 API 服务，所有这些都需要巨额的资金支持。

而在大型科技创业公司（比如 Databricks）并购 AI 创业公司、科技巨头投资 AI 公司的影响下，我们有理由相信会有更多的传统的资本会加入其中，比如不甘寂寞的软银，一起将这个市场做大（泡沫吹爆）。

来看一组近期值得关注的融资/并购案例：

· 美团以 20.65 亿人民币收购 AI 创业公司“光年之外”，这笔交易在商业层面可谈的东西很少，更多还是两家公司所有者、股东们的一次“内部交易”；

· 医疗影像技术创业公司 Flywheel 完成 5400 万美元的 D 轮融资，英伟达的投资部门也参与了此次投资；

另外对于中国大模型的市场，科技部在一份《中国人工智能大模型地图研究报告》里给出了几个线索：

· 据不完全统计，截至目前，参数在 10 亿规模以上的大模型已发布了 79 个；

· 中国已有 14 个省区市在开展大模型研发，主要集中在北京和广东，其中北京 38 个、广东 20 个；

· 中国有超过半数的大模型实现开源，北京、广东、上海三地在开源数量和开源影响力方面均居国内前三，高校及科研机构是开源主力。

这个市场接下来的惨烈程度会超过很多人的想象。

大模型·巨头

微软。微软上周发布 Azure OpenAI 服务的更新，支持了此前 OpenAI 发布的 GPT-35-Turbo 模型新版本以及全新的 GPT-35-Turbo-16k 版本等。

对于绝大多数中国用户来说，付费使用 OpenAI API 的门槛很高，相比而言，借助微软 Azure 使用 OpenAI API 不失为一个不错的替代选择，付费非常方便，直接绑定信用卡（支持银联）即可，而且价格和 OpenAI 完全一样。

与此同时，微软也披露了客户在使用 Azure 模型服务时的数据隐私政策，几个要点：

· 微软永远不会将客户的数据用于训练 OpenAI 的模型，也不会提供给第三方；

· 微软不会将客户训练模型的数据用于改善微软产品；

不过还要提醒两点：

· 微软有权对客户提交的提示词进行审核，包括机器和人工审核；

· 微软会将客户生成的数据保存 30 天，然后再删除，客户也可以申请微软及时删除；

对微软而言，近期还有一个报道引发市场关注，付费媒体 Information 援引一份法庭文件显示，在 2022 年 6 月期间，微软 Azure 业务营收为 340 亿美元，同期 AWS 的营收是 720 亿美元。

长期以来，微软一直不披露 Azure 公有云业务的营收规模，而是将 Azure 和其他云相关的业务——包括 Windows 服务器业务、数据库业务等——整合组成一个名为“智能云”的业务部门，上一季度营收 220.8 亿美元，同比增长 16%。

外界对于 Azure 营收规模和市场占有率有不同的看法，一般都会以 AWS 作为基点，以 80% 左右的比例计算 Azure 的市场份额或营收，比如咨询公司 Synergy 最新的数据显示，AWS 在全球云基础设施服务市场占据 32% 的市场份额，位居第二的 Azure 为 23%，但在这份文件里，Azure 的营收只有 AWS 47% 的样子，的确很出人意料。

目前微软尚未就此做出回应。但对于资本市场而言，他们可以忽视微软过往在云计算领域的地位，因为在面向生成式 AI 的赛道，微软以及 Azure 的确拥有不小的先发优势，通过整合 OpenAI 各类模型到 Azure 认知产品体系里，微软构建起了一个独家渠道，如果企业希望以符合企业级产品需求的方式使用 OpenAI 的各类大模型，Azure 是目前唯一且最好的选择。

从这个角度去看，接下来两个季度微软的财报数字非常值得期待，这不仅是微软再一次全面押注 AI 的成绩展示，也是一份 OpenAI 各类模型落地企业级市场的成绩单。

与此同时，在大模型领域，摆在 AWS 和 Azure 的另一个挑战是地缘政治的影响。WSJ 本周继续报道了美国政府正在酝酿的一项云服务限售令。一旦这项行政命令被通过，AWS 和 Azure 必须首先得到美国商务部同意，才能为中国客户提供高端 GPU——比如英伟达 A100——计算实例。

这项正在酝酿的行政命令被认为是美国芯片限售令的升级版，但此举也势必影响到 AWS 和 Azure 的在华业务，两家公司在华都拥有一定的客户群体。而更重要的是，中国大模型市场正处于爆发阶段，“缺卡”但不缺钱的现状迫使各个创业公司寻找一切可替代方案，基于云服务获取 GPU 算力的灵活性俨然成为共识，由此带来可能是双输的结果。

沿着 AI 芯片的议题，上周被 Databricks 收购的生成式 AI 创业公司 MosaicML 发布了一份芯片性能测试，该公司选择 AMD 和英伟达上一代旗舰芯片 MI250 和 A100 作为测试对象，这两款芯片目前在市场上也处于供不应求状态。MosaicML 公司发现，AMD 的这款芯片可以达到英伟达 A00 80% 的性能。

这份测试结果其实也是对市场需求的精准回应，在 ChatGPT 为代表的大模型浪潮下，英伟达——这个“镇上唯一的卖铲人”——成为资本市场、各大公司追逐的对象，英伟达市值已经稳稳进入“1 万亿美元俱乐部”，而巨大的芯片需求还需要时间进行消化，市场上急需一些可能的替代品或挑战者，AMD 成为最有可能的一家公司。

结合 MosaicML 的测试来看，软件层面的进步成为 AMD 芯片性能提升的关键，这也凸显出 AI 芯片的竞争正在从硬件全面转向软件与生态。

关注一组科技巨头最近的动向：

· 阿里云与西门子达成战略合作协议，双方将在大模型领域展开合作，“通义大模型”将在西门子的Xcelerator 平台进行落地实践；

· 华为云和天眼查合作发布了基于大语言模型的“天眼妹”可信商业助理，产品已完成内部测试，预计将在本月底向客户提供有限试用；

· OpenAI 上周正式宣布将在伦敦设立办公室，并已开始新员工招聘，首批四个职位包括安全工程师和与政府进行沟通的负责人等；

· IBM 上周以 46 亿美元的价格收购 Vista 公司的 Apptio 平台，这笔收购将帮助 IBM 完善其在混合云业务的布局，并且可以获得 Apptio 上的重要客户。

大模型·争议

伊隆·马斯克上周批评人工智能公司对 Twitter 数据“过度爬取”导致这家社交媒体不得不“限制包括付费用户在内的所有人访问”，这个说法当然不可能是事情的全部——有媒体披露 Twitter 因为未完成从 Google Cloud 的数据迁移，导致访问压力巨大，因此需要限制用户范围。无论真相是哪一种，也从另一个侧面展现出当下这批 AI 公司对于数据的“贪婪”。

只有将海量、优质的数据“喂给”大模型，才有可能训练出一个可用的模型服务，这已然成为行业共识。而ChatGPT 等大模型的快速走红，极大刺激了各类大小 AI 公司对数据的爬取行为——无论合法或非法，由此也掀起了一场不大不小的“蝴蝶效应”，比如 Twitter、Reddit 大幅提升 API 调用价格，不仅赚了这些 AI 公司的钱，也客观上“杀死”了一个存在多年的第三方应用生态，大量基于上述公司 API 的第三方应用只能关门大吉。

其次，对于包括 OpenAI 在内的各类大模型公司，在抓取互联网上的海量数据进行模型训练时，是否侵犯到发表这些言论的用户的权利？这构成了近期一项对 OpenAI 集体诉讼的争论点，其判决结果势必会对产业发展产生巨大影响。

上周，大约 150 欧洲公司——包括西门子、喜力、空客——联合发表一份公开信，抗议欧盟 AI 监管方案可能导致损害欧洲企业的竞争力。关于这份公开信的内容我不做过多评价，此举更多还是一场关于政策走向的公开游说行为，也凸显出 AI 监管政策的复杂性，有序发展与抑制创新之间的距离，可能非常短。

接着谈监管，《财富》记者 Jeremy Kahn 在一封邮件通讯里谈到微软对于欧洲 AI 监管机构的游说。借助欧洲媒体，微软总裁 Brad Smith 希望借鉴航空业监管的模式构建起 AI 监管模式，同时，Brad Smith 还使用汽车驾照、发动机等隐喻类比大模型，Jeremy Kahn 这段话是对政治游说的最好总结（由 GPT-4 翻译）：

政治斗争取决于叙事方式的胜负。若能讲述比对手更好的故事，很可能会获胜。构建框架至关重要，这意味着选择正确的隐喻或类比可能至关重要。

评论

最新评论