去搜搜
头像
揭密大模型巨额融资的幕后细节|AI内参
2023-07-06 19:27

揭密大模型巨额融资的幕后细节|AI内参

文章所属专栏 全球科技纵览·趋势必读 第二季
释放双眼,听听看~
00:00 06:32

作者|赵赛坡

头图|视觉中国


本期首先聚焦大模型市场的融资情况,两笔巨额融资的背后有哪些显著特点,这些特点又将如何影响这个市场的发展,本期会提供几个思考方向。


微软发布 Azure OpenAI 服务更新、Azure 营收规模遭受质疑以及云服务商面临的地缘政治压力等,也是本期讨论的议题。


与此同时,本期还将关注英伟达面临 AMD 的芯片挑战、AI 创业公司对数据的贪婪、围绕 AI 监管的不同声音等。


接下来,欢迎和我一起复盘近期围绕计算与智能的关键产业事件。


大模型·市场


过去一周,大模型市场依然充满了“金钱”的味道。先看两笔巨额融资:


· 大模型服务商 Inflection 获得 13 亿美元融资,距离该公司推出自己的聊天对话产品 Pi 刚刚过去了两个月;


· 文本转图像创业公司 Runway 宣布以 1.41 亿美元完成 C+轮融资;


这两笔投资极具市场代表性。其一,一如我在之前几期 AI内参 里所言,“寻找下一个 OpenAI”会成为资本市场的一个重要投资方向,此前 Cohere、Anthropic 等明星创业公司,以及这次获得 13 亿美元融资的 Inflection,都在这个赛道上。



Inflection 最近刚刚发布了自己的大模型产品 Inflection 1,根据官网介绍,这是一个可媲美甚至超越 GPT-3.5 的基础大模型。这家公司也表示,未来将继续推出比肩 GPT-4 的基础大模型。


其二,来自科技巨头公司的支持成为目前众多创业公司的资金来源,仔细去看这两笔投资的投资方:


· Inflection:微软、英伟达;


· RunWay:Google、英伟达、Salesforce;


这些科技巨头对于生成式 AI 公司的投资,并不像传统 VC 那样仅仅开出支票、派高管加入董事会这么简单,常常会将自身的业务与创业公司进行绑定,比较有代表性的就是微软此前投资 OpenAI,在真金白银之外,还为 OpenAI 提供了 Azure 云服务上的算力支持。


类似地,在 Inflection 公司发展的过程里,英伟达的作用功不可没。福布斯的报道称,英伟达和 CoreWeave 合作,为 Inflection 公司开发了适用于大模型训练的 H100 GPU 计算集群,并在近期完成了相关测试,能够大幅缩短训练 GPT-3 参数规模的大模型时间。


通过与这些提供算力(芯片服务商)、云服务的科技巨头合作,创业公司技能大幅减少创建基础模型的时间,还能利用海量的云上资源,快速部署、上线自己的产品;而在科技巨头的“算盘”里,押注一个新赛道或许比赌注一家创业公司更有战略意义,比如英伟达的投资策略,与其说是追求从创业公司获得回报率,倒不如说是在构建一个个 GPU 能力展示的“样板间”,在不断推动市场火热的同时,最终让包括 A100、H100 在内的一众芯片卖得更好。


其三,大额融资或收购的交易才刚刚开始。Box 公司创始人 Aaron Levie 在 Databricks 公司以 13 亿美元收购生成式 AI 创业公司 MosaicML 时说了一个词:这是一笔“instagram 并购”。


这意味着,随着生成式 AI 技术的快速迭代与应用场景的扩大,市场会出现越来越多的并购交易,通过收购,一家公司可快速获取创业公司的人才、技术以及潜在客户资源,从而加速公司战略的转移。


更进一步来看,当下这个阶段还处在大模型或其他生成式 AI 发展的早期阶段,接下来,无论是训练出更高效的模型,还是像 OpenAI 那样发布面向 C 端的产品,抑或是推出基于 SaaS 的 API 服务,所有这些都需要巨额的资金支持。


而在大型科技创业公司(比如 Databricks)并购 AI 创业公司、科技巨头投资 AI 公司的影响下,我们有理由相信会有更多的传统的资本会加入其中,比如不甘寂寞的软银,一起将这个市场做大(泡沫吹爆)


来看一组近期值得关注的融资/并购案例:


· 美团以 20.65 亿人民币收购 AI 创业公司“光年之外”,这笔交易在商业层面可谈的东西很少,更多还是两家公司所有者、股东们的一次“内部交易”;


· 医疗影像技术创业公司 Flywheel 完成 5400 万美元的 D 轮融资,英伟达的投资部门也参与了此次投资;


另外对于中国大模型的市场,科技部在一份《中国人工智能大模型地图研究报告》里给出了几个线索:


· 据不完全统计,截至目前,参数在 10 亿规模以上的大模型已发布了 79 个;


· 中国已有 14 个省区市在开展大模型研发,主要集中在北京和广东,其中北京 38 个、广东 20 个;


· 中国有超过半数的大模型实现开源,北京、广东、上海三地在开源数量和开源影响力方面均居国内前三,高校及科研机构是开源主力。


这个市场接下来的惨烈程度会超过很多人的想象。


大模型·巨头


微软。微软上周发布 Azure OpenAI 服务的更新,支持了此前 OpenAI 发布的 GPT-35-Turbo 模型新版本以及全新的 GPT-35-Turbo-16k 版本等。


对于绝大多数中国用户来说,付费使用 OpenAI API 的门槛很高,相比而言,借助微软 Azure 使用 OpenAI API 不失为一个不错的替代选择,付费非常方便,直接绑定信用卡(支持银联)即可,而且价格和 OpenAI 完全一样。


与此同时,微软也披露了客户在使用 Azure 模型服务时的数据隐私政策,几个要点:


· 微软永远不会将客户的数据用于训练 OpenAI 的模型,也不会提供给第三方;


· 微软不会将客户训练模型的数据用于改善微软产品;


不过还要提醒两点:


· 微软有权对客户提交的提示词进行审核,包括机器和人工审核;


· 微软会将客户生成的数据保存 30 天,然后再删除,客户也可以申请微软及时删除;


对微软而言,近期还有一个报道引发市场关注,付费媒体 Information 援引一份法庭文件显示,在 2022 年 6 月期间,微软 Azure 业务营收为 340 亿美元,同期 AWS 的营收是 720 亿美元。


长期以来,微软一直不披露 Azure 公有云业务的营收规模,而是将 Azure 和其他云相关的业务——包括 Windows 服务器业务、数据库业务等——整合组成一个名为“智能云”的业务部门,上一季度营收 220.8 亿美元,同比增长 16%。



外界对于 Azure 营收规模和市场占有率有不同的看法,一般都会以 AWS 作为基点,以 80% 左右的比例计算 Azure 的市场份额或营收,比如咨询公司 Synergy 最新的数据显示,AWS 在全球云基础设施服务市场占据 32% 的市场份额,位居第二的 Azure 为 23%,但在这份文件里,Azure 的营收只有 AWS 47% 的样子,的确很出人意料。


目前微软尚未就此做出回应。但对于资本市场而言,他们可以忽视微软过往在云计算领域的地位,因为在面向生成式 AI 的赛道,微软以及 Azure 的确拥有不小的先发优势,通过整合 OpenAI 各类模型到 Azure 认知产品体系里,微软构建起了一个独家渠道,如果企业希望以符合企业级产品需求的方式使用 OpenAI 的各类大模型,Azure 是目前唯一且最好的选择。


从这个角度去看,接下来两个季度微软的财报数字非常值得期待,这不仅是微软再一次全面押注 AI 的成绩展示,也是一份 OpenAI 各类模型落地企业级市场的成绩单。


与此同时,在大模型领域,摆在 AWS 和 Azure 的另一个挑战是地缘政治的影响。WSJ 本周继续报道了美国政府正在酝酿的一项云服务限售令。一旦这项行政命令被通过,AWS 和 Azure 必须首先得到美国商务部同意,才能为中国客户提供高端 GPU——比如英伟达 A100——计算实例。


这项正在酝酿的行政命令被认为是美国芯片限售令的升级版,但此举也势必影响到 AWS 和 Azure 的在华业务,两家公司在华都拥有一定的客户群体。而更重要的是,中国大模型市场正处于爆发阶段,“缺卡”但不缺钱的现状迫使各个创业公司寻找一切可替代方案,基于云服务获取 GPU 算力的灵活性俨然成为共识,由此带来可能是双输的结果。


沿着 AI 芯片的议题,上周被 Databricks 收购的生成式 AI 创业公司 MosaicML 发布了一份芯片性能测试,该公司选择 AMD 和英伟达上一代旗舰芯片 MI250 和 A100 作为测试对象,这两款芯片目前在市场上也处于供不应求状态。MosaicML 公司发现,AMD 的这款芯片可以达到英伟达 A00 80% 的性能。


这份测试结果其实也是对市场需求的精准回应,在 ChatGPT 为代表的大模型浪潮下,英伟达——这个“镇上唯一的卖铲人”——成为资本市场、各大公司追逐的对象,英伟达市值已经稳稳进入“1 万亿美元俱乐部”,而巨大的芯片需求还需要时间进行消化,市场上急需一些可能的替代品或挑战者,AMD 成为最有可能的一家公司。


结合 MosaicML 的测试来看,软件层面的进步成为 AMD 芯片性能提升的关键,这也凸显出 AI 芯片的竞争正在从硬件全面转向软件与生态。


关注一组科技巨头最近的动向:


· 阿里云与西门子达成战略合作协议,双方将在大模型领域展开合作,“通义大模型”将在西门子的Xcelerator 平台进行落地实践;


· 华为云和天眼查合作发布了基于大语言模型的“天眼妹”可信商业助理,产品已完成内部测试,预计将在本月底向客户提供有限试用;


· OpenAI 上周正式宣布将在伦敦设立办公室,并已开始新员工招聘,首批四个职位包括安全工程师和与政府进行沟通的负责人等;


· IBM 上周以 46 亿美元的价格收购 Vista 公司的 Apptio 平台,这笔收购将帮助 IBM 完善其在混合云业务的布局,并且可以获得 Apptio 上的重要客户。


大模型·争议


伊隆·马斯克上周批评人工智能公司对 Twitter 数据“过度爬取”导致这家社交媒体不得不“限制包括付费用户在内的所有人访问”,这个说法当然不可能是事情的全部——有媒体披露 Twitter 因为未完成从 Google Cloud 的数据迁移,导致访问压力巨大,因此需要限制用户范围。无论真相是哪一种,也从另一个侧面展现出当下这批 AI 公司对于数据的“贪婪”。


只有将海量、优质的数据“喂给”大模型,才有可能训练出一个可用的模型服务,这已然成为行业共识。而ChatGPT 等大模型的快速走红,极大刺激了各类大小 AI 公司对数据的爬取行为——无论合法或非法,由此也掀起了一场不大不小的“蝴蝶效应”,比如 Twitter、Reddit 大幅提升 API 调用价格,不仅赚了这些 AI 公司的钱,也客观上“杀死”了一个存在多年的第三方应用生态,大量基于上述公司 API 的第三方应用只能关门大吉。


其次,对于包括 OpenAI 在内的各类大模型公司,在抓取互联网上的海量数据进行模型训练时,是否侵犯到发表这些言论的用户的权利?这构成了近期一项对 OpenAI 集体诉讼的争论点,其判决结果势必会对产业发展产生巨大影响。


上周,大约 150 欧洲公司——包括西门子、喜力、空客——联合发表一份公开信,抗议欧盟 AI 监管方案可能导致损害欧洲企业的竞争力。关于这份公开信的内容我不做过多评价,此举更多还是一场关于政策走向的公开游说行为,也凸显出 AI 监管政策的复杂性,有序发展与抑制创新之间的距离,可能非常短。


接着谈监管,《财富》记者 Jeremy Kahn 在一封邮件通讯里谈到微软对于欧洲 AI 监管机构的游说。借助欧洲媒体,微软总裁 Brad Smith 希望借鉴航空业监管的模式构建起 AI 监管模式,同时,Brad Smith 还使用汽车驾照、发动机等隐喻类比大模型,Jeremy Kahn 这段话是对政治游说的最好总结(由 GPT-4 翻译)


政治斗争取决于叙事方式的胜负。若能讲述比对手更好的故事,很可能会获胜。构建框架至关重要,这意味着选择正确的隐喻或类比可能至关重要。

本内容未经允许禁止转载,如需授权请微信联系妙投小虎哥:miaotou515
如对本稿件有异议或投诉,请联系tougao@huxiu.com
评论
0/500 妙投用户社区交流公约
最新评论
这里空空如也,期待你的发声