去搜搜
头像
围绕大模型创业的挑战|AI内参
2023-09-05 12:14

围绕大模型创业的挑战|AI内参

文章所属专栏 全球科技纵览·趋势必读 第二季
释放双眼,听听看~
00:00 14:05

作者|赵赛坡

头图|视觉中国


  • “计算”专栏聚焦 ARM IPO 最新动态、英伟达无法向中东提供最新芯片、越南半导体产业现状等。


  • “巨头”部分,以百度文心一言为例,探讨中国近期一批获准提供公共服务的消费市场大模型应用的意义,Google Cloud Next 大会也是该部分关注的焦点。


  • “市场”专栏里,透过 OpenAI 的商业模式以及成本变化,着重讨论围绕大模型创业的巨大挑战。


接下来,欢迎和我一起复盘近期围绕数据与智能的产业关键事件。


计算


继续关注 ARM 的最新动态。路透社上周的独家报道指出,ARM 首次公开募股的估值会在 500 亿到 550 亿美元之间。


多位消息人士称,包括苹果、英伟达、Alphabet、AMD 在内的多家科技巨头已同意成为战略投资者,三星、英特尔、Synopsys 公司也位列其中,这些战略投资者将认购 2500 万至 1 亿美元不等的股票。


尽管还有一些潜在的投资者依然在谈判,但已经有明确消息称,亚马逊将不参与认购 ARM 的行动。

我曾在此前的 AI Insider 里谈到过 ARM IPO 的机遇与挑战(详见第 179 期 AI Insider,结合目前这份 ARM 的战略投资者列表来看,它几乎囊括了美国主要科技公司,尽管 战略投资不会让这些公司进入 ARM 董事会或具备战略决策能力,但会加强各个公司与 ARM 的联系,同时也能抑制竞争对手的优势。


上周,DeepMind 创始人之一的 Mustafa Suleyman 公开呼吁,鉴于计算能力已经成为大模型发展与迭代的关键,美国政府应该限制英伟达芯片的销售,以此来控制哪些国家应该“安全”和“有道德”地发展大模型或者人工智能。


Mustafa Suleyman 的这番表态也和英伟达披露的一则信息形成呼应,根据这份英伟达发给投资者的备忘录,英伟达明确表示中东部分地区已无法获得该公司最新的 A100 和 H100 芯片,文件并未具体透露到底是哪些国家或地区无法购买,只是强调该限制不会影响英伟达的营收。文件称,“我们正在与美国政府合作解决这一问题”。



路透社援引消息人士的话称,英伟达的竞争对手 AMD 也收到了类似限制的通知函,并补充说此举对其收入没有实质性影响。


而美国商务部的回应是,美国“没有阻止向中东地区销售芯片”,但拒绝就是否对特定美国公司实施新要求发表评论。


此前,包括沙特、阿联酋在内的中东国家疯狂采购英伟达芯片,这些中东国家一方面不想在大语言模型的竞争中落伍,更重要的一点在于,大语言模型的应用场景需要考虑语言、地区的限制,这在中东国家尤为重要。


比如阿联酋上周发布的开源大模型 Jais,就是一个使用阿拉伯语与英语训练出来的模型。“大多数大语言模型都以英语为中心,而阿拉伯语是世界上最大的语言之一,为什么阿拉伯语社区不应该拥有一个大语言模型”,一位参与该项目的阿联酋技术人员的话最具代表性


Jais 模型由阿联酋技术公司 G42(一家与王室关系密切的公司)、MBZUAI 大学与总部位于加州的 AI 公司 Cerebras 共同合作而成,根据MBZUAI 大学一位教授的话,相比大多数以美国为中心的模型,Jais 能够更准确地理解中东地区的文化和背景,并且确保 Jais 在“文化和宗教敏感问题上不会越界”。


接着看半导体的地缘政治。美国总统拜登即将在本月访问越南,白宫表示,愿意借助此次访问助推越南提升芯片产能。


抛开此举对于中国的影响如何,仅从越南在全球半导体产业链的地位来看,有几个值得关注的趋势。


  • 其一,越南目前每年对美国的半导体出口已经超过 5 亿美元,业务主要集中在组装、封装和测试阶段,这和中国所处的产业链基本一致,但中越之间差距极大。


  • 其二,越南目前吸引到多家美国芯片公司,比如英特尔在越南南部已经运营 15 年,另一家公司 Amkor 计划在河内建造新工厂。


  • 其三,作为稀土储量仅次于中国的国家,越南可能会在半导体产业链中获得更大话语权。


  • 其四,美国芯片法案带来的补贴,可能促使部分美国公司在越南扩大产能,但技术人员不足会成为困扰当地半导体产业发展的重要障碍。


巨头


百度。上周,包括百度文心一言在内的 8 家商业公司和学术机构的类 ChatGPT 服务通过中国监管部门的批准,正式向公众提供服务。


资本市场的反应最直接,以百度为例,百度美股当地时间周三上涨 4%,周四港股中的百度也一度大涨 5%。


消费者也很积极。根据百度官方给出的数据,仅仅用了不到 12 个小时,百度“文心一言”成为苹果 App Store 中国区免费应用第一,这也是首个登顶 App Store 榜首的中文 AI 原生应用。


官方认可、资本市场响应与消费者的热情,构成了 2023 年 8 月最后一天中国大模型市场的三大关键词,如何理解文心一言等首批上线应用们带给中国大模型市场的意义,我觉得有几个值得关注的方面。


其一,消费级大模型应用的重要性不言而喻,去年 11 月横空出世的 ChatGPT,尽管在技术层面并没有太多真正意义的创新,但展示了利用高质量训练数据叠加用户交互反馈后的巨大威力。由此也形成了一个看似简单但实用的闭环:用户越使用它、它的训练数据越多、模型输出的结果越符合用户需求、用户使用次数继续增加。



这构成了消费市场大模型应用的两重价值:


  • 快速占领用户心智,让用户适应大模型的交互模式与使用逻辑;

  • 构建海量、高效的数据反馈机制,进一步提升模型能力。


由此也不难理解,为何消费市场大模型应用呈现出如此激烈的竞争态势:微软快速整合 ChatGPT 打造出新 Bing、Google 同时押宝 Bard 和 SGE 等大模型相关应用、苹果会因为迟迟不发布相关应用而屡屡受到华尔街分析师与科技媒体的质疑、百度文心一言快速上线不断迭代,无不是这样的逻辑。


其二,中国需要自己的大模型产品,这是包括文心一言等中国公司的巨大机会,这其中,百度在 AI 技术领域的长期积累,横跨芯片到语言技术等多个维度,再加上其拥有中文世界最大的搜索引擎,能够为大模型的持续增长提供足够的“燃料”,这也构成资本市场为其投票的关键因素。


与此同时,大模型应用极度“烧钱”的事实也在拉高竞争门槛,过去两个月密集的财报发布期间,我曾谈过诸如微软、百度、Google(Alphabet)等公司的“基本盘”逐渐复苏并恢复增长,这对各家公司接下来持续投入大模型研发具有重大意义。


而且谁的内部技术、产品整合能力最强,谁就能进一步降低大模型的运维成本,毕竟,谁也不想和 OpenAI 那样,承担每天 70 万美元的运维压力,这对于过去几年持续投入芯片、框架、模型的百度而言,无疑会是一个机会。


其三,随着监管机构正式发布大模型应用名单,有望结束自今年 3 月份以来所谓“百模(型)或千模(型)大战”的混乱。监管部门批准的大模型名单成为一种新基准,无论消费者还是投资者,理论上都有一个“官方过滤器”,如果真是在国内要合法、合理使用大模型应用,就去这个名单里挑选公司吧。


Google。Google 面向企业客户的开发者大会 Google Cloud Next 2023 上周回归线下,几个关键的产品更新或升级:


  • 机器学习平台 Vertex AI 升级,增加了大量新模型的支持,包括 Meta 的开源模型 Code Llama、Llama 2、Anthropic 的 Claude 2 等,同时 Google 还更新了内部研发的 PaLM,能够在分析文档的场景下提供 32000 个字符的上下文窗口能力;


  • Duet AI 正式与 Google Cloud 整合,此前 Duet AI 主要应用在 Workspace 产品上,此番整合,会为客户提供“专家编码器、软件可靠性工程师、数据库专家、专家数据分析师和网络安全顾问”(Google 宣传语),目前该产品处于预览测试阶段;


  • 展示新一代云端芯片 (TPU)v5e,这是一款在成本、功能和扩展层面具有一定特点的 AI 芯片。具体到成本,根据 Google 的说法,与上一代 TPU v4相比,新产品在每 1 美元的维度上,模型训练性能提升两倍,推理性能提升最高 2.5 倍;


  • 继续加强与英伟达的合作,两家公司还联合发布了基于 H100 的 A3 云服务器实例,满足不同客户对于 AI 计算的需求;


值得一提的是,Google Cloud 也是目前云计算市场增长最快的公司,上一季度营收80.31 亿美元,同比增长 28%,增速高于 AWS(12%)、微软(智能云 15%、Azure 业务 26%)、阿里云(4%)


市场


OpenAI 上周发布面向企业的 ChatGPT 服务,基于 GPT-4 的技术能力,结合企业的数据,提供更安全、可定制性与快速的大模型服务,目前 OpenAI 的商业模式包括:


  • 面向普通者:提供免费和付费版本的 ChatGPT 服务,付费版本的价格为 20 美元/月;


  • 面向开发者或企业:提供付费 API 调用服务,价格根据不同模型以及使用情况略有不同,详细的价格表详见这里


  • 面向需求更多的企业:提供企业版,价格还未公布,有传闻是 25 美元/人/月;


与之相呼应的还有一组数字:


  • OpenAI 的每天的运维成本高达 70 万美元,消息可靠度一般,但可以作为一个参考;


  • 付费媒体 Information 和 Bloomberg称,OpenAI 目前的月收入为 8000 万美元,未来 12 个月的收入有望超过 10 亿美元。


  • 研究公司 TrendForce 指出,为了保证大模型的性能,OpenAI 今年需要再采购 3 万个英伟达 A100 GPU,如果以单个 3 万美元计算,仅 GPU 的采购成本就达到 10 亿美元。


上述数字凸显出一众大模型公司所面临的巨大财务压力,OpenAI 的商业模式几乎就是目前大模型公司所能想到的所有可能方案,即便如此,你也会发现 OpenAI 依然无法实现收支平衡,而 OpenAI 推出 ChatGPT 企业版,事实上也会形成与微软 Azure 相关产品的竞争关系,这会成为后续一个非常微妙的观察角度。



财务压力也体现在创业公司的融资速度和金额上:


  • Anthropic 在筹集 4.5 亿美元后仅三个月就融资 1 亿美元,Google 参与投资;


  • 今年 6 月,Inflection AI 完成 13 亿美元,微软、英伟达参与投资;


  • 以色列大模型公司 AI21 Lab 刚刚获得 1.55 亿美元的融资,Google、英伟达都参与了投资;


如果再加上 OpenAI 从微软那里获得 100 亿美元融资,你会发现创业公司的投资人里,越来越多出现科技巨头的影子。


科技巨头对于生成式 AI 公司的投资,并不像传统 VC 那样仅仅开出支票、派高管加入董事会这么简单,常常会将自身的业务与创业公司进行绑定,比较有代表性的就是微软此前投资 OpenAI,在真金白银之外,还为 OpenAI 提供了 Azure 云服务上的算力支持。


通过与这些提供算力(芯片服务商)、云服务的科技巨头合作,创业公司技能大幅减少创建基础模型的时间,还能利用海量的云上资源,快速部署、上线自己的产品;而在科技巨头的“算盘”里,押注一个新赛道或许比赌注一家创业公司更有战略意义,比如英伟达的投资策略,与其说是追求从创业公司获得回报率,倒不如说是在构建一个个 GPU 能力展示的“样板间”,在不断推动市场火热的同时,最终让包括 A100、H100 在内的一众芯片卖得更好。


关于市场对 OpenAI 等生成式 AI 公司的复杂情绪,上周 WSJ 的一篇特写非常详细,大手笔的投钱背后,投资机构也在焦急地等待一家可以“真正跑出来”的生成式 AI 公司,或者等待科技巨头们释放一些技术或产品方面的利好消息,“有大量的风险投资宣传‘关于人工智能的投资潜力’,这是毫无疑问的乐观情绪,而忽视关于产品、用户界面、分销或终端市场的任何艰难问题”,一位投资人看得很明白。


最后再看一组市场上“钱的流向”:


  • 英属加勒比小岛安圭拉Anguilla的国家顶级域名“ai”成为科技公司争抢的对象,安圭拉预计 2023 年通过域名注册费获得高达 3000万美元的收入;


  • 云计算公司 CoreWeave 正在谋求新一轮融资,估值会在 50 亿——80 亿美元之间,该公司与英伟达有着密切的合作。今年已经获得 4.21 亿美元的融资,英伟达也是投资人之一;


  • 提供数据分析工具的 DataBricks 也在计划新一轮融资,预计该轮融资将把公司估值推高到 430 亿美元,如果 ARM IPO 成功,下一个冲击 IPO 的“超级独角兽”公司可能就是 Databricks。

本内容未经允许禁止转载,如需授权请微信联系妙投小虎哥:miaotou515
如对本稿件有异议或投诉,请联系tougao@huxiu.com
评论
0/500 妙投用户社区交流公约
最新评论
这里空空如也,期待你的发声