作者 | 赵赛坡
头图 | 视觉中国
本期专栏首先从英伟达暴涨的股价谈起,探讨 AI 芯片市场的不均衡,为何英伟达和高通所受到的市场待遇如此不同。
本期还将关注:
欧洲创业公司对于大模型的创新;
VC 为何“惧怕”生成式 AI 带来的创新?
ChatGPT 在法律领域应用的尝试;
AWS 大模型产品的进展;
接下来,欢迎和我一起复盘近期围绕数据与智能的产业事件。
计算
就在英伟达上周发布下一季度营收乐观预期(110 亿美元 VS 72 亿美元)之后,市场很快给出了回应,下图是英伟达股价的涨幅曲线:
FT 一针见血地谈到,英伟达单日的市值涨幅相当于 1.7 个英特尔市值,这个说法略显刻薄,但指出了一个事实:在当下火热的大模型淘金竞赛里,英伟达是“这个镇上唯一的卖铲人”,此时不押注英伟达,又能押注谁呢?
WSJ 绘制的这张图,展现出在围绕芯片的热度有多么不均衡。
尽管包括 AMD、Marvell 在内的芯片公司今年已经有超过 50% 的涨幅,但和英伟达的增长相比,依然非常小。
另一个不均衡出现在两类不同的芯片市场:训练和推理。英伟达受追捧的根本原因是其强大的训练芯片,比如A100 和最新的 H100,英伟达的芯片被广泛应用在 OpenAI 训练 ChatGPT 的过程中,瑞银此前的预估是,OpenAI 使用了 10000 颗英伟达 A100 芯片训练 ChatGPT。
ChatGPT 的火热反过来也成为这些芯片的“代言人”,快速增长的需求极大刺激了英伟达数据中心业务的增长,本季营收 42.8 亿美元,同比增长 14%。我们有理由相信,英伟达下一季度 110 亿美元的预期收入里,将有相当一大部分的营收由数据中心贡献。
但还有一类推理芯片值得关注,这个领域最值得玩家包括高通、联发科以及苹果,你没看错,就是三家提供手机芯片的公司,这也凸显了推理芯片的一个困境:不同于英伟达 A100 等芯片可以单独售卖,推理芯片往往被集成到手机芯片里,也就是作为所谓 SOC 的一个模块。
鉴于苹果不会将芯片出售给其他公司使用,其实真正的玩家也就剩下了高通和联发科。就像 WSJ 那张图所示的格局一样,市场显然不会把高通看作是媲美英伟达的一类公司,即便高通可能拥有当下最完整的 AI 推理芯片(模块)的布局。
但需要提醒两点:
任何忽视设备——从 PC 到智能手机——侧 AI 能力的观点都是短视思维,现阶段我们能够使用各类大模型更像是巨头们的“慈善”,昂贵的训练芯片成本,会让包括 OpenAI 在内的模型提供商,不断思考如何将算力的下沉,PC 或手机上运行大模型的“美好未来”很快就会实现;
训练芯片和推理芯片是两个完全不同的市场,两个市场的“蛋糕”大小也不相同,英伟达还将继续享受训练芯片市场的巨大增长红利;而高通、联发科也会受益于推理芯片的发展,只是太过于细分的市场需求,也会影响两家公司的营收与利润。
大模型·市场
OpenAI CEO Sam Altman 近期前往欧洲,上周关于欧洲监管是否会影响该公司运营的表态引发诸多争议,当然,不管是欧洲监管机构还是英德法等主要国家,以及 OpenAI,谁也不会将事情推向死胡同,更多还是在讨价还价。
在欧洲,有众多企业,特别是中小企业参与到大模型的创新之中,这些公司面对欧盟地区严格的数据保护措施,提供了一些很有特点的解决方案:
德国创业公司 Xayn 利用改良的小模型,一定程度克服了大模型的成本难题,并且能够将模型快速迁移到移动设备上运行,兼顾了隐私和效率;
英国创业公司 Aligned AI 专注 AI 聊天机器人对于有害内容的理解和过滤,通过算法的优化,能够提供比 OpenAI 更好的过滤能力;
OpenAI 最近还有两个动作:
对于一些行业来说,大语言模型带来的是一种降维打击。本月初,在线教育公司 Chegg 表示,鉴于越来越多的学生开始使用 ChatGPT 等工具,极大影响了该公司的用户增长,无法为接下来的增长给出预期。
尽管 Chegg 称正在加快推出类 ChatGPT 的 CheggMate 产品,但正如一位分析师所指,或许还未等到 CheggMate 出现,Chegg 就已经失去用户关注了。
类似的情况可能会出现越来越多的领域,这也不难理解,为何众多风险投资公司开始针对自己投资的公司进行风险评估,Bloomberg 报道了包括红杉资本印度分公司在内的众多公司最近的一系列举措,包括但不限于鼓励投资的公司引入 AI 相关技术,并推动内部员工了解 AI 行业发展态势等。
硅谷风险投资巨头 a16z 更是面向公众发布了一份内部研究总结,这个名叫“AI Canon”的网页涵盖了截至目前众多关于大模型的技术分析与行业洞察,这是全面了解此次人工智能创新的最佳入门读物之一,非常值得收藏起来慢慢看。
法律行业曾被认为是最容易受到 ChatGPT 等技术影响的行业,最近一个案例集中展示了新技术与旧行业结合中的典型问题,NYT 的报道称,一位名叫施瓦茨的律师为当事人准备了一份 10 页的法律简报,援引数十个法律案例,但很快就被法官以及对方律师发现,这些案例很多都是假的。
根据这位律师的说法,他使用 ChatGPT 生成了这份简报,他也曾反复要求 ChatGPT 对自己生成的内容进行事实核查,而得到的结果都是正确,于是这位律师就相信了 ChatGPT 的说法。
正如纽约大学法律伦理学教授 Stephen Gillers 所言,律师们现在意识到,“不能把 ChatGPT 输出的结果粘贴到你的法律文件里”。
由此我们也有必要了解一下,ChatGPT 等大模型生成内容的基本逻辑,你可以将其理解为是一种文本预测程序。这类模型会根据上下文预测下一个单词(词语)是什么,它不会关心逻辑合理、事实准确等人类书面写作时最关键的要素。
大模型的优势在于,它拥有足够庞大的事实,能够以极快的预测速度,快速预测出一句话,以至于会让人误以为是在思考并写一句话。关于这一点,非常建议观看微软 Build 大会上的这个演讲。
大模型·产品
咨询公司皮尤近期公布了一份对美国人了解或使用 ChatGPT 的调查,得到的结论很有趣:
有 18% 的美国人“听过很多”关于 ChatGPT 的内容,将近一半的人(42%)完全不知道;
学历越高,对于 ChatGPT 的了解越充分,收入高低也遵循这个规律;
亚裔相比其他族群,更热衷了解 ChatGPT,高达 46% 的亚裔受访者表示“听过很多”,远高于白人(17%)、西班牙裔(20%)和非洲裔(14%);
更进一步的数据显示,只有 14% 的受访者真正使用过 ChatGPT。这些人里,也只有 14% 的人将其应用在学习新事物中,另外还有 19% 的人使用 ChatGPT 进行娱乐。
皮尤的这份调查至少说明了两个问题:其一,以 ChatGPT 为代表的大模型远没有达到真正影响人类工作与生活的地步,作为这个领域的从业者或观察者,我们很容易陷入“幸存者偏差”的谬误里;其二,如果从美国延伸到中国,普通人对大模型的认知与了解恐怕也不乐观,一位媒体同行坦言,这又是一个“五环里和五环外”的巨大认知鸿沟。
关注一组 AI 在众多行业应用的案例:
差不多一个半月前,AWS 发布了一系列面向大模型的产品布局,包括:
云上大模型调用平台 Bedrock,该平台集成了诸如以色列公司 AI21 实验室、OpenAI 直接竞争对手 Anthroic 以及 Stability AI 等公司的模型;
推出 AWS 自研的大模型 Titan 基础模型服务,目前可以通过 Bedrock 获取;
发布 CodeWhisperer,这是一个类似于 Github Copilot 的编程助手,现阶段免费;
我在当时的会员通讯里写道,“AWS 初步构建起了云计算公司应对大模型机遇和挑战的框架”。
但 Bloomberg 最近发现,一个半月过去了,AWS 的大模型产品似乎并没有真正交付给客户。
一方面,截至目前,AWS 大模型产品的客户案例只有一个:Coda 公司。Coda 公司创始人 Shishir Mehrotra 仅仅给出了“未完成”的评价,而其他对于亚马逊大模型产品感兴趣的客户,还在 Waitlist 里排队。
另一方面, 和微软、Google 各自拥有专注研究的子公司和团队不同,亚马逊长期以来并不关注基础研究,这也引发外界对于亚马逊以及 AWS 是否具有大模型相关技术能力的质疑。
不过在我看来,AWS 目前的交付困境并不会影响到其云计算的地位。企业市场的变化足够缓慢,特别是在成熟的欧美市场,任何一家在 AWS 上拥有海量云服务的企业,不会因为“大模型能力高低”而轻易迁移到其他云计算厂商。
其次,大模型以及生成式 AI 的应用还处于非常早期的阶段,从大企业 CEO 到小企业创始人乃至普通员工,还无法确定这些技术之于企业以及个体的实际价值;而在诸如金融、能源等一些重要领域,新技术带来的风险还有待评估,因此,大量企业客户会愿意再等等。
最后一点,AWS 所面临的挑战并非孤例,大模型相关技术将对云计算公司产生巨大影响。“模型即服务”的快速崛起,改变了云计算传统意义上的三大分层——基础设施、平台和软件,并推动过往已经出现在云计算公司中的各类“AI 平台服务”进一步细化,这会成为接下来云计算竞争的关键领域。
评论