作者|赵赛坡
头图|视觉中国
过去两周时间,围绕生成式 AI 产业链发生了或将影响深远的事件,本期将通过资金流向、产品动态、应用场景等多视角展示整个产业链的最新动态,并给出一些值得关注与思考的方向。
计算:OpenAI 自研芯片传闻、中美日三国半导体产业政策更新;
巨头:阿里云开源大模型、AWS 的云上大模型产品、智能音箱与大模型如何结合?
市场:如何看待 AWS 40 亿美元投资 Anthropic、孙正义如何投资生成式 AI 公司;
监管:反垄断阴影下的 AWS、微软与英伟达;
应用:呼叫中心、销售与诗人们的全新工作方式;
接下来,欢迎和我一起复盘近期围绕数据与智能的产业关键事件。
计算
关于 OpenAI 自研芯片的事情已经传了很久,最近路透社做了一番看似详细但实则没有多大信息的报道,两个基本事实:
OpenAI 公司高层希望通过自研芯片降低大模型运营成本,同时减少对包括英伟达等芯片公司的严重依赖;
无论是从零开始还是买下一家芯片公司,芯片研发都需要相当一段时间,换句话说,距离 ChatGPT 运行在 OpenAI 自家芯片的时间还有很久;
上述两个事实也是任何一家试图通过大模型实现业务发展的巨头、创业公司所面临的共同问题:大模型的计算成本实在是太高了。结合此前 Bernstein 分析师 Stacy Rasgon 给出的数字,如果 ChatGPT 的业务规模达到 Google 搜索的十分之一,OpenAI 需要投入大概 481 亿美元购买 GPU,同时还要每年准备 160 亿美元的芯片采购预算。
更重要的是,由于英伟达在整个 AI 芯片市场具有不可动摇的统治力,OpenAI 等公司不得不选择与英伟达合作,过度依赖一家供应商的产品,对任何一家公司来说都是一个不大不小的风险。
英伟达对于 AI 芯片市场的统治力也影响到一些创业公司的发展,英国芯片创业公司Graphcore 上周披露的一份官方文件显示,该公司在 2022 财年困损 2.046 亿美元,同比增加 11%,而收入仅为 260 万美元。
为了生存,Graphcore 公司计划继续融资,同时关闭包括日本、挪威等地的办公室,缩减其他地区的公司规模,裁员也不可避免。
半导体产业里,市场的钱瞄准的是英伟达的潜在替代者,而国家的钱则紧盯制造工厂。日本政府上周正式批准了一笔 13 亿美元的补贴,支持美光公司在日本广岛的芯片工厂建设。
根据日本政府的说法,这笔补贴将分成两部分,涵盖对美光公司制造和研发部门的支持。总体上看,13 亿美元的补贴约占美光新一轮日本投资计划的 40%。
在美国,备受关注的台积电亚利桑那芯片工厂依然进展缓慢,这笔总额达到 400 亿美元的项目面临诸多现实挑战。FT 的一篇特写谈到,当地员工短缺、基础设施——包括建筑供应商等薄弱带来的问题,不仅导致工厂推迟,还将影响台积电工厂的利润率。
中国的半导体大基金已经进入第三期,此前《经济观察报》透露的信息:
2014年,国家集成电路产业投资基金股份有限公司(简称“大基金一期”)正式成立;2019年,国家集成电路产业投资基金二期股份有限公司(简称“大基金二期”)宣告成立,并屡次以首发、战略配售、定增等方式出现在集成电路、半导体企业的投资者名单中。据《经济参考报》记者不完全统计,自成立以来,大基金二期对外投资了40多家公司,累计投资金额超过500亿元。
FT 结合公开数据,梳理了两期大基金投资的领域:
对于夹在中美两国之间的半导体巨头们来说,失去中国市场的财务影响正在显现,包括高通、英伟达、英特尔在内的多家公司,正在加大在华盛顿的政治游说力度,通过与白宫、智库进行对话或捐款等方式,进一步阐释当下芯片限售等措施的潜在问题。这其中的一个关键论据是,中国市场占据全球半导体市场的三分之一,失去这一部分收入将到迫使美国公司削减开支,进而裁减包括美国员工在内的职位。
NYT 将围绕美国芯片政策的争论定义为“如何平衡国家安全与商业利益之间的关系”,但从另一个维度去看,或许这也是一场如何平衡资本与政治或者平衡技术与意识形态的游戏。
巨头
开源正在成为大模型市场的关键力量。上月阿里云宣布开源一个参数规模达到 140 亿的大模型 Qwen-14B,并提供相应对话模型 Qwen-14B-Chat。
根据阿里云同期发布的论文,两款模型在推理、认知、规划等方面拥有业界领先的能力,支持 8k 的上下文窗口长度。
另一家中国公司百川智能也推出开源模型“百川2”,包括 70 亿参数规模和 130 亿参数规模两个产品。
此前很长一段时间里,诸如 ChatGPT 等闭源模型的开源替代产品无论是能力还是体验都无法媲美商业产品。但现在,从 Meta、阿里云这些巨头到百川等一种创业公司,开源大模型的基础能力已经接近甚至部分超过闭源模型;与此同时,围绕开源大模型的社区生态——工具、论坛、培训——逐步成熟,为大模型开源产业发展提供更多可能性。
亚马逊近期在大模型领域动作不断。上月底的消费产品发布会上,亚马逊宣布推出 Alexa LLM,目前并没有透露诸如模型架构、训练数据等方面的信息。
根据其演示细节来看,这个模型将类 ChatGPT 的对话能力引入到亚马逊智能音箱上,通过多模态(语音、文本)的交互能力,进一步优化智能音箱以及 Alexa 的交互体验。
大语言模型带来的对话理解能力,给已经停滞多年的智能音箱市场带来一丝曙光,根据此前一份来自洛图科技(RUNTO)的数据,2023 年上半年,中国智能音箱市场全渠道销量为 1148 万台,同比下降 19 %;销额为 33.7 亿元,同比下降 20%。
智能音箱不景气的原因既和经济环境相关,也和产品体验脱不了干系。语音识别的技术突破,构建起了语音交互的全新入口,一度被认为是智能手机触控交互之后的新方式,智能音箱趁势崛起,国内形成了小度(百度)、小米、天猫精灵(阿里巴巴)三足鼎立的竞争态势,海外市场里,亚马逊 Echo 系列一骑绝尘,Google 旗下的产品缓慢追赶。
但智能音箱的最大问题并非入口技术,而是用户在“进来”之后怎么办。曾几何时,诸如亚马逊、阿里这样的电商公司,向用户描绘了一幅通过智能音箱上的语音交互、完成电商购物的场景,且不提线上购物的产品逻辑有多复杂,更重要的是,用户在没有视觉信息辅助下是否愿意购买某件他不熟悉的产品,其实是一个不折不扣的伪需求。
现在亚马逊已经迈出了第一步,我们有理由相信国内智能音箱公司将很快跟进,不过,即便大模型能够更好理解用户需求,从而让交互变得更简单,但智能音箱的根本问题还是没有解决。
接着谈亚马逊的大模型布局,旗下云计算公司 AWS 上周宣布大模型平台服务 Bedrock 正式可用,这个产品旨在帮助 AWS 的客户们更好部署大模型服务,目前已经支持包括 AI21 Labs、Anthropic、Cohere、Stability AI 等公司开发的大模型。
站在 AWS 的视角来看,Bedrock 为客户提供了一个一站式的大模型产品通道,因为客户的数据、应用都存储或运行在 AWS 的服务里,因此能够更方便地将大模型的能力集成进来;另一方面,就像我在今年多期 AI Insider 里所谈的观点,大模型产品将给云计算公司带来全新的增长空间,而 AWS Bedrock 将成为云服务和大模型相结合的代表。
曾一度“All in metaverse”的 Meta 公司现在更像一家“All in LLM”的公司,该公司最近的几个动作:
面向用户:Meta AI 助手将登陆 WhatsApp、Messenger 和 Instagram 等社交产品;
面向广告商:推出基于生成式 AI 技术的广告制作工具,帮助广告商快速生成图像、文本等内容;
面向研究者和开发者:分享 Llama 2 Long 模型的相关细节,该模型的成绩相当不错;
市场
假期前最值得关注的一笔金钱流向或许就是 AWS 对 Anthropic 公司的投资,结合两家公司透露的信息含糊,这笔总额 40 亿美元的投资包括两部分:
首期投资 Anthropic 12.5亿美元;
未来双方都有权再触发 27.5 亿美元的投资额;
但还是有一些含糊的表达,比如到底是现金还是以算力折合的资金?AWS 投资后的所谓“少数股权”到底有多少等问题都是疑问。
这笔投资的对于两家公司的意义不言而喻。即便不能快速获得如微软投资 OpenAI 那样的生成式 AI“铁王座”,但 AWS 此番用“真金白银”成功挤入了生成式 AI 的一线阵营,借助其庞大的云计算客户基础和产品统治力,AWS 向市场展示了其对于生成式 AI 的决心,而在投资宣布的当天,亚马逊市值大涨 200 亿美元,这是市场投出的信任票。
其次,Anthropic 不仅得到了更多的运营资金,还将可以使用——即便是购买——AWS 的自研芯片 Trainium 和Inferentia,这对于严重依赖英伟达 GPU 的大模型公司来说无疑一个巨大福音。
而对于 AWS 来说,一如 FT Lex 专栏所言,Anthropic 公司使用 AWS 的芯片,就像“一家二线运动服装公司支付大量费用请名人代言其产品”,AWS 自研芯片的品牌将进一步被巩固。
Anthropic 显然是 OpenAI 之外最炙手可热的创业公司,付费媒体 Information 的独家消息指出,该公司还在与包括 Google 在内的投资者谈判,希望再得到 20 亿美元的注资。
关于 Anthropic,还有几个数字:
该公司已经完成 50 多亿美元的融资;
最新的估值在 200 亿美元到 300 亿美元之间,3 月份的时候只有 40 亿美元估值;
去年年底,Google 投资 3 亿美元,获得 10% 的股份,现在看来,这绝对是一笔大赚的投资交易。
科技公司投融资市场的另一个风向标就是软银,或者准确地说,孙正义。这位 60 多岁的资本大鳄上周在软银科技大会上明确表态,所谓“超级人工智能”将在 20 年内实现,并且将以 1 万倍的速度超越人类智能。
抛开其判断的正确性如何,孙正义的这番表态事实上也是在为软银大举投资生成式 AI 造势。此前我曾提到多位分析师预测,孙正义大约有 600 亿美元的资金可用于投资,我们将很快看到软银的投资案例,可能是 OpenAI,或者是苹果前首席设计官 Johann Ive 与 OpenAI 创始人 Sam Altman 合作的公司。
近期还有一组值得关注的投资案例:
应用
政府监管。FT 的独家消息称,英国政府正在要求包括 OpenAI、DeepMind 在内的大模型公司,为政府部门提供更高权限的模型访问能力,以更好评估这些模型的运行方式,从而提前了解潜在的风险。
英国政府这个举措,或许是为了下月在英国举办的人工智能安全峰会做准备。
不过消息人士也表示,几家大模型公司对此持保留态度,他们担心此举可能泄漏产品信息,导致受到网络攻击或者失去竞争优势。目前各个公司还会和英国政府继续沟通,寻求一个更透明也更安全的模型访问方式。
“反垄断”俨然成为近两年政府监管科技产业的关键词,负责英国电信监管业务的 Ofcom 上周要求该国市场监管机构 CMA 调查 AWS、微软是否在英国云计算发展中存在垄断行为。
据了解,Ofcom 认为两家美国公司的一些做法,已经迫使英国公司无法“自由”使用其他云服务。公开资料显示,2022 年,AWS 和微软占据英国云计算市场 70%——80% 的市场份额。
法国反垄断机构上周突袭一家 GPU 公司位于巴黎的办公室,WSJ 记者认为,这家“GPU 公司”就是英伟达。根据法国反垄断机构的说法,此次行动是调查该公司是否存在垄断行为。
值得玩味的是,两家法国公司——电信运营商 Iliad 和云服务公司 OVHcloud 上周宣布将为客户提供英伟达 H100 系列 GPU 服务。
安全。上周知名演员汤姆·汉克斯和 CBS 主持人盖尔·金分别发布声明称,自己的形象被某些机构“盗用”到广告里,类似这样的事情会成为接下来 AI 的“关键应用”之一,它不仅需要社交平台——如 Meta、推特、微信——的努力,还要借助法律进行有效规范。
更进一步,当下 AI 系统的安全问题需要一套完整的“安全护栏”机制,目前各大公司主要从两个方面入手:
部署强化学习通过人类反馈(RLHF)的方法;
引入“红队测试”的机制;
但问题并没有被根本解决,DeepMind、Anthropic 公司希望能够构建一套“AI 宪法”,鼓励所有 AI 模型遵循该“宪法”,整个研究还处于早期阶段。
值得一提的是,由于大模型存在输出有害内容的风险,一些保险公司瞄上了这个新兴领域,计划推出一系列面向大模型失败场景的保险业务,WSJ 的报道指出,这些保险参考了网络安全保险的做法,能够一定程度帮助 IT 决策者进行风险管理。
工作。大模型的发展,催生了一大批新职业,从“再培训师”到“提示工程师”,这些一年前还不存在的职业,正在快速来到你我身边。
在客服中心领域,大模型驱动的聊天机器人则在替代人类员工。在一些公司——比如银行——看来,这项技术可以帮助他们削减昂贵的客户服务成本,并为客户提供个性化服务。
在销售领域,大模型悄然改变了销售人员的工作流程,比如越来越多的技术销售,将需求建议书(Request for Proposal,RFP)交给大模型处理。
与此同时,大模型还在重构一些创意人员的工作,像 Scale AI 和 Appen 等公司直接聘请专业诗人、小说家和其他创作者,为他们所使用的语言(包括印地语、日语等)生成原创短篇故事。
这个举措不仅能够丰富大模型的数据——特别是提高非英语类文学数据量,也为这些创意人员提供了新出路;当然,科技公司也会因此避免后续的版权纠纷。可谓一举多得。
评论