作者|赵赛坡
头图|视觉中国
本期首先关注阿里云意外换帅的消息,这个交接的时间点极为微妙,在充满各种的不确定猜测背后,还有哪些确定的方向?本期会给出一些思考。
“计算”专栏探讨半导体产业复苏、英伟达和久违的英特尔展示 AI 推理能力等。
“市场”专栏依旧通过梳理金钱的流向,发掘 AI 或大模型市场的一些信号;
“应用”专栏,您会看到全球一些国家、企业如何落地大模型相关应用的案例。更进一步,英国政府如何准备即将到来的全球 AI 监管峰会,AI 或大模型安全问题的解决路径,也是本期聚焦的话题。
接下来,欢迎和我一起复盘近期围绕数据与智能的产业关键事件。
云上的故事
阿里云换帅。上周日,张勇不仅交出了此前已经公告过的阿里巴巴董事长职务,还出人意料地辞去阿里云董事长和 CEO,在毫无预警的情况下,外界只能从新任董事长蔡崇信的公开信里了解到一点信息:
随着改革的平稳过渡,逍遥子向集团提出他将卸任阿里云董事长与CEO的职务。经过慎重的考虑,集团董事会尊重逍遥子的决定,并任命集团CEO 吴泳铭兼任阿里云董事长与CEO,即日起生效。逍遥子将换一种方式,继续在阿里和我们一起奋斗,迎接未来的发展。集团决定投资10亿美金支持逍遥子设立面向未来的科技基金,协助阿里对未来的科技布局打造更好的生态环境。
此时距离张勇公开宣布辞去阿里巴巴董事长并“all in 阿里云”还不到 90 天,根据这份公开信,吴泳铭已经在当天正式成为阿里云新任掌门人。
这个交接的时间点极为微妙,如今的阿里云,正处在从阿里巴巴集团分拆、独立上市的重要时刻,此时的管理层调整也会影响市场的反应,事实的确如此,阿里巴巴港股周一——也就是公开信发布后第二天——股价下跌 4%,毕竟,港交所原则上只允许一家公司上市前三年拥有相同的管理层。
FT 援引消息人士的话称,吴泳铭成为阿里巴巴 CEO 或和马云有关,当然这些消息目前信源单一、真假难辨,请自行判断。
但有一点非常肯定,在整个阿里巴巴业务体系里,阿里云的重要性不言而喻。市场份额层面,无论 IDC 还是 Gartner,都将阿里云看作 AWS、Azure 之外的最重要的云计算公司,其在中国、亚太地区拥有不小的市场占有率。
随着这几年商业环境的变化,阿里云在国内市场所面临的挑战也越来越多,比如在政企市场,强势崛起的华为以及依托国企身份的三大运营商,都形成了对阿里云的围剿之势。
其二,阿里云已经成为阿里巴巴集团的重要营收来源,仅次于国内电商业务,但在经历了 2016 年单季超过 170% 的增长之后,阿里云的增长速度明显放缓,2023 年的季度增长只有个位数。
究其原因,既有本地商业环境压力下的客户选择变化,也和目前全球范围内云计算巨头普遍陷入增长乏力的现象相吻合。AWS、Azure 近两年的增长也呈下降势头,客户削减云计算预算、产品同质化现象严重等等,使得整个云计算产业,特别是大而全的云计算巨头们苦不堪言。
进入 2023 年,以 ChatGPT 为代表的生成式 AI 技术为云计算增长提供了新的机遇,从 AWS 到 Azure、Google Cloud,生成式 AI 都成为云计算产品、技术会议的关键词,也是新闻稿里的高频词汇,所有这些举措都是为了留住、吸引更多客户。一个案例是,毕马威近几个季度一直在削减其云计算的支出,但在微软提供了 OpenAI 相关技术之后,该公司认为需要为 AI 技术增加 Azure 上的投入。
阿里云同样也面临这样的增长机会,自 2023 年 4 月开始,阿里云已经推出面向消费市场的“通义千问”(已开放服务)、面向企业的“千问通用模型”和“千问专属模型”;2023 年 8 月,阿里云相对低调地发布了开源大模型 QWen-7B 和 QWen-7B Chat,两款模型的参数规模达到 70 亿个,可免费商用。
上一季度的财报分析师会议上,张勇强调阿里云的增长将借助 AI 等新业务,从而在今年下半年逐步回升,这凸显出生成式 AI 产品的巨大潜力。根据多家媒体的消息,吴泳铭在发给阿里巴巴的员工信里强调,阿里未来的战略重心是“用户为先、AI 驱动下一个十年”,前者对应 C 端业务,后者则是对企业业务——阿里云、钉钉——的要求。
2023 年还剩下不到四个月时间,距离分拆上市的截止时间还有八个月,阿里云又踏上了新征程。
计算
本周一,多家负责 ARM IPO 的银行宣布提前结束认购,原因是认购过于火爆。FT 援引消息人士的话称,此次 ARM 超额认购超过五倍。
此前外界预测 ARM 发行价会在 47 美元到 51 美元之间,最新的消息称,ARM 的初始价格定为每股 51 美元,以此发行价来计算,ARM 的市值将达到 540 亿美元,该公司计划在美国当地时间周四正式交易。
ARM 获得追捧也在意料之中。过去几年,科技公司 IPO 案例非常少;更重要的一点在于,ARM 所在的半导体行业,得益于大模型带来的巨大算力需求,正处于强势反弹的前夕。
根据市场研究机构 Omdia 的一份数据,在经历了连续五个季度的收入下降之后,全球半导体行业在今年二季度实现了正增长, 3.8% 的同比增长率,使得这个行业的市场规模达到 1243 亿美元。
在推动全球半导体复苏的力量中,英伟达无疑是最关键的一家企业。这家公司因其旗舰 GPU 可以在训练大语言模型方面的优异表现而被追捧,包括全球科技巨头、国家机构等,都在疯狂采购英伟达的 GPU——无论是上一代还是新一代产品。
英伟达 2023 年的股价已经翻了一番多,市值也稳稳跻身到“万亿美元俱乐部”,这是资本市场给予英伟达投出的信任票,以至于 DeepMind 创始人之一的 Mustafa Suleyman 会发出这样的呼吁:美国政府应该介入英伟达的产品销售领域,通过调控该公司的芯片卖给哪些企业或国家,以此来控制哪些国家应该“安全”和“有道德”地发展大模型或者人工智能。
本周,英伟达的 AI 推理芯片在 MLCommons 发布的测试里表现优异,英伟达的优势都在 AI 训练方面,但这一次英伟达 GH200 展现出不俗的实力。
与此同时,此次测试还展示了英特尔的 GPU 能力,借助此前收购的 Habana 公司的最新 GPU Gaudi2,英特尔让行业看到兼具性能与价格优势的新选择。
算力领域的竞争还在持续发展。英伟达也在通过软件层面的升级进一步拓展 GPU 护城河,英伟达将在下月发布开源的 TensorRT-LLM,该软件能够大幅提升 GPU 在大模型训练、推理过程中的效率。
更进一步,在半导体地缘政治越发严峻的情况下,拓展更多市场,从而降低对单一市场的依赖也变得越发重要。这构成英伟达上周与印度通讯巨头 Jio 合作的背景。根据合作协议,Jio 将获得英伟达一系列 GPU,从而可以快速训练针对印度多种语言环境的大模型。
在半导体、大模型领域,印度一直保持沉默,但考虑到该国巨大的人口以及丰富的科技生态,印度显然会成为接下来美国科技公司转移产业链风险的重要选择,英伟达之外,还有两家美国科技巨头加速在印度布局:
市场
关注金钱的流向,是了解一个市场的重要途径。风险投资公司 a16z 发布一项面向开源 AI 项目的资助计划——注意这里的“资助”并非“投资”之类的交易行为。该项目旨在为致力于开源项目的 AI 研究人员提供一份经济上的支持,使其可以在相对无压力的条件下进行研究,首批资助的项目包括基于合成数据的大模型指令调整、垂直领域的基础模型微调等。
如果说 a16z 是在鼓励大胆研究,那么微软也希望通过金钱来刺激客户使用生成式 AI 技术,根据微软的博客,如果客户因为使用微软 Copilot 相关技术导致版权问题,微软将向客户提供法律和资金上的援助。
微软此举也反映出当下生成式 AI 市场的潜在问题,大量企业因为版权等法律问题而不敢或不愿意大规模部署相关技术,但微软的这项承诺并不可能完全解决这个问题,它更像是一种市场营销行为,或者说,是一系列面向政府游说行为的组成部分。
当然,微软又是比较符合这一角色的公司,另一个候选人,或许是甲骨文,这可能属于 IT 行业的旧梗——两家公司的法务部门早已身经百战,拥有丰富的斗争经验。
继续关注金钱的流向,三家近期完成巨额融资的创业公司:
Imbue 日前宣布获得 2 亿美元的融资,这家公司提供人工智能代理服务,你可以将其理解为基于大模型开发的一类 SaaS 产品;
仓库机器人公司 Mujin 完成一笔 8500 万美元的融资,包括埃森哲、丰田汽车等都参与了此次融资,Mujin 公司的主要产品是构建了一个面向工业制造场景的机器人手臂系统,涵盖软硬件多个方面;
以色列安全公司 Upwind 上周宣布 5000 万美元的融资,投资者包括 NBA 巨星库里创立的投资基金,Upwind 开发了一个检测和应对云基础设施威胁的平台,目前在特拉维夫和旧金山拥有办事处;
与此同时,科技巨头们“如何花钱”也成为市场的焦点,比如苹果,Information 援引内部数据显示,该公司每天花费数百万美元用于大模型的训练和相关研究,苹果希望其内部名为 Ajax 的大模型项目,可以快速超过 OpenAI 的 GPT-3.5。
OpenAI 上周宣布将在 11 月 6 日举办开发者大会“OpenAI DevDay”,其官方博客里还透露了几个数据,目前 OpenAI 已经拥有超过 200 万开发者。
蚂蚁金服也踏入到大模型市场,该公司将向普通用户侧和金融专业侧提供两款基于大模型的产品,同时还计划将大型语言模型用于市场分析、投资者教育、解释保险产品和验证理赔等。
应用
先看一组应用:
美国国税局正在使用大模型识别富人阶层可能存在的税务问题,比如快速发现收入超过 100 万美元但欠税超过 25 万美元的逃税者;
上月开始,日本东京都政府已经允许公务员在部分工作中使用 ChatGPT,目前日本已经有超过 37 个都道府县政府发布了 ChatGPT 使用规定,详细情况可参见这篇追踪报道;
随着生成式 AI 应用的场景越来越多,“声明是否由 AI 参与”显得越发重要,亚马逊已经要求其自出版平台上的作家们披露使用 AI 工具生成内容的情况,包括文本、图像和翻译等。
需要注意的是,亚马逊目前不会公开标识 AI 生成的书籍,该公司发言人表示可能会修改这一政策。
Google 也要求从 11 月开始,所有经过验证的选举广告都需要披露生成式 AI 技术的使用情况,声明必须“清晰且显眼”,并放置在用户能够看到的位置。
围绕大模型产品透明性和安全的考量构成英国政府对于 AI 安全峰会的核心立场,英国政府上周披露了一些计划,比如强调峰会将重点关注最强大的人工智能系统造成或显著加剧的风险,特别是与这些系统潜在危险能力相关的风险。
英国政府还为这场今年 11 月 1 日举办的大会提出了五个目标:
对前沿人工智能带来的风险和采取行动的必要性达成共识;
就前沿人工智能安全开展国际合作的前进进程,包括如何最好地支持国家和国际框架;
各国家和组织应采取哪些适当措施来提高前沿人工智能的安全性;
人工智能安全研究的潜在合作领域,包括评估模型能力和制定新标准以支持监管;
展示如何确保人工智能的安全发展,使人工智能在全球范围内得到良好应用;
说起大模型的安全问题,目前的解决方法包括技术、组织和人力三个维度的路线,技术层面,Google 旗下的 Jigsaw 团队开发的 Perspective API 是一个快速检测并清理大模型内容毒性的工具。
组织方面,从 Google 到英伟达以及 Meta、OpenAI,科技公司们热衷组建一支“红队”,以黑客的方式发现自家产品中的技术漏洞,并在造成影响之前快速修复。
至于人力,科技公司会将大模型所需的数据标注工作交给发展中国家的廉价劳动力,这其中的很大一部分工作就是由当地人手动标注有害内容,这样的故事已经出现在肯尼亚、菲律宾等地。
评论