苹果 AI 布局，落后了？｜AI内参

作者 | 赵赛坡

头图 | 视觉中国

本周举行的 WWDC 再次成为全球科技行业的狂欢，在 Vision Pro 是否引领计算平台演化的争议之外，我们探讨另一个问题：苹果 AI 布局落后了吗？

大模型与股价之间的关系越发紧密。本期关注 GitLab、Salesforce 大模型产品与股价之间的关系。

OpenAI 新论文提出一种“过程监督”的方法，该方法的确能够提升大模型的输出结果，但过度的“人类监督行为”是否会扼杀大模型的“创造力”？

本期 AI 内参还将关注：

· Stability AI 的困境；
· 全球 AI 监管现状；
· 大语言模型与本地化运营；
· 为什么大语言模型时而聪明时而愚蠢？

接下来，欢迎和我一起复盘近期围绕计算与数据的产业关键事件。

大模型·苹果

本周举行的 WWDC 再次成为全球科技行业的狂欢。苹果展示的首款 MR 设备——Vision Pro——无论是工业设计还是交互体验，足以将包括 Meta 在内的一众早期玩家甩在身后，从而成为引领 MR 或“元宇宙”行业的代表产品，以至于最近两天开始出现类似下图的调侃：

苹果是截至目前在公开场合最少谈及 AI 的巨头公司。WWDC 主论坛演讲过程中，苹果没有使用一次“Artificial Intelligence（人工智能）”，而是反复使用“Machine Learning（机器学习）”这个词展示苹果在这个领域的布局，包括：

· 将 Transformer 模型全面集成到全新操作系统中，为输入法带来更好的自动纠错和预测功能，并优化语音输入的体验和效果；

· 利用机器学习模型优化 iPadOS 的 PDF 编辑功能，可自动识别诸如文本框、个人签名框等字段；

· AirPods 全新的自适应音频功能，也是由机器学习驱动；

· Vision Pro 里令人惊艳的虚拟头像，使用了机器学习和 3D 扫描用户头像等技术；

软件和系统的优化之外，M2 Ultra 芯片也是此次苹果 AI 布局的关键棋子，作为 M2 系列的最后一款产品，M2 Ultra 拥有1340亿个晶体管，比上一代 M1 Ultra 多出 200 亿个。

更重要的是，M2 Ultra 还能够提供高达 192GB 的统一内存，并能够提供 800GB/s 的内存带宽。由此带来的可能性是，用户能够在没有专有 GPU 的情况下，直接通过一台 Mac 电脑训练诸如 Tranformer 之类的机器学习模型，而价格相比于英伟达的 GPU，实在便宜太多了。

某种意义上说，机器学习已经成为苹果产品更新的重要推动力，但对于绝大多数早已被 ChatGPT“洗脑”的所谓“行业人士”看来，苹果并没有布局 AI 的战略或能力。

库克在 WWDC 之后接受 CNBC 采访时的话很具代表性，他指出，虽然苹果公司今天明确地将人工智能整合到其产品中，但公众并不一定认为这些功能就是人工智能。

这也从一个侧面展现出当下 AI 热度与产品之间的不同，两个要点：

· 以 ChatGPT 或 GPT-4 代表的一类语言模型处理技术，需要和更多场景相结合。如果说 ChatGPT 是聊天场景，那么基于 GPT-4 API 进行集成和研发的其他产品——比如笔记工具 Notion 的笔记 AI——就是这些技术落地的另外场景；

· 大语言模型并非 AI 技术的全部。文本交互自然拥有巨大的应用场景，但语音、视觉交互的重要性同样不可小觑，只有将这些技术组合并应用在合适的场景，才能带来更大的产品创新可能；

与此同时，根据 Bloomberg 记者 Mark Gurman 的消息，苹果也在积极招募生成式 AI 领域的工程师，基于苹果在人工智能领域芯片（iPhone 上的 A 系列芯片）、操作系统 API 以及一系列落地场景（多样化的硬件和软件）的布局，进一步落地生成式 AI 技术。

大模型·市场

大模型与股价之间的关系越发紧密。开发平台 GitLab 此前已经开始广泛布局 AI 功能，并推出“ModelOps”计划，旨在将“模型即服务”与开发流程整合在一起。该公司最新一季的财报显示，营收大涨 45% 至 1.269 亿美元，高于分析师预期。两个信息相互叠加之后，这家公司的股价又一度上涨31%。

另一家公司 Salesforce 也需要平衡大模型和股价之间的关系。上周这家公司公布最新一季财报，季度营收 82.5 亿美元，同比增长 11%，虽然高于分析师预期，但这个数字也是 Salesforce 过去 13 年来最低的营收增长幅度。

增长下滑的原因和不确定的经济环境相关，自去年下半年开始，企业市场的客户开始削减 IT 支出，这使得包括 AWS、Salesforce 在内的众多企业市场巨头营收增长受到影响。

而随着 ChatGPT 等生成式 AI 技术的流行，大模型相关技术俨然成为企业市场的“新救星”，我曾在此前的 AI Insider 里多次谈到这一点，Salesforce 也不例外。根据该公司 CEO Marc Benioff 的说法，客户目前只关注人工智能，具体来说，就是生成式人工智能，这可能是 Salesforce 未来持续增长的驱动力。

为此，Salesforce 也在加快布局：

· 推出 Einstein GPT，进一步将 GPT 模型的生成能力，融入到原有的 CRM 产品里；

· 加快改造 Slack，这款产品会成为 Salesforce 的一个关键棋子，因为它沉淀了企业海量的数据，能够通过大模型挖掘出新的价值；

· 创立投资基金，目前 Marc Benioff 已经为 Salesforce 筹集了一支总额为 2.5 亿美元的基金，主要投资目标是生成式 AI 领域的创业公司；

关注几个明星 AI 创业公司的动态：

· 《福布斯》杂志独家报道了 Stability AI 创始人 Emad Mostaque 的“问题”，包括故意夸大自己的影响力、误导市场的判断等，报道还指出，Stability AI 的新一轮融资遭遇不少困难；

· 曾参与 Stability Diffusion 开发的 RunWay 公司据称已完成 1 亿美元的新一轮融资，估值达到 15 亿美元；Google 参与了这轮融资，并且还通过 Google Cloud 的计算资源进行置换，这也意味着，RunWay 未来将从 AWS 迁移到 Google Cloud；

· 创业公司 Instabase 日前完成一轮 4500 万美元的融资，该公司提供了一个构建企业应用程序和使用人工智能分析非结构化数据的平台，未来也将接入 OpenAI 等公司的大模型，允许用户基于大模型快速创建应用，这家公司预计今年营收超过 5000 万美元；

· 创业公司 CoreWeave 或已得到微软数十亿美元的投资，这是一家通过简化英伟达 AI 芯片从而为企业提供计算能力的创业公司，微软今年早些时候与 CoreWeave 签署了合作协议，确保 OpenAI 能够得到足够的计算能力，CoreWeave 公司不久前完成一笔 2 亿美元的融资，估值超过 20 亿美元；

大模型·基础研究

OpenAI 上周发布的一篇论文引发诸多讨论，这篇论文设计了一套“过程监督”机制，从而优化大模型的输出结果，论文在这里。

你可以将其理解为中学的时候，理科老师们通常会让学生们在解题时进行一步步的推理或计算，老师会查看这个过程给出相应的分数。

OpenAI 这个探索也是对此前“结果监督”方法的迭代或优化，论文显示，大模型能够减少“幻觉”出现的次数，从而得到更好的结果。

但潜在的问题也不少。一方面，目前尚不清楚这个机制能否真正克服大模型的“幻觉”问题，毕竟样本太小，而且减少“幻觉”和杜绝“幻觉”是两个不同维度的结果。

另一方面，Fortune 记者 Jeremy Kahn 在一篇专栏里谈到，当人类过度参与大模型生成内容的过程之后，是否会扼杀大模型的“创造力”。

这个观点的出发点在于，2016 年 3 月，DeepMind AlphaGo 与李世石围棋大战中曾经下出一个令人匪夷所思的“37 步”，这并非人类棋手习惯的落子方式，但却成为此番对局的关键一步。

人类虽然并不懂为何机器会下出这一步，但并没有过分干预，事实证明，这就是 AlphaGo 以及之后 Alpha Zero 的下棋方式，或者说，机器延伸并创造了一种全新的围棋落子模式。

由此也引出这个思考：当下大语言模型是在重新加工、整理人类过往的知识（ChatGPT 可以提供的知识截止到 2021 年 9 月），如果人类过分干预大语言模型的生成机制，包括但不限于“结果监督”、“过程监督”以及未来更多的“监督”方式，大语言模型还能否提出更多创造力的想法或解决路径？毕竟，人类当下面临的无论是气候问题还是产业发展的技术命题，单纯依赖于效率提升而不是创新手段是不可能解决的，下图可能是一个比较形象的展示：

另一个有趣的基础研究是想了解为何大语言模型——比如 ChatGPT ——时而聪明时而愚蠢。

结合这篇论文，可以进一步确定几个发现：

· 大语言模型并没有“系统理解或解决”问题的技能，它还是在根据用户的输入内容，通过预测、组合文本，给出自己的答案；

· 随着问题复杂度的提升，大语言模型的表现也越来越差。所以使用诸如“一步步来”这样的提示关键词可以大幅提升模型输出结果，因为这相当于将复杂任务分解为简单的单一任务，此时模型能够较好处理；

另外，OpenAI 本周也给出了一份使用大模型的最佳实践，包括 6 个步骤，相比于具体的提示词，这些步骤体现出的一些大模型使用理念，更值得思考。

大模型·监管

接受政府监管俨然成为大模型未来发展不可避免的命运。NYT 的独家报道称，过去几个月，OpenAI CEO Sam Altman 密集会见了欧美主要国家领导人，并和美国议会两院的议员进行广泛接触，除了详细介绍 GPT 技术带来的影响，也在探讨围绕大语言模型监管的方式和方法。

Altman 的这一系列行动与其说是在为大模型的发展争取政策空间，倒不如说他试图影响各国政府监管大模型的政策制定流程，更重要的一点，Altman 所控制的 OpenAI 背后，还有更强大的微软。

事实上，一些主要国家已经开始制定相关监管政策：

· 印度：全新的《数字印度法案》将加入对人工智能，特别是生成式 AI 的监管，该法案预计将在本月出台；

· 澳大利亚：立法机构即将立法，禁止诸如 Deepfake 或生成式 AI 技术生成的虚假与误导内容，同时还将研究这些技术在版权、隐私保护中的影响；

与此同时，英国将于今年秋天举办首届全球 AI 监管峰会，英国政府表示，此次峰会将汇聚来自“志同道合国家”的政治和行业领袖，是否邀请中国还是一个未知数。

某种意义上说，围绕 AI，特别是大模型的监管，也是一种政治话语权的体现，各个国家、区域组织以及一些政治或经济联盟，都会基于各自考量，制定相应的监管标准。未来一年，大模型监管领域的争夺激烈程度，不会亚于企业市场的大模型追逐赛。

最后关注大语言模型本地化的机遇与挑战，无论承认与否，英语显然是当下大语言模型的主要语言，但也在发生一系列变化：

· 市场机遇：为了快速占领主要市场，Google、微软加快扩张，Google Bard 已经支持了韩语与日语，Google 的野心可见一斑；

· 监管压力：大语言模型带来的数据安全和隐私问题，促使主要国家的政府出手限制美国公司的发展，这一定程度刺激本国创业公司的崛起；

· 新市场在哪里？欧洲、东亚之外，中东或许会成为大模型应用落地的重要市场。

苹果 AI 布局，落后了？｜AI内参

评论

最新评论