GPT-4 的三点变化｜AI内参

作者｜赵赛坡

头图｜视觉中国

本期是大语言模型特辑，从刚刚发布的 GPT-4 的三个变化谈起，探讨大模型领域闭源与开源的关系，以及开源大模型正在产生的影响，最后关注大模型的企业应用与疯狂的 AI 创投市场。

接下来，欢迎和我一起复盘围绕计算与智能的产业动态。

GPT-4 的三个变化

尽管此前已经有多个爆料，但 GPT-4 正式发布的消息还是引发诸多讨论，结合 OpenAI 给出的新闻稿来看，此次更新不再过度强调参数规模，而是重点展示其能力，既包括对图像输入的支持（暂未开放 API），也包括应对众多人类社会的能力测试，比如接近满分的 GRE、700 分的 SAT 成绩单等。

更进一步，GPT-4 的逻辑推理能力继续增长，在律师模拟考试里，GPT-4 能够进入到前 10%，而基于 GPT-3.5 的 ChatGPT 大概只能排在倒数 10% 的名次。

这份成绩单也让英伟达 AI 科学家 Jim Fan 感叹：GPT-4 完全可以向斯坦福大学提交入学申请。

不过，这种基准测试到底意味着什么还存在一定争议，NYT 计算机教授 Gary Marcus 指出，

“benchmarks ≠ robust intelligence”，原因在于，GPT-4 的做题方式和人类测试的方式完全不同，由此宣传很容易给公众产生误导。

其次，GPT-4 谈论了很多大模型落地的案例与方法。比如鼓励开发者或企业快速调取 GPT-4 的 API，虽然目前还有额度限制，但已经展示出不俗的进步。

再比如，GPT-4 的新闻稿网页集中介绍了多家公司或政府的实践案例，包括语言学习应用 Duolingo、金融服务 Stripe、金融巨鳄摩根斯坦利以及爱尔兰政府等，这进一步凸显出大语言模型的巨大应用前景，也是 OpenAI 商业化运营的阶段性成果。

特别提醒的是，微软新 Bing 已经更新到 GPT-4。

第三，GPT-4 也在提升对“越狱”的屏蔽能力，官方给出的数字是：根据内部测试，对不合规内容的响应请求减少了 82％，响应准确度增加了 40％。这个数字更多还是为了市场宣传，实际应用中能有多少变化，还需要在后续测试中继续观察。

闭源与开源

对于 OpenAI 来说，保持 GPT 系列大模型闭源是其商业模式，但有闭源就一定有开源。上月，Meta 向研究者开放了多个大语言模型 LLaMA（参数规模从 70 亿到 650 亿），这个模型很快就被泄漏，换句话说，它成了一个“被开放”的大语言模型，由此也掀起了一系列优化大模型的潮流：

• 一位名叫 Georgi Gerganov 的软件开发者写了“llama.cpp”工具，使得该模型可以运行到 M1 芯片的 Macbook 上，另一些开发者把该工具迁移到 Windows 平台；

• 通过 Pixel 6a 运行大模型的 Demo 也在 Twitter 上被热议；

• 还有开发者尝试将大模型放在树莓派上运行，速度虽然慢点，但也能输出一些结果；

• 斯坦福大学基于 Meta 泄漏的模型推出 Alpaca 7B，这是一个可媲美 OpenAI“text-davinci-003”能力的模型，其硬件要求大幅下降；

我们有理由相信，基于开源社区的机制，这一系列面向大模型优化的趋势不会停止，我们也有理由相信，运行大模型的硬件条件会越来越低，从只能使用英伟达昂贵的 A100 GPU 到仅需 CPU，如此快速的变化会让大模型领域的未来更具戏剧性：

• 以 OpenAI、Anthropic 为代表的公司，基于英伟达强大的 GPU 能力，继续研发闭源模型，并通过和巨头（微软、Google、亚马逊）的合作，向企业级客户提供 API 等产品；

• 以 Meta 为代表的公司（也包括部分高校）通过开源、开放的形式将大模型交付给研究者或开发者，在开源机制的帮助下不断迭代，进一步降低硬件需求，并推动新的创新机会；

而随着大模型硬件需求的持续下降，对处在高端芯片限售危机中的中国公司来说是一大利好。

应用与创投市场

关注大语言模型在企业市场的两个应用场景：

• 微软正式将 ChatGPT 集成到公有云服务 Azure 中，开发者和企业可以通过 API 的形式将 ChatGPT 能力添加到自己的应用或内部服务中；

• Google 宣布为办公套件产品 Workspace 增加大量生成式 AI 的新特性，包括自动撰写邮件（文档）或快速生成演示图表等，目前还处于小范围测试阶段。

值得一提的是，微软将在美西时间本周四举行一场关于 AI 与未来办公的主题活动，微软 Office 套件如何与 OpenAI 相结合会成为一大看点。

ChatGPT 持续推动 AI 创投市场的火热，一家仅有四个前 Google 工程师的 Mobius 公司，在没有任何产品甚至规划的情况下，一周内得到 a16z、Index 的投资，估值超过 1 亿美元，还被其他风险投资公司“围追堵截”。

NYT 梳理了近期获得融资的公司：

• Dust 公司得到 Sequoia Capital 领投了 500 万美元，估值在 5000 万美元左右；

• Perplexity AI 正在募集 2000 万美元的融资，估值超过 1.5 亿美元，NEA 领投；

• LangChain 得到 Benchmark 的投资，数额不详；

上述这些公司几乎没有产品，更谈不上商业模式，风险投资所看重的，既包括创业者的资历和经历（来自 Google、OpenAI 的工程师最受欢迎），也包括对所谓“赛道”的判断，特别是在元宇宙、加密货币等“赛道”衰退的行业背景下，资本需要新的流向，从而创造新的增长点。

不过对于资本以及一众创业公司而言，至少还需要克服两大难题：

• 资金层面，前期需要巨额的资本投入，如果要像 OpenAI 那样训练一个大模型，前期需要数亿美元的研发投入；

• 技术层面，一家公司的模型迭代速度与 API 成本降低幅度如何，会决定这家公司的命运，毕竟，OpenAI 现在的 API 价格已经足够低了；

这或许也可以解释某些风险投资公司的立场：与其投资 AI 创业公司，不如去购买那些押注 AI 的科技巨头们的股票。

评论

最新评论