去搜搜
头像
冷静思考:这波AI将带来怎样的变革和商业机会?| 行研
2023-04-07 16:11

冷静思考:这波AI将带来怎样的变革和商业机会?| 行研

文章所属专栏 妙解行业
释放双眼,听听看~
00:00 08:33

本文内容大约40%内容基于ChatGPT和New Bing生成结果,进一步编辑而来。


出品丨妙投APP

作者丨李赓 & ChatGPT & New Bing

头图丨GIPHY


核心看点:

  1. 这轮AI浪潮再次进入“过热”状态,其背后的AI基础技术(大模型、LLM、AIGC)的确带来了新的可能性,但仍不是真正的AGI(通用人工智能)

  2. ChatGPT的确对少部分行业形成了直接冲击,对其他涉及的行业来说仍只是“新工具”。AIGC创业项目开始爆发,初步体现ChatGPT真正的商业潜力;

  3. AI新的计算需求(芯片和云)。


一周内吸引100万用户,两个月吸引1亿活跃用户,ChatGPT的现象级出场,开启了21世纪的第二次AI浪潮(第一次是2015年的人工智能围棋AlphaGo)


哪怕由于现实中的技术门槛,国内大部分人无法使用到ChatGPT,只是通过各种文章围观人机对话动图;更无法了解ChatGPT以及背后大模型技术的真实进展;更无法预见这轮AI浪潮会给人类社会带来怎样的改变。在这一个多月时间里,各种AI概念仍被热炒,股市中的板块节节走高。


但肉眼可见地,在初期发布带来的冲击感逐渐淡化之后,人们对这轮AI不再那么焦虑。也开始冷静地讨论:这轮AI热潮究竟会给众多的行业带来怎样的改变?又会催生出哪些商业机会?


在持续观察、使用、讨论了一个多月之后,我们将用这篇文章冷静地就以下4点进行讨论:


  • ChatGPT这轮AI创新浪潮背后的技术,带来了怎样的改变?

  • 这轮AI浪潮背后的技术还有多大潜力?

  • 大模型将如何逐步改变现有的行业赛道、商业逻辑?

  • 以及最关键的:我们应该如何把握ChatGPT的投资机会?


接下来,让我们一一展开。


ChatGPT还远未达到通用人工智能


基础简介:

  • GPT:GPT (Generative Pre-trained Transformer)其实是一个基于Transformer架构的预训练生成式语言模型。由美国创业公司OpenAI开发,它通过大量数据进行预训练,学习到丰富的语义和语法知识,可以在各种任务中微调和应用,实现诸如文本生成、摘要、翻译等功能。

  • GPT-4:是GPT系列模型中的第四代产品,相较于前代模型 (GPT-3) ,在模型规模、性能和智能程度上都有显著提升。GPT-4采用了更大的神经网络,拥有更多的参数,进一步提高了模型的学习能力和泛化性能。

  • ChatGPT:是基于GPT架构(可以使用不同代的GPT模型)的一款聊天机器人,专为与人类用户进行自然语言交流而设计。

  • Midjourney:文本转图像的人工智能工具,可以根据输入的文本提示生成图像。


LLM发展历史,点击查看大图,图自voicebot


从根源上来说,ChatGPT背后的核心技术是大型语言模型(LLM),是从20世纪60年代(2010年之后逐步取得突破)就已经开始研究的AI主赛道之一。通过对人类准备(标注)的大量百科、网页、程序代码文本进行学习,ChatGPT在理解能力上取得了突破,并且能够生成高质量、自然的文本内容。


对文本,也就是书写的语言的高度理解,相当于掌握了人类这个“操作系统”的“编程语言”。


在某媒体进行的一个测试(测试内容跳转查看)中,以人类理性思维的四种基本能力(语义错觉、认知反射、证伪选择、心智程序),对GPT-4进行了“拷问”。GPT-4拿下了8分的高分,成绩直接超过了253位人类的平均值,展现出了极高的文本理解、书写智能水平。


凭借这种文本的理解和书写能力,ChatGPT完成各种人类文字类的考试变得非常容易,轻松可以通过各种文学、数学甚至是编程测试。但与完成文本类任务相比,更重要的是ChatGPT为许多其他应用打开了“理解指令”的大门。


以图片为例,早在2015年那波AI浪潮中,卷积神经网络(CNN)就曾给人类带来过机器视觉上的突破,机器能够识别图片中的各种物体,但无法仅限于图片中出现了什么。在加上LLM带来的理解能力之后,机器对于图像的识别能力再次升级。



以一名外国用户的有趣测试为例,他把一张梗图发给GPT-4,并问这张照片不寻常之处。GPT-4不仅真的“理解”了图片,还能够轻而易举地表达出来。


部分Midjourney炼丹成果,自Ars tTechnica


与ChatGPT同期火起来的Midjourney,实际上是LLM技术的一种延伸,即“从文本,生成别的内容”。与之类似的还有现在的“文字 to PPT”、“文字 to 歌曲”等一系列拓展。


所以精准地来说,ChatGPT以及它背后的LLM、大模型等技术,目前所取得的进展是“显著提高人工智能的性能,并提供更准确的结果。”ChatGPT的看起来“通用” ,只是因为需求都能够用文字表达,以及图片、编曲等具体应用领域中AI应用的相关积累。


就拿最典型的生成图片来说,各种画风、人物、物体、服细节,都是通过巨量人类标注数据学习而来的。如果某个应用场景的产品、服务不是依赖文本来进行传递,又或者其中的产品(例如图片、视频)没有相应的AI能力积累、被AI学习的潜力,当前的ChatGPT能力实际上也无法改变AI对这个应用场景的覆盖能力。


2017年中国顶尖棋手柯洁与AlphaGo的对弈,图自CFP


在“LLM是否有进一步成长,最终具备完整的AGI能力?”这个问题上,目前整个AI学术界仍有非常大的分歧。一个最好的例子就是2015年那波浪潮背后的卷积神经网络(CNN)技术,在实现围棋战胜人类之后,CNN通过视觉感知能力上的跃升,变革了数个行业:例如早已全部AI化的安防监控;已经基本不需要人工下场的图像内容安全审核,以及仍在积极探索的各种自动驾驶。


在这次文本大模型之前,AI学术界也曾对机器视觉大模型进行过尝试,例如微软172亿参数的DeepSpeed模型,但目前在视觉领域,最高效的方法仍是针对特定应用场景单独训练。从而获得尽可能小的神经模型,保障运行的稳定性和效率。


同样的逻辑也可以套用到如今的LLM技术上。ChatGPT本身已经是不断扩展AI模型换回来的结果。2018年发布的GPT-1共含有1.1亿个参数,而最新实现智能突破的GPT-4传说(官方至今未公布)拥有1万亿个参数,相当于在5年时间里增长了10000倍。


Google训练神经模型时,突然出现的能力增长,图自:Google


疯狂扩充规模虽然带来了“智能涌现”,但同样也带来了巨量的硬件、能源消耗挑战。OpenAI早期的AI技术探索主要依靠自己完成,根据《财富》的相关报道,OpenAI在2022年就亏损了超过5亿美元(也是因为没有进账),OpenAI接受微软投资并且深度合作的其中一个关键原因,也是前者急切需要后者强大的云计算设施和技术。


所以总体看下来,ChatGPT仍是前往通用人工智能路上的一级“阶梯”(并不能直接达到通用智能);后续学术界和产业界所能做的,还是完善其能力,逐步开拓商业潜力。


追踪神经网络发展长达43年的美国知识搜索引擎公司Wolfram(这家公司还是首批GPT-4插件的提供商之一)的创始人Stephen Wolfram,在ChatGPT发布之后,先后发布过两篇深度解析(链接一:ChatGPT是做什么的?;链接二:人工智能会夺走所有工作并且终结人类历史么?,其文章中有两个观点可以做为这次AI浪潮的整体方向参考:


  1. 过去我们认为人类可以完成,但计算机不能完成的任务(例如写一篇论文),在某种意义上,比我们想象得更容易被“计算”出来;

  2. 如果有一个足够大的神经网络,AI进一步覆盖人类的思维能力是大概率事件。但神经网络距离物理世界仍有很远的距离,例如人类过去对工具的创造和利用(同样是通用人工智能的一项要求)


ChatGPT将带来哪些商业变革?



就在两个多星期之前,埃伦杜(Tyna Eloundou)等4位美国经济学家携手OpenAI,发表了一份研究《GPTs就是GPTs(通用技术):大型语言模型对劳动力市场潜在影响的初步观察》。



调查结果基本就是“体力劳动者”和“脑力劳动者”的分割:工作内容越文字化、越信息化,风险就越大;工作越体力、越讲求实际工具技巧,风险就越小。约80%的美国劳动力的工作任务会受到GPT的影响,其中大约19%的员工过半工作任务都将受到影响。整个结论看起来相当“废话”,只是激起了更多人对于自己职业的焦虑。


在商业潜力这个命题下,创业公司的动向反而更值得参考。在硅谷顶级孵化器Y Combinator 

2023冬季孵化营中出现了上百家涉及全新AI技术的创业公司,占到了今年总孵化项目数量的近40%。以下是他们的大致情况(信息均用ChatGPT从文本整理为表格格式)


销售、营销类:



客户成功、客户服务:


金融:


医疗:


RPA:


生成语音:


生成代码:


生成视频:


生成文字:


生成图片:



生成对话:



生成AI工具:





整体来看,这些创业项目的主流模式,仍是利用新获得的理解能力,提升过去AI能力在特定应用领域的“不顺畅”、“不好用”。其中少部分主要只依赖理解能力/之前最缺理解能力的应用领域,如对话、客服、代码建议等,被冲击的程度将会最为厉害。



具体产品效果可以参考成立于2016年主打恋爱机器人的创业公司Replika,这家公司开发了一款名为“Replika”的智能聊天应用,为用户提供一种虚拟的社交体验,用户可以与其聊天机器人建立情感上的联系,分享他们的想法、感受和经历。


简单来说,就像是养了一个虚拟女友,但这次她说的不再是固定的台词,也不只是呆板地回复“我不知道”,而是真的会关心你。


而这家公司的商业模式也非常简单,这个在虚拟世界中会和你谈一场甜甜的文字恋爱的女友,会引导你为其“氪金”,包括虚拟形象的各种服饰、配饰、化妆(QQ秀AI版),在额外付费之后,还可以在文字层面跟你来一次“瑟瑟”的交流。凭借“简单粗暴且易行”的产品和商业模式,Replika在很短的时间里就已经获得了超过1000万美元的外部投资。


AI绘画大模型Midjourney目前对于部分美术创作行业的影响,也是一个很好的例子。


B站UP主“李口口”对Midjourney的试用,提供左上角草图结合风格要求输出大图,仅耗时几分钟,图自:视频


Midjourney可以根据上传的示意图和风格要求,快速输出几版细节、风格不同的AI生成图片;用户还可以将生成的图片再次输入,进行细节上的调整。再抽象的示意图,经过5-6轮的训练之后,就可以生成非常仿真的照片,或者是堪比中级画师的原画、UI作品。在效率上已经“完虐”中级以下的原画师。


总结起来,这轮AI变革在商业模式上将带来以下变革:


  1. 原先距离文本(翻译、搜索引擎等)、不完善AI应用(各类助手、图像生成)最近的行业,后来者将以光速追上,并且实现功能上的超越,老玩家的价值将会直接受到挑战;

  2. 目前已经出现爆款应用(例如Midjourney)的赛道,将会吸引更多的创业公司、开发者,有望进一步提升能力,最大程度取代人类工作;

  3. 创业浪潮兴起之后,掌握用户市场的大公司将会占优,通过“学习”、收购等方式打造类似产品 ,实现自己产品的AI化。


如何把握其中的投资机会?


回归到投资上,ChatGPT这波浪潮中值得重点关注的投资环节有3个:实现ChatGPT的关键材料;打造出与ChatGPT有竞争力的智能神经网络;ChatGPT相关能力的落地。与这3个环节对应的,是AI基础设施公司、AI平台公司、AI应用公司。


先说第一个,大模型通过扩大神经网络规模实现智能水平提升,必然要付出更多算力。以OpenAI为例,2022年就亏损了5.45亿美元,而其目前公开的员工总数不过375人。大部分的开支应该都花在了算力的建设和维护上。


在为大模型提供算力这件事上,全球确定受益的投资标的只有英伟达,前不久的春季GTC上,英伟达发布了可用于包括ChatGPT在内的自然语言大模型推理硬件,同时还宣布了与全球云计算厂商的进一步合作,在加速AI底层软硬件发展这个领域,依旧当仁不让。


然后是AI平台公司,最典型的例子自然是OpenAI。在OpenAI成功在大模型上实现智能水平突破之后、Google、Meta、百度、阿里、腾讯等其他科技巨头也都开始了跟进。对于产品形态高度数字化的它们来说,实现不了更高的智能水平,并不只是做不成AI,还是一系列产品有可能会被淘汰的威胁。投资者接下来可以重点观察、测试这些公司大模型产品的进展,重点关注智能水平有无提升。


就目前而言,其他公司的产品都与ChatGPT仍有少量差距,更不要提目前最先进的GPT-4。投资者可以重点关注这些公司在ChatGPT水平这个中途“打卡点”的冲刺情况。目前来看,多年来在AI积淀颇深的Google很可能身处第二,然后是Meta,再然后是国内的百度、阿里和腾讯。


最后是应用,其实早在GPT-2推出之后,国外就兴起了很多运用这种技术能力的创业公司,在产品类型上基本分为4类:聊天机器人、代码辅助、写作应用、游戏。就国内而言,产品很可能会由AI平台公司自己打造,在基础的智能水平之外,也将考验厂商的产品打造能力和生态动员能力。


在如此综合能力的需求下,互联网巨头们在国内有着明显的优势,是投资者中期的一个不错的选择。至于巨头之外的创业公司,投资者可以关注其软硬件水平,是否能够迈过大模型的门槛。例如公司有没有和云计算厂商深度合作的背景、有没有自己的大规模计算中心等等。


最后是时间维度的提醒,参考2015年AI浪潮的经验,短期的热度肯定会过高,不建议投资者在这个时间点轻信任何一家没有推出成熟产品和商业模式的公司,可以静待今年6、7月大部分公司第一拨投入开始逐步产出的时间节点,对比成绩之后再确定投资对象。


本内容未经允许禁止转载,如需授权请微信联系妙投小虎哥:miaotou515
如对本稿件有异议或投诉,请联系tougao@huxiu.com
评论
0/500 妙投用户社区交流公约
最新评论
这里空空如也,期待你的发声