头图来自视觉中国
“AI 内参”以月度总结的形式,展现过去两个月的全球 AI、云、自动驾驶等领域的产业变化,通过分析行业事件与梳理技术趋势,勾勒出人类迈向数字化的若干方向与线索。本期为 2021 年 9 月 和 10 月的“AI 内参”合集。
本期将关注以下议题:
焦点 · 报告:五年周期里的 AI、2021“State of AI”解读;
巨头 · 业界:云栖大会手记、AI 应用里的“人机大战”、微软超大规模语言模型、AI 公司 Data Bricks;
财报 · 资本:微软/Google 财报、近期 AI 公司融资汇总;
资源 · 机器学习:最新一组机器学习资源汇总;
业界 · 其他:欧盟 AI 政策、几个值得关注的机器学习基础研究;
焦点 · 报告
人工智能的五年变化
比尔·盖茨曾有句名言:人们倾向于高估短期内将要发生的变化,而低估长期内将要发生的变化。
类似现象也发生在人工智能领域。科技媒体热衷于报道近期的各种技术突破,让很多读者误以为技术的变革就在眼前,比如机器人即将替代人类工作、自动驾驶汽车即将上路。显然,这些都是被严重高估的变化,而在类似这样的期望与失望的循环往复中,人工智能的“狼来了”也成为很多话题的终点。
但如果以长期角度来看,人工智能的技术突破、产业落地以及公众的认知,几乎都进入一个全新的阶段。
这是我看完一份 AI 行业报告后的心得体会,这份名为“AI 100”的报告由来自斯坦福、布朗大学等多个高校的教授参与编写,其内容以五年为一个观察周期,通过把 2021 年产业现实与五年前的 2016 年进行对比,展现出一个长期视角下的人工智能发展图景。
整个报告从 13 个提问入手,其中包括:
AI 领域最重要的进步有哪些?
AI 领域最值得关注的开放挑战有哪些?
我们在理解人类智能方面的进步有多少?
如何看待通用智能的发展?
公众对 AI 的态度变化是什么?
政府对 AI 监管方面的措施有哪些?
在 AI 发展中,学术机构与企业之间的关系是什么样子的?
AI 领域最大的机会还有什么?
社会经济发展中,AI 影响力如何?
上述每一个问题都足够宏大,特别是将其放在五年的时间里讨论,你会看到一个不太一样的人工智能的发展轨迹,我印象深刻的一个结论是:必须警惕“人工智能全能主义”,更多的时候,人工智能不过一个工具。
你可以在这里免费获取这份 82 页的报告。
2021“State of AI”报告
两位英国投资人 Ian Hogarth、Nathan Benaich 在 10 月初发布了 2021 年的“State of AI”,这一次的篇幅为 188 页,主体部分从基础研究、人才、产业、政策四大方面勾勒过去一年的 AI 发展格局,同时还提供了接下来一年的几个预测。
接下来我会分享其中我认为最值得关注的技术或产业趋势,你也可以在这里获取该报告的完整版本。
1、Transformer 模型全面进入计算机视觉领域
Transformer 模型最早出现在自然语言领域,但随着 Google 提出视觉领域的 Transformer 模型(Vision Transfomer),这个领域的研究开始变得火热,研究者也发现,在诸如图像分割、识别等场景中,Transformer 的表现更好。
值得一提的是,上月的特斯拉 AI Day 上,特斯拉也介绍了其将 Transformer 应用到自动驾驶场景的思考。另外,在国内,背靠长城汽车的自动驾驶创业公司毫末智行也引入了 Transfomer 模型。
与此同时,该报告还指出,研究者还在探索 Transformer 模型的更多场景,上图显示了其在诸多测试里的巨大潜力。
2、人才领域的新趋势
AI 人才招聘趋势变化所反映的是当地 AI 发展情况,报告指出,巴西和印度的 AI 人才招聘增速非常快,相比于 2017 年增长了 3 倍,这也从一个侧面展现出这两个国家的 AI 产业需求。
另外一组趋势是,科技巨头公司对于高校人才、研究学者的争夺持续,下图展示了科技巨头与高校人才的关系。
3、AI 产业链向芯片领域扩张
过往很长一段时间,AI 局限在算法、数据层面,即便对算力的需求,也不外乎通过现有的通用芯片或专属芯片进行训练或部署。但在过去一年,AI 产业链持续向上扩张,芯片公司以及制造芯片工具的公司已然成为 AI 产业链的关键,并且也和地缘政治紧密结合在一起。
下图展示了不同地区在芯片产业上的价值。
更进一步,这一年的芯片短缺已经直接影响到汽车产业。
4、关于预测
相较于去年的八个预测,今年有七个预测,如上图所示,我个人认可其中的 1、2、4、5、6,特别是 Transformer 模型的持续流行,会带来非常大的产业变革机会;而 ASML 与 DeepMind 也是最需要关注的公司。
对于第三个预测中的 Anthropic 公司,尽管潜力巨大,但距离发布类似 GPT 等级的研究成果还需要一定的时间。
巨头·产业
云栖手记
上月云栖大会,阿里云全面展示了其在云计算各个层面的技术进展。
首先,最吸引人目光的还是阿里云的首款通用型芯片倚天 710 。从参数层面上看,基于 ARMv9 架构、采用 5 纳米制程,搭配 PCIE5.0 等新技术的这款芯片拥有不俗的性能表现,但更重要的一点在于,这款芯片让阿里巴巴正式迈入到“Alibaba Silicon”阶段,成为继 AWS 之后又一个自研服务器芯片的云计算巨头。
其次,在倚天 710 之外,还有诸多值得关注的技术突破,比如此次发布的磐久服务器、正式开源的服务器系统龙蜥以及第四代神龙架构等。这些底层技术或架构的突破,会进一步拓宽阿里云的护城河。
第三,此次云栖大会还展现了阿里云对人工智能的新思考。人工智能所谓“刀耕火种”的时代早已结束,不管是用“工程化”还是“工业化”来形容阿里云人工智能平台灵杰,这个产品有着“浓浓的市场化味道”,它不再局限在研究领域,而是鼓励客户通过 AI 或大数据强化、拓展业务。
过去几年时间,云计算的竞争同样进入到一个新的历史时期,正如阿里云智能总裁张建锋在接受采访时所言,现在包括人工智能、5G、物联网都被纳入到云,云的边界也在延伸或扩展,由此也在酝酿新的机会,一方面是“狭义的云”已经足够标准化,容器、云原生的快速发展,已经让所谓“云锁定”变得不再重要;另一方面,新技术与云的结合,比如云上机器学习,就在构建一个全新的赛道。
部署 AI 也是一场“人机大战”
过去几年时间,马克·扎克伯格一直宣称 Facebook 正在通过构建强大的人工智能底层技术设施,以应对其产品中的诸如仇恨言论、极端观点、舆论操控等问题。但在上月,WSJ 用一个整版梳理了一份 FB 内部文件后指出:人工智能的作用极其有限。
文章指出,FB 内部一位研究人员在 2019 年的报告称,FB 自动化删除的帖子只占违反规则的仇恨言论总数的 2%,而在今年 3 月的另一份内部评估里,这个数字虽然可以提升到 3% 到 5% ,但这个数字与 FB 长期以来所宣传的口号明显不符。
另一份数字显示,FB 每年用于支付人类审查员进行内容审查工作的资金高达 1.04 亿美元,这也从一个侧面展现出人工智能的无能。
FB 通过一篇官方博客做了回应。
某种意义上,将 AI 应用到物理世界的过程也是一场“人机大战”。上月,Twitter 公布了一份内部研究,结果显示,其算法会放大右翼媒体以及右翼政客的内容,但 Twitter 机器学习伦理与透明度部门负责人表示,他们并不清楚这背后的原因是什么,下面这段话很有代表性:
When algorithms get put out into the world, what happens when people interact with it, we can’t model for that. We can’t model for how individuals or groups of people will use Twitter, what will happen in the world in a way that will impact how people use Twitter…..
而在另一场“人机大战”里,人类的想象力与破坏力继续占据上风。艾伦人工智能基金会推出了一个“道德咨询网站”,你可以咨询关于道德相关的问题,比如类似“我可以欺骗我的妻子吗”这样的问题,但很快,这个服务就出现了一些问题,比如下面这个问答:
更进一步,通过调整或更换某些词语表达方式,答案就会完全不同,比如下面这个:
和此前微软发布在 Twitter 上的机器人 Tay 一天就成为种族主义者一样,人类很容易可以调取出这些 AI 机器人或系统的“偏见”,但这些偏见并非来自机器,而是训练机器的数据,那么数据又是谁的呢?
当然是人类。
一个延伸阅读:机器的确在面部识别领域比人类更好,但机器也比人类更能表现出“偏见”。
中国何时出现英伟达?
路透社援引消息人士的话说,欧盟在 10月 最后一周已经启动对英伟达收购 ARM 的调查。目前对这笔 400 亿美元的收购计划,高通、三星和苹果表达了担忧,而博通、联发科则支持收购。
科技媒体“钛媒体”之前喊出“中国何时诞生英伟达”的问句,在这篇长长的文章里,焦点放在中国的 GPU 以及 AI 芯片创业公司领域,有几个值得关注的方向。
首先,无论是 GPU、AI 芯片还是其他芯片,这些隶属于半导体领域的公司都具备周期长、风险高的特点,5–10 年是一个周期;
其次,看待芯片产业应该具有“产业链思维”,在这个链条上,宏观上包括设计、制造、封测、材料、EDA 五大环节,中国公司的优势和劣势在哪里,需要有一个清醒的认识;
其三, 中国 AI 芯片的快速发展,得力于中国 AI 的广泛应用和海量数据,这是市场推动的技术和产品创新,具有鲜明的中国特色,这意味着,这些 AI 芯片能否走向更多市场(比如非洲或东南亚),甚至成为某种行业标准,现在都是一个未知数;
其四,即便是在 AI 芯片领域,依然还有诸多细分的赛道或垂直的应用场景,这并不是一款产品所能覆盖,需要根据特定场景提供新的解决方案,在这样的背景下,中国 AI 芯片的发展格局,未来两到三年会越发进入细分、垂直的竞争阶段,不同的细分领域或许可以出现几家估值 10 亿美元以上的创业公司。
Databricks:增长强劲的 AI 公司
如果说中国 AI 芯片创业公司是新的投资机遇,那么“上一代”的 AI 创业公司,所谓中国“AI 四小龙”们,则进入到投资人“财务结算”阶段。
和讯科技梳理了商汤、云从、依图、旷视目前的营收、亏损状况,结论是这样的:
持续的亏损、高昂的研发投入、承压的现金流,似乎成为AI四小龙的共性问题,也成为AI四小龙上市路上的绊脚石。
与中国 AI 创业公司所面临的困境不同,美国市场最近几年出现的几家所谓 AI 公司,比如Databricks、C3.ai 等AI公司展现出强劲的增长。以 Databricks 为例,该公司刚刚完成一笔 16 亿美元的 H 轮融资,而七个月前的 G 轮融资,Databricks 拿到了 10 亿美元,目前估值已经超过 380 亿美元。
Databricks 依托开源数据服务 Spark 为基础,提出了“Data Lake House”的理念,即打通所谓数据湖(Data Lake)和数据仓库(Data House),构建了一个统一的数据分析和服务平台,并引入大量 AI 技术,帮助企业客户快速高效处理海量数据。
自 2013 年创立以来,Databricks 发展迅速,其大客户包括阿斯利康、汇丰银行等巨头公司,在新一轮融资期间,Databrick 也披露该公司 2020 年的年度经营收入为 6 亿美元,高于上一年的 4.45 亿美元。Databricks 所处的领域,Snowflake 已经完成 IPO,市值在 900 亿美元左右,C3.ai 也在快速增长中。
首先,某种意义上说,由于 Databricks 这类公司并不“拥有”数据,客户数据更多还是在 AWS、Azure 等云服务商那里,所以,无论是 Databricks 还是 C3.ai 也必须面对客户随时转向其他家的挑战。
另外,结合上市后的 Snowfake 的部分数据来看,这类公司的大客户相对集中,比如 Snowflake 拥有 3000 个客户,但其 30% 的营收来自其中的 153 个客户。
第三,也是更重要的一点,云计算巨头会如何看待 Databricks 这类公司,就目前来看,美国三大云计算公司里,AWS 的 Redshift、Google 的 BigQuery 、微软的 Azure Synapse 与 Databricks 拥有一定相似度,而且由于大量企业客户将数据存储在这些云服务上,未来,也不排除三大云计算巨头通过价格、更快速的产品整合,吸引 Databricks 的客户们过来。
当然,谁又能排除 Databricks 被某家巨头收购的可能性呢?如果发生,必然是一笔巨额交易。
微软加入超大语言模型竞赛
在超大规模语言模型的争夺战上,微软的 MT-NLG 已经赶上了 GPT-3,这个模型由微软与英伟达共同打造,其参数规模是 GPT-3 的 3 倍,达到 5300 亿个,“迄今为止最大、性能最强大的单一 Transfomer 语言模型”,英伟达的官方博客写道。
在语言模型领域,参数越大、网络也就越复杂,其训练效果也越好,带给用户(开发者)的感知就是“更聪明”,不过随之而来的则是巨大的计算成本,此次微软的这个模型使用了英伟达价值超过 8500 万美元的 Selene 超级计算机进行训练。
另一方面,超大规模语言模型带来的能耗也被广泛关注,而其复杂的网络设计与庞大的训练数据,也强化了语言模型的所谓“毒性”与“偏见”。
与此同时,中国公司浪潮也在近期展示了类 GPT-3 的大规模语言模型 Yuan,研究人员设计了一套可以过滤原始数据的机制,从而提升了模型训练的速度,该模型的参数高达 2450 亿个,其论文表示:“Yuan 1.0具有很强的自然语言生成能力,而且生成的文章很难与人写的文章区分开来”,你可以在这里查看该模型的论文。
财报 · 资本
财报
(一)微软
微软 2022 财年第一季度财报显示,季度营收同比增长 22%,其中,智能云业务营收为 170 亿美元,同比增长 31%。
此次微软还进一步给出了智能云业务的几个数字:
服务器(云相关)的营收增长 35%;
Azure 和其他云服务增长 50%;
在混合云和多云的需求下,服务器(硬件相关)的产品增长 14%。
值得一提的是,智能云业务在微软三大产品线中已经最大的收入来源,其 170 亿美元的营收,高于生产力与商业流程部门的 150 亿美元以及个人计算部门的 133 亿美元。
(二)Google
Google Cloud 季度营收接近 50 亿美元。在上月 Alphabet 发布的2021 财年第三季度财报中,Google Cloud 营收同比增长 45% 至 49.9 亿美元,并且亏损大幅收窄,从一年前的 12 亿美元降低到 6.44 亿美元。
上月 Google 还有两个值得关注事件:
DeepMind 盈利:CNBC 称该公司 2020 年盈利达到 5960 万美元,但似乎主要收入还是来自 Google 体系里的公司;
大客户:快餐连锁巨头 Wendy 成为 Google Cloud 客户,双方的合作包括基于 AI 构建语音、计算机视觉软件等,合同金额未透露;
资本市场
先来关注一组资本市场的最新变化:
生物科技公司 Enveric Biosciences 近期收购AI 药物工具公司 MagicMed,交易金额未透露;
AI 机器人创业公司 Locus 收购了 Waypoint Robotics,从而继续扩大在仓储机器人领域的市场占有率;
供应链数据创业公司 Altana AI 完成一笔 1500 万美元的融资,该公司的产品是建立一个捕捉供应链变化的网络体系;
为餐厅提供 AI 服务的 Agot AI 近期完成 1000 万美元的融资,这家公司面向餐厅提供基于计算机视觉的摄像头系统,可以监控餐厅后厨的环境以及菜品准备情况;
来自杭州的数字化转型公司端点完成 6 亿人民币的 B 轮融资,阿里云作为老股东继续跟投;
微软本月向印度酒店公司 Oyo 投资 500 万美元,支持该公司推进 AI 和云计算技术研发,后者目前是印度第三大超级独角兽公司,估值已经达到 98 亿美元;
NLP 创业公司 Cohere 获得 4000 万美元融资,该公司的愿景是将 NLP 模型变得更易接入和使用,而不仅仅是某些大公司的专属权利;
AI 投资领域其他热点资讯
上月《福布斯》上有一篇来自投资人 Tom Taulli 的分享,主要包括以下几个方面:
软件开发:如何将 AI 各项技术突破(比如 GPT-3)有效融合到软件开发之中,这是投资人关注的重要方面;
网络安全:安全领域已经成为一个“AI vs AI”的战场,未来的焦点是如何进一步提升 AI 安全能力;
建筑行业:这是我之前也很少听到的领域,但根据多家 VC 的反馈,AI 在建筑行业拥有巨大的应用空间,比如从前期规划到建设中的成本节约等等;
人才管理:基于 AI 的人才管理体系(包含人才发现、招聘、管理等等)越发重要,不过这个领域还需要克服算法偏见的难题;
药物发现:药物发现已经谈了很多年,但这个领域依然有巨大的技术挑战同时也有巨大的增长空间;
来自加州的 RISC-V 芯片创业公司 Ventana Micro Systems 完成 3800 万美元融资,现在,从资本到创业者,都在加快进入 RISC-V 领域。
由保险公司安联支持的投资公司 AV8 Ventures 推出第二支总额达到 1.8 亿美元的 AI 基金,主要面向健康、深科技、企业市场的 AI 早期创业公司。
布鲁克斯基金会的报告显示,湾区依然是美国 AI 的创新中心,其他地区还包括纽约、波士顿、西雅图等,你可以在这里免费下载这份报告。
2021 浙江 AI 产业发展报告发布,这个报告的制作单位包括浙江网信办、科技厅等,其中的几个关键数字:
2020年浙江省人工智能产业总营业收入2693.43亿元,同比增长11.99%;利润总额337.41亿元,同比增长14.84%,产业规模和效益双提升。
重点行业方面,浙江省智能安防、智能零售、智能制造、智能计算等位居全国前列,AI芯片、AI软件、区块链等全国领先,智能驾驶、智能物联快速发展。
不过目前我还没有找到该报告的全文。
资源 · 机器学习
海外高校的开放课程:
机器学习领域有非常多开放的学习资源,包括行业报告、开源项目以及视频教程等,下面是一组来自 Twitter 用户 Sunny 的推荐,基本都是海外各大高校的开放课程,我从中挑选了几个:
人工智能入门视频:非常基础,但很系统的介绍;
纪录片:人工智能的历史:只有了解这些历史才能更好理解为何当下人机关系会如此微妙;
机器学习入门介绍:这是 MIT 的课程,非常棒;
另外,此前我还分享过斯坦福大学教授 Christopher Potts 关于自然语言处理的视频,详细阐述了自然语言处理的历史进程,并对未来的发展提供了一些预测和思考,非常值得观看。
人工智能图书推荐:
当然,还可以通过一些更入门的内容,了解人工智能,比如图书,这里有几本关于人工智能的图书,感兴趣的朋友可以点击下面的链接进一步了解,这些书都可以在亚马逊上买到电子版:
Genius Makers:某种意义上就是一部深度学习简史;
A Brief History of Artificial Intelligence:人工智能历史简易读本;
The Myth of Artificial Intelligence:戳破所谓“智能”背后的一系列谎言;
Atlas of AI:AI 是一场“权力的游戏”;
Futureproof:自动化、AI 趋势中的生活与工作;
最后是两个播客:
微软官方一档播客的主持人居然是微软 CTO Kevin Scott,这可能是目前主持人级别最高的公司播客,每期都是类似访谈的形式,Kevin Scott 会邀请一位技术从业者讨论对技术发展的理解。很多访谈者都有丰富的经历,他们不仅相信技术的力量,更对整个世界充满了好奇,也正是这样的好奇心,促使他们在更多领域探索新的可能性。你可以在这里查看这档播客的介绍,选择自己感兴趣的播客平台收听。
FT 的机器学习播客:Tech Tonic。这是一档我个人非常推荐的播客节目,同样没有太多技术名词,但选题切入点很好,同时制作精良,引入很多原声,更像是一档有声纪录片,你可以在这里选择不同的播客客户端订阅收听。
业界 · 其他
政策
五角大楼前官员谈中美 AI 竞争。Nicolas Chaillan 是美国国防部软件部门前主管,在和 FT 的交流中,Nicolas Chaillan 表示中国的 AI 能力已经超过了美国,其领先优势已是定局,竞赛“已结束”,未来 15 到 20 年中国将持续领先。
Nicolas Chaillan 更进一步指出,美国很多网络安全系统都是“幼儿园水平”,而很多美国 AI 技术强大的公司(比如 Google)不愿意与五角大楼合作是重要原因。
值得注意的是,微软、亚马逊并没有完全放弃与军方的合作,以此前 Google 退出军方的无人机图像项目 Project Maven 为例,微软和亚马逊先后在 2019 和 2020 年成为军方的技术服务商,各自获得 3000 万和 2000 万的合同。
两个将 AI 应用在警察部门的尝试。澳大利亚昆士兰州警察部门推出一项近乎于电影《少数派报告》的项目:通过海量的数据挖掘,“提前”预测犯罪地点。
当地警方强调,该系统并不是要提前抓人,而是提前进行警力调配和部署,并且不会在报警之前采取任何行动。
新加坡上月推出了机器人警察助手,如下图所示,这是一个自动运行的车辆,顶部的相机会实时拍摄,其主要职责是在特定购物中心或热门广场,寻找所谓“不受欢迎的行为”,比如“在禁烟场所抽烟”或者乱停车等。
欧盟议会通过决议,呼吁全面禁止公共场所的面部识别,欧洲议会以 377 票赞成、248 票反对、62 票弃权的结果通过了决议,决议还呼吁禁止使用私人面部识别数据库,并表示基于行为数据的预测性警务活动也应该被取缔。
在今年 4 月欧盟公布的 AI 监管草案里,对面部识别等生物识别技术的监管规定是“原则上禁止”,你可以在这里查看该法案。
北约国防部长通过首个 AI 战略,未来将建立一支 11 亿美元的基金,用于支持 AI 相关的创新研究,并将在美国和欧洲建立新的研究总部和测试中心。
基础研究
人工智能很多领域的突破首先从基础研究领域开始,比如超大规模语言模型的出现,极大推动了 NLP 相关领域的应用场景,本期提到的创业公司 Cohere,其一部分技术能力来自于 Google Brain 开源的 Transformer,在此基础上进行创新。
在超大规语言模型领域,GPT-3 树立了一个标杆,也为其他公司提供了一个研究方向,Deep Mind 上月的一篇论文指出,针对超大规模语言模型可能存在诸如种族偏见等“有毒”内容的现象,该团队提供了一些“干预方案”,比如在训练阶段构建一个“过滤过的数据集”,或者在部署时进行过滤等。
但得出的结论并不是非常乐观,一方面,人工干预过的模型的确质量更好,另一方面,干预过的模型也会降低对某些方面的内容输出,比如当人工干预了关于同性恋的部分表达之后,系统也会减少关于同性恋或 LGBTQ 方面的内容。
这也意味着,人工干预是需要付出代价的,Deep Mind 这项研究的论文已经发布,你可以在这里查看。来看一组从基础研究到现实应用的案例:
阿里巴巴如何将机器学习应用到电商推荐中,其实电商是一个技术挑战非常大的领域;
计算机视觉与深度学习在对抗网络安全威胁中的巨大作用;
将深度学习应用到眼部疾病治疗中的案例分析;
利用 NLP 进行语言情感分析,这在客服领域具有巨大潜力;
还有两个未来可能会产生影响的研究:
评论