头图|视觉中国
本期“AI内参”专栏,首先关注英伟达上周的一系列动作,其新产品和在投资者会议上的姿态,如何让英伟达实现一万亿美元的“小目标”?
除此之外,Google 使用机器学习提升芯片设计、车企自研芯片争议、Alphabet 分拆量子计算公司等,都是近期围绕计算的重要事件。
“产业·洞察”聚焦中国云计算市场,当“真正客户”越来越少,所谓的云计算“深水区”会如何影响中国云计算的竞争格局?
本期还将关注:
巨头:腾讯的出路、AWS 押注游戏、Google Cloud 价格调整等;
行业:合成数据里的机遇;
应用:韩国大选中的数字人、如何分辨 Deepfake;
趋势:两份调查报告展示人机关系与可能被取代的职业;
接下来,欢迎和我一起复盘过去一周全球数据与计算领域的产业变化。
产业·计算
一万亿美元:英伟达的小目标
英伟达无疑是上周计算领域的绝对主角。
在 2022 GTC 大会上,英伟达发布多款围绕计算的产品,其中面向数据中心计算领域的两个产品:
GPU H100,采用台积电 4N 工艺,相比上一代 A100,FP8 性能提升 6 倍,FP16、TF32、FP64 性能各提升 3 倍;
CPU Grace 超级芯片:由两个 CPU 芯片组成,采用最新 Armv9 架构,拥有 144 个 CPU 核心和 1TB/s 的内存带宽,将于2023年上半年供货;
除此之外,还有网络层面 H100 CNX、一体计算设施 DGX H100 等多个产品更新,下图是英伟达此次更新的产品图,图片来自英伟达投资者会议 Slides,感兴趣的朋友可以在这里获取。
就像上图所展示的那样,英伟达早已不再是一家 GPU 厂商,而是进化为一家拥有(形态与性能)或大或小的产品、涵盖众多(现在和未来)场景的芯片巨头,当然,资本市场也给了足够肯定,截止到上周五,英伟达市值达到 6950 亿美元。
Digits to Dollars 在一篇分析中指出,环顾业界,或许没有人意识到,仅仅几年时间,英伟达的竞争力护城河竟然如此之深,其他竞争对手呢?
英特尔:理论上具有对抗英伟达的实力,但在 CPU 式微的大环境下,英特尔在其他计算产品的能力无法撼动英伟达;
博 通:网络是其最大优势,但在其他方面的投资几乎可以忽略不计;
高 通:数据中心与网络方面的布局几乎没有;
AMD:CPU 能力不足,并且没有网络能力;
英伟达投资者会议上还有一张令人印象深刻的 Slide,如下图所示,这是英伟达的目标——为什么英伟达可以成为一家 1 万亿市值的公司?
这其中的驱动力除了 GPU、CPU 之外,还有汽车领域的巨大增长潜力,要知道在英伟达 2021 全年 270 亿美元的营收里,汽车业务仅占 2%,营收为 5.66 亿美元。而下图里,英伟达展示了其未来 6 年汽车业务 110 亿美元的增长潜力,如此多的汽车公司——从传统车企到新贵创业公司——都是英伟达的客户。
在车载芯片之外,英伟达也发布了包括高精地图平台 Drive Map 在内一系列软件、工具包以及 Hyperion 8 解决方案在内的众多产品,所有这些都构成英伟达面向未来的汽车布局,而接下来,就静静等候明年上半年陆续发布的搭载英伟达 Orin 芯片的自动驾驶车辆吧。
来看一组计算领域的重要新闻,Google 和加州伯克利大学的研究者们分享了一个发现:深度学习可以有效优化 AI 芯片设计。根据其博客上的信息,研究者引入了一个名为 PRIME 的方法,通过“学习”过往的设计图和数据生成 AI 芯片架构。
通过机器学习优化 AI 芯片设计,一直是 Google 关注的一个方向,2021 年 6 月,Google 发布了一篇利用强化学习加速芯片设计的论文,并将其应用到下一代 TPU 的设计中。
Google 母公司 Alphabet 上周将旗下的量子计算公司 Sandbox AQ 分拆,路透社称,Sandbox AQ 拿到了 9 位数(数千万美元)的融资,将为客户提供基于量子的网络安全服务,
越来越多的汽车公司喊出自研芯片的口号,国内科技媒体雷锋网给出的判断是:车企造芯没有未来。现在去看这个观点是对是错并无意义。即便知道可能失败,无论传统车企还是新锐公司,无不需要自研芯片的噱头来为接下来的战略做赌注。
Trendforce 发布了 2021 全球十大集成电路设计公司营收排名,高通、英伟达、博通位列前三。
产业·洞察
中国云计算市场
与各大咨询公司乐观的云计算市场预测相比,至少在中国市场,其“真正客户”规模并不大。
比如互联网公司就是一类“真正客户”,他们“懂技术,有技术能力,也不用教育”,但“这样的好客户越来越少”,原因是互联网公司几乎都已经上云,这是一位从业者的感叹。
这也意味着,中国云计算公司需要发现、挖掘更多的客户,阿里云如此,腾讯云亦如此。负责腾讯企业业务的汤道生提出过一个词“深水区”,他的延伸解读是,“离腾讯原来优势更远的这些行业”。
在这样的背景下,云计算在中国的发展呈现出一系列新的态势,比如是否需要组建庞大的销售团队,以此来争取行业大客户?或者,是否放弃公有云,以满足更多传统行业客户在私有云、混合云方面的需求?以及,如何在技术、销售成本大幅增加的同时,进一步提升产品利润?
如果说一般意义的 SaaS 已经在中国绝迹,那么所谓的“公有云”热潮也在逐渐消退,无他,市场需求如此。
从这个角度去看,中国云计算接下来的市场会越发集中到几个巨头公司,他们在技术、人才方面的优势,以及可以为一个项目不惜任何代价的烧钱能力,会让诸如 UCloud、金山云等所谓的“中立云”更加边缘化,Canalys 最新给出的数字,2021 年中国的“IaaS+PaaS”市场上,阿里云、华为云、腾讯云和百度云四家公司拿下了 80% 的市场份额,2022 的云市场会越来越惨烈。
巨头·云
腾讯
上周腾讯发布了 2021 年第四季度财报,其中腾讯云所属的金融与企业业务板块营收 480 亿元,一举超过营收 428 亿元的游戏板块,成为腾讯营收贡献最大的业务,占比达到 33%。
腾讯的未来只能是云。一方面,至少在短期内,监管层面不会放松对游戏的管制,腾讯游戏业务也将受到持续影响,相比于 2018 年腾讯成立 CSIG 时的互联网产业环境,现在可谓更严峻,腾讯公司总裁刘炽平在财报分析师会议上直言:“目前,互联网行业正在遭遇结构性的挑战和改变,腾讯作为其中参与者也会主动进行调整”。
另一方面,相比于游戏业务简单、粗暴式的躺赢,无论是金融还是企业业务,都是一个脏活、累活,这需要构建一支庞大的销售、支持团队,并且还要持续进行技术投入,腾讯从未透露过其云业务的相关数据,鉴于整个行业的特点,腾讯云一定处于亏损状态。
那么问题来了:一定时间的亏损并不是问题,如何通过亏损的方式建立起市场、技术的护城河?作为一个参考,阿里云花了将近 12 年时间才实现真正盈利。
另外,腾讯可能还面临一个未落下的监管“大锤”,WSJ 援引消息人士的话称,中国金融监管机构将针对腾讯微信支付的问题开出一个“创纪录的罚单”。
AWS
上周 AWS 发布一组面向游戏领域的解决方案,这家云计算巨头进一步押注游戏市场。
一份来自咨询公司 Newzoo 的数据称,预计到 2024 年,全球云游戏市场规模达到 65 亿美元,这意味着,为游戏公司提供云产品是一门巨大的生意。
纵观此次 AWS 发布的产品,既包括针对游戏开发场景的服务器、安全产品,也将 AWS 的 AI 和机器学习能力纳入其中。
与此同时,AWS 同时推出:
GameSparks 预览版,这是一个全托管的游戏后端开发套件;
AWS GameKit 正式通用,这是一个帮助游戏开发者快速部署产品的开源解决方案;
Google Cloud
十月开始,Google Cloud 将调整部分产品的价格,根据其官方博客透露的信息,主要影响数据存储、数据传输等方面。
与消费产品价格调整带来的直接涨价/降价影响不同,企业市场,特别是云计算市场的价格调整,其带给客户的账单变化往往非常复杂。
原因在于,企业客户通常会使用一系列云服务商的产品构建自己的应用或产品,这个过程里,云服务商某个产品的价格调整,可能需要叠加其他产品的价格才能影响到企业客户,也因此,当我们再听到云服务商——特别是国内云计算公司——宣传“降价”的时候,不要被轻易迷惑,很可能对你的业务来说,云服务商是在“涨价”。
微软
微软上周更新一个名为“Z-code”的 AI模型,该模型能够有效提升机器翻译的质量,利用迁移学习的能力,可广泛应用在一些训练数据比较少的小语种语言翻译过程里,根据微软的说法,在保证计算量不变的情况下,可大幅提升模型的参数规模。
另外,微软上周也和英伟达达成合作,双方将在 GPU 机密计算方面展开合作。
产业·其他
先看合成数据,一个显而易见的事实是,数据是整个 AI 领域发展的根本动力,但在各国加大数据监管的情况下,数据极其昂贵同时使用场景也越发受限,此时,利用计算机生成的数据,也就是合成数据成为行业关注的焦点。
咨询公司 Gartner 在 2021 年给出过一个预测,预计到 2024 年,AI 项目中的 60% 数据将使用合成数据。
过去的一年,Meta(Facebook)、微软已经展示了各自在合成数据领域的布局,而创业公司 Gretel AI、Mostly AI 也相继完成数千万美元的融资。
上周,计算机视觉合成数据创业公司 Datagen 获得 5000 万美元的融资,该公司向客户提供合成图像数据,比如面部数据,帮助客户快速提升模型能力。财富 100 强的众多公司都是 Datagen 的客户,该公司表示, VR/AR 以及元宇宙是近期增长最快的应用领域。
《财富》杂志曾报道了包括美国运通、JP 摩根在内的金融行业如何使用合成数据。
不过,合成数据的价值并没有得到一致的认可。原因在于,合成数据公司还处于早期阶段,其提供的合成数据产品到底如何提升机器学习模型还无法得出确切的答案。
韩国大选中的数字人技术。不久前的韩国大选期间,候选人尹锡悦团队采用了数字人技术。一支技术团队开发了一套算法,通过学习 20 小时的音频和视频,构建起了一个数字人:AI Yoon。
AI Yoon 不仅是一个静态展示的数字人,而且具有一定的互动能力,自今年 1月开始,数以万计的韩国网民向这个数字人提出了各种问题。
法新社称这是一场“深度伪造的民主行为(Deepfake democracy)”,能够实现这场行动也是因为韩国法律允许 AI 候选人参与竞选。现在留给世界的一个命题是:当各国政治家千方百计宣扬自己“更真实”的时候,一个虚假的数字人会如何改变政治的游戏规则?
沿着 Deepfake 的话题,上周一则乌克兰总统泽连斯基宣布“投降俄罗斯”的 Deepfake 视频被广泛传播,很难确定这个视频的创作者是谁,但这一类视频显然具有极强的传播力,虽然包括 Meta、Youtube、Twitter 在内的网站已经删除该视频,但依然可以在一些平台上看到。
加州大学伯克利分校的教授 Hany Farid 谈到分辨类似视频的几个关键点,其一是视频声音的清晰度,特别是伪造某些领导人讲话的场景里,一般会通过声音清晰度差来掩饰视频的虚假;其二,关注视频里的人物动作,尤其是讲话的人有没有肢体动作;其三,关注视频里的画面动作连贯性,Deepfake 视频都是一帧一帧地制作,因此很出现画面过渡不自然的情况。
视频之外,由于利用 GANs 生成照片的成本越来越低,社交媒体上的假照片——特别是假头像——也越来越多,一款由 AI 创业公司 V7 Labs 发布的照片检测工具上架 Chrome 商店,其检测准确率高达 99.28%。这个工具的原理针对 GANs 进行的逆向工程,因此其局限性也存在,那就是无法应对非 GANs 生成的照片。
来看两份调查报告,Gartner 在对一组美国消费者的调查后发现,有 70% 的美国消费者希望可以在工作中使用 AI 技术,受访者在 9 类工作中的态度如下:
而在另一份由 Future Today 基金会发布的报告里,AI 对于不同职业的影响可能与我们想象的不一样,诸如软件开发者、律师助理等职业都会受到冲击,这与之前我们一直以为的蓝领工人——卡车司机、搬运工——会被 AI 取代的想法不相符,“因为这些职业的变动很大”,该基金会负责人 Amy Webb 如是说道。
根据这份报告,随着大量无代码/低代码平台以及 RPA 技术的成熟,未来十年知识工作的形态也会发生根本变化,感兴趣的朋友可以在这里获取该报告。
还是低代码,NYT 上周梳理了一组 AI 领域的低代码工具,尽管当下这些工具还有诸多不足,但计算机发展的历史,某种程度上也是不断“让代码变少或隐藏”的历史,这是我看好的未来。
评论