本期首先关注 2021 云计算产业发展,试图回答两个问题:云计算还会持续增长吗?云计算的哪些环节增速更快?
本期推荐若干个行业大拿的演讲与访谈,包括吴恩达如何看待 AI 应用困境、张亚勤谈 AI 的产业机遇以及机器学习带给半导体的影响等。围绕 AI 带来的安全争议,本期提供几个新的观察视角,“中国人脸第一案”一审判决、《纽约时报》“假脸”系统的观察、Telegram 平台上的 Deepnude 图片争议以及两份关于社交媒体与网络安全的分析报告。
与此同时,英伟达新一季财报、阿里云神龙架构入选世界互联网领先科技成果、AI 在环保、历史和医疗领域的应用,也将是本期关注的议题。
产业观察:2021 的云计算产业还会持续增长吗?
2020 还剩下不到 40 天就结束了,这个星球上的居民度过了如噩梦般的 300 多天,在这个时间点,展望未来会有万千思绪,当把对未来的憧憬放在 AI、云的场合的时候,结合最近的数字和报告,或许可以看到一些角度和方向。
其一,云还会持续增长吗?疫情催生了巨大的在线服务需求,从企业协同办公到在线会议,过去的 2020 年,AWS、Azure、阿里云、Zoom 等公司的营收都在大幅上涨。
这是疫情带来的巨大机遇,同时也给包括华尔街分析师在内的众多机构一道新思考题:疫情对于云计算产业发展的刺激会结束吗?参考 FT 绘制的 “Stay-at-Home” 公司的股价变化趋势图,投资人已经开始警惕所谓回归正常后的产业变化。

而在 Gartner 看来,全球云计算的增长还将持续下去,预计在 2021 年增长 18.4%,达到 3049 亿美元,高于 2020 年的 2575 亿美元。
这意味着,从 AWS、Azure 这样的云计算综合服务商,到 Salesforce、Workday 这样专注某领域的公司,依然可以去瓜分一个更大块的蛋糕。
其二,云计算的哪些环节增速更快?很长一段以来,SaaS 都拥有巨大的市场规模,但结合 Gartner 的市场数据来看,PaaS 的增长势头开始加快,如下图。

这个变化也是疫情导致的结果,当企业开始将业务全面转向线上的时候,衍生出一系列新的基础设施,譬如钉钉就是其中的代表,如果说此前的钉钉只是企业的打卡、办公平台,那么经过 2020 之后,钉钉开始成为一个新的应用开发平台,这也是阿里云力捧钉钉的原因所在。
安全·伦理·争议
任何一项技术的快速突破,在推动行业、社会发展的同时,也在衍生出一系列问题,这是硬币的两面,也是我们全面认识技术发展意义的关键。
上周,被媒体称为“中国人脸第一案”一审宣判,新华网援引法院的说明对事件做了介绍:
2019年4月,原告郭兵支付1360元购买野生动物世界“畅游365天”双人年卡,确定指纹识别入园方式。郭兵与其妻子留存了姓名、身份证号码、电话号码等,并录入指纹、拍照。后野生动物世界将年卡客户入园方式从指纹识别调整为人脸识别,并更换了店堂告示。2019年7月、10月,野生动物世界两次向郭兵发送短信,通知年卡入园识别系统更换事宜,要求激活人脸识别系统,否则将无法正常入园。
此后,双方就入园方式、退卡等相关事宜协商未果,郭兵遂提起诉讼,要求确认野生动物世界店堂告示、短信通知中相关内容无效,并以野生动物世界违约且存在欺诈行为为由要求赔偿年卡卡费、交通费,删除个人信息等。
最终,法院判决杭州野生动物世界赔偿郭兵合同利益损失及交通费共计 1038 元,删除其办理指纹年卡时提交的包括照片在内的面部特征信息。
值得注意的是,在法院对于该案的审理中,援引了几个要点:
个人信息采集要坚持“合法、正当、必要”的原则和征得当事人同意;
个人信息的利用要遵循确保安全原则,不得泄露、出售或者非法向他人提供;
个人信息被侵害时,经营者需承担相应的侵权责任;
这其中,“合法、正当、必要”的原则有者诸多探讨空间,站在公共安全的角度,或许高铁机场对面部信息采集符合这个原则,那么公园与广场的面部信息收集是否符合呢?
“中国人脸第一案”远未结束,接下来的二审还会有更多值得关注的方面。
在流行的即时通讯平台 Telegram 上,大量由 AI 机器人,生产、传播数万张未经许可的女性照片。Wired 援引研究者的话表示,这些图像基于 DeepNude,将女性照片“移除衣服”,并生成裸体图片,然后分享到群组、频道等。
自 2013 年上线以来,Telegram 一直秉承不审查的理念,从而也成为诸如成人内容、恐怖主义等内容的传播平台。2018 年苹果曾一度下架 Telegram,目前包括意大利在内的欧洲多个国家,已经针对该平台的 AI 机器人展开调查。
针对互联网上越来越多的 “fake faces(假脸)”,《纽约时报》调查后发现这是一个巨大的市场需求,只需 2.99 美元就可以获得一张机器学习模型生成的假脸,而花费 1000 美元则能得到 1000 张假脸。
更进一步,《纽约时报》做了一个人脸生成系统,以了解更多关于生成“假脸”的细节。正如该报记者所言,人脸生成系统本质就是一个复杂的数学模型,调整几个参数,就能获得性别、年龄、情绪不同的照片。

《纽约时报》在其网站上提供了一个有趣的互动模型,非常推荐各位自行感受。
联合国区域犯罪与司法研究所近期发布的一份报告称,基于 AI 技术的文本、图像造假,使得整个社交媒体上充斥着太多虚假信息,这在全球疫情的背景下尤为突出,报告不仅勾勒出正在面临的巨大威胁,还提出了诸多解决方案(免费获取这份 44 页的报告)。
在同样敏感的网络安全领域,机器学习会给这个领域带来怎样的变化呢?乔治城大学的这个报告展现了机器学习在网络安全中技术潜力,比如与传统自动化的区别,并且强调机器学习在发现、改善网络安全漏洞中的应用价值。但与此同时,机器学习也成为网络攻击中的新技术,报告的结论相对保守了一些(快速获取这份 48 页的报告)。
行业·应用
利用机器学习探索不同时代的气味。这是一个名为 “Odeuropa” 的项目,上周刚刚获得 330 万美元的资助。整个项目将从明年 1 月起正式启动,持续 3 年时间,计划梳理出自 16 世纪到 20 世纪初的各种气味。
这个项目让我想起电影/小说《香水》,特别是在电影的镜头语言里,观影者可以感受到中世纪法国街头的不同气味。回到这个项目,根据 NPR 的报道,研究者们将利用机器学习技术,从文本(历史图书)、绘画作品里获取足够多的气味,然后形成相应的机器学习模型。
利用机器学习追踪大象。TechCrunch 介绍了近期开源软件社区、科技巨头利用机器学习算法和专属硬件,构建了一个追踪、保护野生大象的机制,这是 AI 应用的重要案例,特别是开源社区与商业公司的这类合作模式,也很值得借鉴。
AI 应用检测结核病,这是一个发生在印度的案例,通过一个手机应用扫描 X 光片提供的患病风险评估,可以帮助医生决定接下来的医疗方案。
这个案例里的几个角度也是观察当下医疗 AI 应用中的关键:其一,人类医生与 AI 应用/程序之间的关系;其二,AI 医疗应用的准确率是一个“本地数据”,比如印度结核病的诊断率一定比欧美国家高,因为后者患病率低,训练数据少;其三,AI 医疗对低收入地区意义重大,但这是一个需要时间与技术投入的事情。
观点·访谈
吴恩达谈 AI 应用的困境。在这场线上演讲里,吴恩达认为,解决 AI 从实验室到现实应用难题的三个路径是小数据、通用性以及鲁棒性。他指出,虽然目前 AI 的成功实践集中在互联网公司,但更大的机会是在零售、医疗等非互联网行业。
张亚勤谈 AI 算力与算法。这是张亚勤在世界互联网大会上的演讲,他不“完全同意”AI 发展需要算力提升,但认可 AI 带来的产业变革机遇,包括自动驾驶、工业物联网以及 AI+医疗。
机器学习、摩尔定律与半导体发展。这是 SE(semi engineering)对 D2S CEO Aki Fujimura 的专访,谈论的议题很多,我比较关注的就是机器学习带给半导体的影响,另外,Aki Fujimura 还谈到了他对摩尔定律进化的理解。
2020 AI 领域的五大争议。这个“评选”来自 Analytics India,包括以下五个方面:
GPT-3;
面部识别的伦理;
Deepfake;
英国学校的 AI 评分系统;
神经网络学术会议 NeurIPS 的论文评审过程;
这些争议充分展现了 AI 各项技术从学术研究跨入现实之后的众多困境,一方面是公众对未知的恐慌,比如 GPT-3 的“智能”;另一方面则是算法不透明性,比如英国学校的评分系统等。
短期来看,上述这些争议并不会消失,但这些争议以及背后的一系列讨论,势必会为这些技术的应用提供更多空间,毕竟,没有谁愿意做当代的“卢德分子”。
巨头·业界
英伟达三季度财报。上周英伟达又发布了一季涨势迅猛的财报,几个核心数字:
三季度营收 47.26 亿美元,同比增长 57%,环比增长 22%;
游戏业务营收 22.7 亿美元,同比增长 37%;
数据中心营收 19 亿美元,同比增长 162%;
英伟达官方新闻稿用了三个 “Record” 来形容上述三个数字。

在数据中心业务方面,财报提及了几个方面:首先是大客户,这个季度 AWS 与 Oracle 相继发布了使用英伟达 A100 GPU 的云服务器,此前 Google Cloud 与 Azure 都已经发布相应产品;其次是新产品,包括面向企业市场“交钥匙”的 AI 解决方案 DGX SuperPOD 与 DPU 产品等;第三则是一系列合作,包括与 Vmware、GSK 等公司的合作,推进 GPU 在混合云与药物发现领域的应用。
与此同时,英伟达还表示,关于 ARM 的收购将在 2022 年早些时候完成。
苹果为 M1 芯片的 Mac 用户带来优化版的 Tensorflow。Tensorflow 作为当下最火的机器学习框架之一,被广泛应用在各个行业。上周,苹果在 M1 芯片的 Mac 发售之后,也推出面向 M1 芯片的 Tensorflow 优化版本,充分利用 M1 芯片上的 8 核 CPU/GPU,可以有效提升 Mac 上机器学习模型训练效率。苹果给出数字显示,相比于在英特尔处理器上的机器学习训练,M1 芯片可以提速 7 倍。
阿里云神龙架构入选世界互联网领先科技成果。不谈这个奖项,只谈神龙,这是阿里云面向虚拟化场景的技术攻关,为了克服虚拟化过程中的计算损耗,从而在保障云服务器的性能基础上降低运营成本。
类似的方案还有 AWS 的 Nitro 架构,感兴趣的朋友可以看看亚马逊 CTO Werner Vogels 对这个架构的回顾与展望。
AWS。AWS 上周宣布将与恩智浦半导体(NXP)合作,共同推进面向下一代汽车的智能解决方案,这个方案将充分利用边缘与云在汽车场景中的不同能力,从而进一步增强汽车的智能水平。
据了解,双方的合作不仅是面向车厂,更希望可以将汽车具备的这些智能能力转为可延伸到汽车上下游的数据与资源,比如保险公司可以通过这些数据,形成更好的保险理赔方案等。
也是在上周,拉美地区最大的在线支付平台 Mercado Libre 宣布将使用 AWS 作为其主要云服务商。
Mercado Libre 目前在 18 个国家拥有超过 7600 万用户,该公司将使用 AWS 的 S3、EMR 数据湖、机器学习 Sagamaker 以及 EC2 等服务。


评论