头图来自视觉中国
本期导读:
焦点:DeepMind 的开放游戏系统会不会带来通用智能;
产业观察:中国云计算的上云与云上;
行业·应用:无处不在的机器学习与无法攻克的医疗 AI 难题;
芯片市场新进展:王座易主、收购、融资与技术新进展;
业界:自然语言理解的历史与未来可能;
焦点
DeepMind 的开放游戏系统会不会带来通用智能
上周,DeepMind 的一篇论文展示了一个新项目:Xland。
细节:如果说此前的 Alphago 是人类针对某个特定领域设计的 AI 模型,那么 Xland 是要通过构建一个更通用的环境,让 AI 模型自己学习不同领域的知识。
• Xland 是一个可以生成由静态拓扑和可移动对象组成的 3D 环境的引擎,可以创建模拟多种环境;
• DeepMind 将强化深度学习算法应用其中,每个智能体(AI 模型)在 XLand 的 4,000 个独特世界中玩了大约 700,000 个独特的游戏,并在 340 万个独特任务中经历了 2000 亿个训练步步骤;
发现:DeepMind 指出,一些智能体能够表现出类似“因果性”的行为,但目前还没有更进一步的证据。
我的思考:这个项目证明了通过强化学习模拟人类/动物获取智能的方式,也就是通过与环境的互动,从零开始认识环境,但这背后的代价:
• 昂贵的算力;
• 复杂的模型;
• 长时间的训练;
但即便如此,我们依然无法将 Xland 环境与真实环境对等起来,也不能将在 Xland 环境里训练的 AI 模型直接拿到现实世界应用,这仅仅是一个方向。
延伸阅读:
• DeepMind 关于 Xland 的论文;
• DeepMind 此前对强化学习如何推动通用智能的论文;
• 什么是强化学习,一篇非常简单而准确的入门介绍;
产业观察
中国云计算的上云与云上
上云:利用低价甚至免费的形式,中国的云计算公司还在鼓励企业上云。
• 华为 828 企业上云节:新闻稿;
• 阿里云 88 帮帮节:新闻稿;
云上的不同能力显然也是企业选择在哪家公司“上云”的标准之一:
• 政务云市场:IDC 的数据显示,华为云市场份额 32.17%;
• 视频云市场:IDC 数据称,2020下半年,中国视频云基础设施市场规模 31.1亿美元,腾讯、阿里、百度、华为、金山占据前五,瓜分 63.4% 的市场份额。
• 电力行业:阿里云联合南方电网构建了南网调度云超算平台;
接下来,“增长”是永不变的方向,但问题是从哪里增长:
• 公有云 IaaS:新的行业需求在哪里?
• PaaS:机器学习/深度学习或许是一个方向;
• SaaS:中国不存在真正意义上的 SaaS 公司;
• 政企混合云:这可能是最确定的方向,但没有哪一家有十足的胜算;
• 私有云:还记得 a16z 的一份分析报告吗?公有云未必是企业最有成本的选项;
• 多云:这在海外市场已经成为潮流,但在中国市场能引起多大波澜,目前还是未知数。
行业·应用
无处不在的机器学习与无法攻克的医疗 AI 难题
在刚刚结束的东京奥运会上,机器学习的应用无处不在。
• 赛事转播:阿里云与英特尔作为奥运合作伙伴,提供了包括 3D 运动追踪在内的关键技术;
• 运动装备:基于大量数据优化的耐克 Vaporfly 跑鞋能够减少运动过程中的体力消耗;
• 赛事设备:赛事记时服务商 Omega 利用计算机视觉技术精准获取运动员比赛用时;
• 冲浪:从对天气模型的应用到新的运动服装,冲浪比赛早已不再是一项“纯体育赛事”;
• 跳水:利用“3D+AI”辅助训练系统,中国跳水队的训练效果大大提升;
来自浙江大学的研究者将机器学习模型用于分析恐怖袭击。
• 研究者将 2002 至 2016 年全球 13 个地区的恐袭公开数据交给机器系统;
• 涉及哪些地区,如下图所示。
• 发现:恐怖分子倾向于同一个地点多次行动,恐袭发生地区与人口密度负相关。
• 延伸阅读:论文公开地址;
NASA 的五个机器学习项目:
• 探索火星的自动驾驶系统;
• 面向未来天空探索中的医疗研究;
• 利用机器学习的行星搜索项目;
• 机器宇航员项目;
• 月球上的导航;
但是,上述这些应用场景的成功,并不代表机器学习可以在疫情防控中“拯救人类”。
• 研究:BMJ 的一篇论文系统分析了几百个 AI 模型或方法,结果并不如人意,该研究还在持续更新中;
• 报告:英国国家数据中心与人工智能研究所的报告指出,疫情期间的 AI 研究存在众多局限性;
尽管如此,在更宏大的领域,资本市场与科技巨头依然看好 AI 与医疗的结合。
中国:根据亿欧智库的数据显示,2020 年中国医疗 AI 企业达到 129 家,医学影像类型最多,占比达到 42.6%。
全球:CB Insights 2021 二季度的数据显示,医疗 AI 领域的投融资引领所有行业。
巨头:Alphabet 旗下生命科学公司 Verily 将在以色列进行 AI 医疗的研究工作。
• 该研究机构位于耶路撒冷;
• 首要关注领域是结肠癌的诊断与治疗;
芯片市场:资本与市场
芯片王座让位。新一季财报里,三星营收超过英特尔,成为全球营收最多的芯片公司。
• 数据:三星 197 亿美元 VS 英特尔 196 亿美元;
• 原因:内存芯片的需求推动三星营收持续上涨,而疫情导致的 PC 芯片需求正在回落,英特尔增长乏力;
• 接下来:英特尔的代工业务如何,会成为其增长的关键,签下高通只是一个开始。
收购:富士康宣布 9080 万美元收购一家位于台湾新竹芯片工厂。
• 看点:富士康希望借助收购旺宏电子的一家未投产工厂,加速进入汽车芯片领域;
• 接下来:该工厂未来将成为富士康全球半导体中心;
• 监管背景:汽车芯片短缺,引发中国监管部门对哄抬价格的关注 :“加强市场审查,打击囤积居奇、哄抬价格和串通等非法行为”;
融资:中国资本市场对芯片创业公司的热度有多大,不妨看看这家半年完成三轮融资的创业公司:爱芯科技。
• 融资速度:4 月完成 Pre-A 和 A 轮,8 月完成 A+轮;
• 投资方:创投领投,联想之星、聚投资领投,耀途资本、万物资本、韦豪创芯、美团、GGV纪源资本、美团龙珠、冯源资本、元禾璞华、石溪资本、天创资本以及高德地图创始人成从武等;
• 业务:高性能、低功耗的人工智能视觉处理芯片,2020年12月第一颗芯片 AX630A 已实现量产;
• 创始人:仇肖莘博士曾任紫光展锐CTO、美国博通公司副总裁,并曾担任AT&T Labs首席科学家;
在疯狂的资本之外,还有观察芯片的另一个维度,技术。
AI 芯片基准测试 MLPerf 发布了最新成绩单,这份测试展示的是不同芯片在不同数据集上的能力。
为什么重要:这份不断更新的测试说明了两点。
• AI 芯片的发展速度非常快,Google、英伟达几乎是在“军备竞赛”;
• 不存在“统治级”的 AI 芯片;
业界 ·其他
OpenAI 的 Codex 推出 API。这个产品能够将自然语言(目前仅支持英语)转化为编程语言。
来自硅谷的数据标注公司 Snorkel 完成 8500 万美元融资,仅仅用了两年,该公司的估值就超过 10 亿美元,成为又一只独角兽。
苹果 7 月的一篇新论文,详细介绍了如何利用本地设备部署机器学习模型,以识别相册里的人物。
中宣部等五大部门联合发文,要求治理算法推荐,“加强文艺评论阵地管理,健全完善基于大数据的评价方式,加强网络算法研究和引导,开展网络算法推荐综合治理,不给错误内容提供传播渠道”。
关于 AI 是否具备申请专利的问题,澳大利亚和南非法院给出了不同的答案。
数据是 AI 发展的关键,但涉及隐私与安全性,很多数据又是非常昂贵的,合成数据成为数据科学领域的新趋势,这里有最近的一系列探索。
自然语言处理是目前火热的领域,斯坦福大学教授 Christopher Potts 的这个视频,详细阐述了自然语言处理的历史进程,并对未来的发展提供了一些预测和思考,非常值得收藏。
评论