去搜搜
头像
张勇All in 阿里云,能否进入新阶段?| AI内参
2023-06-22 10:00

张勇All in 阿里云,能否进入新阶段?| AI内参

文章所属专栏 全球科技纵览·趋势必读 第二季
释放双眼,听听看~
00:00 07:04

作者 | 赵赛坡

头图 | 视觉中国


本期首先关注大模型的监管,结合欧洲议会通过 AI Act、英国的 AI 监管计划等最新动态,分析其对产业发展的潜在影响。


张勇专注阿里云、腾讯云踏入大模型赛道构成本周中国云计算市场最关键的行业事件;2023 已过半,中国云计算发生了那两类事情,本期将提供一些思考。


本期 AI内参还将关注:


· 聚焦大模型领域的多重关系,比如大公司与研究公司(微软和 OpenAI)之间、科技公司与媒体之间、公司员工与大模型之间;

· CB Insights 100 榜单;


马上就是国内的端午假期,祝各位订阅读者朋友端午节快乐、好运相伴。


大模型·监管


在新技术监管方面,欧盟的行动虽然不是最快的,但极具代表性。本周,欧洲议会通过欧盟 AI 法案(AI Act),这是一项全面监管 AI 技术与产品的法案,旨在构建起欧盟地区各成员国全面监管 AI 发展的监管框架。


这项法案在过去几年已经在欧盟内部经过了多次讨论,部分内容被媒体广泛报道,比如该法案采用“基于风险等级的管理方法”,通过划分不同的等级,制定不同的监管措施,其中“高风险的技术”包括可能影响选民、操纵选举的工具、算法等。


而对于 ChatGPT 等大语言模型,AI Act 也给出了几个明确要求,包括:


· 提供大模型的公司必须对由人工智能生成的内容进行标注,以防止滥用人工智能传播虚假信息;


· 提供大模型的公司需要公布用于训练其工具的受版权保护数据摘要;


这些要求和今年 4 月中国网信办发布的《生成式人工智能服务管理办法(征求意见稿)》之间有一些相似之处。不过需要指出的是,该法案还需要在欧洲理事会进行新一轮讨价还价,最快将在今年年底达成最终协议。


英国是欧洲另一个积极推进 AI 监管的国家,某种意义上,英国首相 Rishi Sunak 希望将 ChatGPT 相关技术变成“让英国重新伟大”的关键筹码。其目标是在 2030 年,让英国成为 AI 技术的引领者,《经济学人》杂志上周模仿乔布斯推介麦金塔电脑时的样子生成了一副配图:



与宣言相匹配的,则是 Sunak 和英国政府的一系列举措:


· 与 OpenAI、Google DeepMind和 Anthropic 三家公司达成协议,三家公司将向英国政府提供 AI 模型的早期访问权限,以帮助政府提前评估 AI 模型的风险;


· 计划在今年晚些时候举办全球 AI 监管峰会,邀请主要国家领导人共同谈论全球 AI 监管的议题。


但正如《经济学人》所指,英国政府——也包括其他主要国家政府——都需要面临如何构建起高效、稳定的本地计算架构,无论是充足的 GPU 供应还是可靠的电力保障以及庞大的技术团队或生态公司,所有这些都需要巨额的投资,回到一句大俗话:钱当然不是万能的,但没有钱又万万不能。


几个主要国家近期的 AI 监管措施:


· 印度:全新的《数字印度法案》将加入对人工智能,特别是生成式 AI 的监管,该法案预计将在本月出台;


· 新加坡:政府公开表示没有推出 AI 监管措施的时间表,但鼓励企业通过“AI Verify”工具包评估 AI 技术或产品的影响;


· 澳大利亚:立法机构即将立法,禁止诸如 Deepfake 或生成式 AI 技术生成的虚假与误导内容,同时还将研究这些技术在版权、隐私保护中的影响;


事实上,当下各国对于监管 AI 的热情,与其说是为了防范技术带来的负面影响,倒不如说是一种技术保护主义,通过制定一系列广泛的监管法规,各国都希望能够把算力、数据与人才留在自己境内,这也是前几年半导体地缘政治竞争的新发展阶段。


就像我在之前几期 AI内参里多次谈到的,未来全球主要国家,各自都会有一个属于自己的大模型,围绕这个模型,还会构建起一个芯片、软件以及产业生态,这会成为 2020 年代的新常态。


大模型・云


阿里云上周正式将 AI 模型社区魔搭作为开源产品推向市场,这是阿里云最新“1+4”开源战略里的关键的“1”,至于“4”,包括操作系统、云原生、数据库和大数据。


根据阿里云提供的数字,目前魔搭社区拥有 15 款支持中文的开源大模型,开发者数量超 160万,模型下载量超 2500 万,累计开源开放了 900 多个优质 AI 模型。


大模型开源的价值显而易见,一方面,能够降低企业进入大模型领域的门槛,不必花费巨资购买专有模型或API,可以借助开源模型和社区的力量,快速推出基于开源模型的产品或应用;另一方面,开源模型也为众多关注数据安全的企业提供了新选择,相比于把数据交给诸如 OpenAI 这样的商业公司,很多企业的数据更应该放在自己的大模型里。


这里还有 8 个开源 AI 模型或产品,感兴趣的朋友可以关注一下。


不过对阿里云来说,近期最大的消息还是新任 CEO 人选最终敲定,根据阿里巴巴控股集团董事会主席兼 CEO 张勇的全员信


阿里云智能集团完全分拆已经启动,正处于向上发展的最关键时期,必须全身心投入。同时为了适应未来发展规范和要求,其个人不宜再同时担任两家公司董事长与CEO职务。


经阿里巴巴控股集团董事会同意,张勇将于今年9月10日卸任阿里巴巴控股集团董事会主席兼CEO职务。张勇此后将专职担任阿里云智能集团董事长兼CEO,专注阿里云的发展,持续提升阿里云的行业竞争力与全球竞争力,让阿里云为各行业尤其中小企业的数智化升级提供更优质安全便捷的基础服务。


这也意味着,在经历近半年的过渡之后,“张勇时代”的阿里云,将随着阿里云的分拆进入到一个新的发展阶段。


今年年初,我在 AI 内参里谈到阿里云在 2023 的机遇和挑战,现在看来并不过时,比如组织架构的继续调整,会延续到阿里云分拆的过程中,从一家阿里巴巴的云计算公司到一家独立的云计算公司,这个过程并不容易。


其次,大语言模型带来的增长还处在早期,但已经显示出巨大潜力,“通义千问”或“千问专属大模型”等产品,过去半年已经给行业释放了强劲信号,接下来围绕大模型的算力与生态布局值得长期关注,下半年的杭州云栖大会应该有不少看点。


本周另一个值得关注的云计算事件是腾讯云正式踏入大模型赛道。与其他云计算大模型玩家——阿里云、Azure——不同,腾讯此次并没有推出基础通用大模型,而是专注于行业小模型,这些小模型被集成到 MaaS(Model-as-a-service,模型即服务)服务解决方案里,供不同行业的客户选择。



上图展示的是腾讯大模型的产品框架,根据腾讯云官方的说法:


腾讯云 MaaS 是基于 TI 平台打造的行业精选模型商店,覆盖金融、文旅、政务、传媒、教育等 10 大行业,提供超过 50 个解决方案。在这些能力模型的基础上,客户只需要加入自己独有的场景数据,就可以快速生成自己的“专属模型”。


坦率来说,腾讯云的大模型战略过于保守,或者也是一种对市场的短期回应。


它过于聚焦在行业应用层面,向行业提供封装好的产品或方案,短期内应该能得到不少客户。但长期来看,面向 B 端的大模型产品会呈现多元化的态势,除了这种开箱即用的产品,还需要一系基于通用模型的自定义版本,或许是腾讯现阶段的研发限制,我们还看不到腾讯的相关布局。


更进一步来看,大模型所推动的行业创新,还体现在更多行业、开发者甚至普通用户通过调用大模型 API,解决自身企业或行业问题的层面,但遗憾的是,腾讯云并未提供这些能力。


在经历了过去几年的战略动荡调整之后,腾讯云的发展战略已趋于保守。根据 Canalys 最新发布的中国一季度云基础设施报告,腾讯云已经“稳步”退到第三,市场份额为 17%,虽然第四名的百度智能云(8%)的市场份额无法影响腾讯云,但腾讯云与第二名——华为云——的差距其实是在变大。


生成式 AI 与大语言模型为所有云计算公司的增长提供了新的可能,不过至少目前来看,腾讯云还没有准备好。


2023 已经过半,过去半年时间里。中国主要云计算公司主要做了两件事情:降低部分基础云服务价格和推出大模型服务。比如阿里云核心云产品全线下降 15% 至 50%,腾讯部分核心云产品降幅高达 40%,降价的初衷既是为了充分利用大量闲置的计算资源,更是为了接下来通过其他服务“绑架”客户提供基础。


云计算的大模型服务竞争才刚刚开始,从基础的算力供给到通用模型能力,再到面向行业模型的产品能力,以及围绕大模型部署与开发的一站式平台能力,所有这些都会成为下半年中国云计算公司竞争的关键领域。


大模型·市场


WSJ 上周披露了 OpenAI 和微软之间复杂合作关系,比如,OpenAI 曾警告过早将 GPT-4 整合到微软 Bing 中存在风险,但微软无视这个警告,坚持第一时间推出新 Bing,导致新 Bing 初期的体验一塌胡涂,引发一系列质疑。


其次,微软与 OpenAI 之间的所谓“开放式关系”,也使得两家公司长期处在“合作中竞争”或“竞争中合作”的“薛定谔状态”里,不差钱但又想赚钱的两家公司,接下来还会延续这样的关系,不妨想象一下,当微软 Bing 发布免费“插件”之后是否会对 ChatGPT Plus 的销售产生影响?


在大模型领域,科技巨头还需要处理与媒体公司的关系,最近几个月,包括 OpenAI、Google、微软在内的多家科技公司,一直在和众多新闻机构谈判,讨论在大语言模型以及其他生成式 AI 产品方面的内容版权问题。


根据 FT 的报道,科技公司希望支付相应的费用,从而可以使用这些新闻机构的内容来训练他们的大模型,并且愿意与新闻机构合作,共同推进大模型在新闻领域的应用;包括新闻集团、《纽约时报》和《卫报》在内的多家英文主流媒体机构,也在努力争取自己的权益,他们不希望重蹈互联网时代的覆辙,让自己变成搜索引擎的“打工人”。


而随着大语言模型的应用场景越来越多,互联网上已经出现了大量由大模型生成的内容,当训练大语言模型的数据都是或绝大部分由大模型生成的时候,大语言模型的能力会出现怎样的变化,最近的这篇研究对这一预言给出了预言:模型可能出现崩溃。


从这个角度去看,世界依然需要人类所生成的广泛且高质量的内容,这也可以解释,为何 Reddit 敢于不惜一切代价提高 API 调用价格,这是其社区内容价值的体现;而加快与媒体机构合作,也是为了获取并使用人类生成的高质量内容,此前,FT 已经公开承诺,将继续支持由优秀人类记者撰写的内容。


与此同时,科技公司还在教育、引导与要求员工重新看待自己和大模型应用之间的关系,Google 母公司 Alphabet 建议员工不要将机密信息发送给任何一个大模型应用——即便是自己公司开发的 Bard。


类似的要求也出现在三星、亚马逊、苹果等公司的内部工作流程里,这里有必要再提醒一点,我们向 ChatGPT 等大模型应用输入的任何内容,理论上都存在被大模型服务商看到或使用的可能性,请务必记住这一点:不要在这些大模型应用里输入任何机密信息。


目前行业也在探索解决这个问题,比如 Cloudflare 可以提供一种敏感数据标注机制,企业利用该机制,能够限制员工将这些数据发送给诸如 ChatGPT 之类的大语言模型;Google 和 OpenAI 也有向企业客户提供价格更高但不会使用企业数据进行训练的模型服务,这个领域未来还有非常多的可能性。


一组与大模型相关的企业动态:


· Meta:推出两款新模型,文本合成语音的 Voicebox 和文本生成音乐的 MusicGen,后者是一个开源工具


· 英特尔:德国英特尔工厂的投资将从 170 亿欧元增加到 300 亿欧元,这会成为欧盟争取半导体市场竞争力的关键举措,与此同时,英特尔将在以色列投资 250 亿美元建设一家新工厂;


· 美光:未来几年投资 6 亿美元用于中国西安的工厂扩建,并再增加 500 个工作职位;


· 微软:正在筹建温哥华的研究机构,总部位于北京的微软亚洲研究院员工,有机会前往加拿大工作;


最后简单看一下 CB Insights 发布的 2023“AI 100”榜单,这是一份汇总全球 100 家 AI 创业公司的清单,这些大致分布如下:


· 特定行业的 AI 应用公司约占 30%;


· 跨行业解决方案的公司最多,有 40 家;


· 提供开发工具的公司有 27 家,这些公司提供诸如合成数据或矢量数据集等;


由于内容比较多,后续的 AI Insider 会再结合行业动态,进一步解读这份榜单,敬请关注。

本内容未经允许禁止转载,如需授权请微信联系妙投小虎哥:miaotou515
如对本稿件有异议或投诉,请联系tougao@huxiu.com
评论
0/500 妙投用户社区交流公约
最新评论
这里空空如也,期待你的发声