去搜搜
头像
AI赚钱难,为什么他们还要执意做?
2019-08-14 10:26

AI赚钱难,为什么他们还要执意做?

文章所属专栏 活动实录

虎嗅注:

 

在虎跑团-前沿技术团第六期“走进科大讯飞”,人工智能商业化主题参访中,科大讯飞李世鹏(科大讯飞副总裁兼讯飞研究院联席院长)谈到:“AI目前阶段还是一个提高生产力的工具,而且会犯错,目前AI的准确率可以达到80%、90%。所以,你一定要有一个容忍态度,不要期望太高。但即使这样,它仍然能帮我们极大地提高效率,人机耦合的方法是目前AI应用的正确方法。”

 

作为AI领域的观察者和亲历者,李院长最后分享了他对当下对AI创业者的九条建议,以及未来AI还有哪些机会。

 

以下为分享实录,略经虎嗅编辑:

 

李世鹏科大讯飞副总裁、讯飞研究院联席院长):


我对AI分类和常见的不太一样,常见的AI分类分的比较粗,大概就是感知智能和认知智能,我把AI分为六层,主要讲的是不同层次需要的数据是不一样的,种类也不一样,一层比一层需要数据都更多一些,种类也更多一些。我把AI大概分为6层:通知、算知、感知、认知、预知、决知。



 

这究竟需要什么样的数据呢?

 

最高一层就是机器人帮你做决定。从数据的角度来讲,需要很多客观数据,通常大家讲数据,容易忽略的一个是环境数据,其实环境数据也变得很重要。我们看到所需的数据中有知识库、环境数据、用户个人数据,这些数据与相应层级间形成一个反馈环路,在这些数据的基础上就能达到不同层次的应用。

 

每一个层次的人工智能都需要很多类型的数据,从底层的人工智能到高层的人工智能,代表所需要的数据种类和数据量上的跳跃。层次越高,它需求的量就越巨大。如果在今天人工智能的框架下你要做得更智能的话,没有别的办法,只有足够多的数据和足够多种类的数据。

 

那么今天人工智能到底发展到哪一步了?


 


橘色的线代表了今天人工智能各种层次的发展。感知智能基本上成熟到可以用甚至好用。我的对感知智能的定义是它不能给你提供任何新的信息,只是把一个信息从一个难以处理的形式转变成另外一个易于处理的形式,以更方便后续的处理,包括我们的语音识别把声音信号变成了文字信号,也包括给人脸打标签的人脸识别,和翻译。把翻译放在感知智能的层次,因为他就是把信息从一种语言翻译到另外一个语言。

 

大家可以看到认知智能初露头角,但是还几乎不能用,只有在一些特别窄的领域里,可能机器人做得比人好,但整体大家对于认知智能的方法还不掌握。我的预测大概十年后认知智能会到感知智能今天这个程度,今天还远远不到这个程度。

 

这里面有很多不同的概念,归纳出来四个主要的概念:一是人工智能算法本身;二是机器人/IOT,我把机器人和IOT归结在一类,为什么归在一类?因为机器人和IOT都是跟物理世界交互,机器人可以改造物理世界,IOT可以从物理世界获取很多的信息;三是人,人在里面要占主要作用;四是所有元素都存在其中的环境。这四大元素可以概括了如今人工智能、IOT、机器人领域的所有需要研究的问题。

 

每个元素之间的交互会形成一门基础技术;每个元素本身的群体交互效应也会形成一个社会,人们的群体效应本身就是社交网络;机器的群体效应就是机器社会,也是以前被忽视的但现在很多人正在探索的内容;把所有AI的能力聚合在一起也许可以达到类人的智能。他们两两之间的组合体又被形成一些新的概念,基本上今天我们要做研究和做产业都逃不出这样一个大的框架。

 

虽然认知智能还没有达到好用的地步,但感知智能已经达到好用并且在很多方面已经在实际中发挥很重要的作用。可达讯飞的技术首先大家会想到语音技术,语音技术包括语音合成技术、语音识别技术等。很多人说语音识别技术可能现在没有门槛,随便一个公司都可以来做的,这是一个错误的概念。语音识别现在的趋势是越来越细,你要做得好的话越来越难。对于标准没有噪声的环境里面也许每个人都可以做得差不多,但是一旦有噪声或者环境比较恶劣或者讲话人有口音、讲方言的话,基本上很多其他公司就不行了。科大讯飞做了很多的工作,比如如果大家手机上装了讯飞输入法的话就可以知道我们可以支持23种的方言。我觉得这是科大讯飞对中国了不起的贡献,它一下子打开了那些一辈子不会讲普通话的人群的现代信息技术大门。

 

在翻译领域方面,讯飞的翻译技术已经可以达到英语六级,今年年底或者更晚我们将可以达到英语八级。

 

视觉技术在OCR,就是字符识别,人脸识别和场景的识别,还有医学影像的分析,安检X光影像自动分析等方面,科大讯飞都是走在世界前列的。

 

认知智能方面,讯飞在斯坦福的SQuAD竞赛中,多次在很多方面第一次超过人类的阅读理解水平。2017年底讯飞的AI机器人第一次通过了国家医生资格考试,满分是600分,360分及格,我们的机器人拿到了456分,超过了96.3%的人类考生。也就是说它如果是一个人类医生,它是Top 5%的优秀学生。这些都是科大讯飞在认知智能技术上进展。

 

人工智能技术是一方面,但如果不把技术应用到一个场景里面其实是无任何用处的。这里面AI技术应用分两个层次,一个层次是AI技术很直接的应用,我把语音已经识别了,把这个识别技术直接应用到记录、转写等应用上提高工作效率。但这仅仅是第一层,也就是把信息结构化的这一层;第二层,我觉得是AI更重要的应用,这一层应用把第一层结构化的信息进一步处理,包括翻译,包括文字处理、总结,也包括把这些结构化的信息应用到更大的垂直领域,包括教育、医疗等。

 

先讲第一层的应用。在语音合成方面,现在很多网站和电视台、报纸都在用于实时播放新闻。语音识别技术在人跟机器之间和人跟人之间的交互里面也把很多障碍都打破了。

 

科大讯飞也注重文化保护、语言保护,世界上很多地区只有口语交流,没有文字,包括中国的一些少数民族,也许将来人类不再有人能听懂他们讲的话,如果通过AI技术使机器能够听懂,并且会说,这将是对文化保护的一个巨大的贡献。

   

如前所述,第一层的应用大都是通过感知智能把信息从一个难以处理的表现形式转化到另一种易于处理的表现形式,也就是信息的结构化。其实结构化(Structuralize)也许并不是一个最恰当的词,也许文本化(Textualize)或者语义化(Semanticalize)更恰当一些,都相关,但都不是很精确。这里我想给大家一些概念上提升。以前我们熟悉的都是模拟世界的东西,不管是相机、录音笔或者其他的,都是记录的模拟信号。后来我们有数字化,实际上是把很多模拟信号变成数字信号,把它变成可计算的。


那么将来是什么呢?

 

将来也许就是通过结构化的一种语义文字信号的普及。以后我们所有对物理世界的记录,不管你照个相,或者录一个音,记录的不仅仅是一个说话的数字语音或者照片,同时它是把里面很多的信息给结构化了。也许将来你的手机录的这一段音直接就是有语音加上文字的,因为他把你的文字在里面也识别了并和语音同步了。也许你的相机拍的照片,同时就有人脸标注和物体识别及相关联的描述。我觉得这是从数字化又进了一步,是结构化或者是语义化的,这是下一代变革。

 

第二层才是是怎么把感识智能的技术集中到一起去解决更大的问题。接下来更多是怎么把这些结构化、语义化或者文字化的信息充分利用起来,帮助我们提高很多的效率,甚至利用认知智能的进展真正理解内容并帮助人们做决定,这个层次才是真正智能化的开始。讯飞在这方面做过很多工作,包括智慧城市和交通方面的工作,对于我们直接影响最大的几个方面:一是教育,一个是医疗。

 

大家知道教育在传统上面临一个很大的挑战是因材施教,这个事情我们讲了几千年,但其实真正做到因材施教的话很难。

 

那么怎么能够做到真正的因材施教呢?

 

首先我们会把这个学生所有的作业、练习、考试的试卷得给他数字化,然后我们把他结构化,也就是通过OCR的技术把他识别出来,结构化以后变成机器可以读懂的格式。

 

通过这套系统对试题进行分析,能够读懂这个学生的答题过程,因为对于考试题目相对来讲范围还是比较窄的,一些认知智能是可以做的。

 

对试题等进行分析之后,可以发现每个学生错的地方或者好的地方,我们会把他们放到这个学科的知识图谱上去,这样通过计算可以监测学生各种学习过程,并把他们真正对知识的掌握映射到知识图谱上去。AI已经可以完全对每个学生进行个性化的学习内容,只给他推送一些不熟悉的概念的课程或练习,可以做个性化的学习或者作业,因为它不需要再像传统学习过程一样不管你对不对都要做,节省了老师和学生们的时间,所以我觉得个性化可能真的是AI给我们带来的一个重大突破。

 

另一个是在医疗方面的一些应用

 

这可能是AI在另外一个领域的重要应用,一是我们把医生问诊的过程,用讯飞的语音识别技术把与病人的谈话做到精准文本化,一开始把病例数字化了;二是我们通过OCR技术可以把一些过去的病例给数字化。三是用我们的智医助理系统,做有效的分析、自动给出建议的诊断结果,当然最后还需要医生来确认的。我们利用前面所说的医学考试的智能系统,根据病人的病例输入能够辅助提示医生这些病人可能是什么病。它不但能够提供某种病情的可能性,而且把可能性的概率也算出来,并提醒下一步可能需要病人做什么样的检查,这样的话就可以一步一步引导医生锁定到最后真正的病因。

 

那么今天AI的发展带来什么利好,而AI技术当下面临怎样的挑战呢?

 

经过多年积累AI在很多领域慢慢变成落地的应用,人工智能经历了三个高潮和低谷,到今天进入以大数据驱动的深度神经网络阶段。

 

当前最大的威胁就是人们对AI的期望值太高,不管是投资者,还是很多初创公司把这个事情想的太美好了。现在大家还都在做一些依靠大数据的工作,基本上所有的AI初创公司都在做一些横向的AI技术,仍然没有能自己掌控的大的垂直应用,比如人脸识别公司在中国有上百家,主要精力还都是在做各种技术。

 

现在AI公司最大的竞争是在能不能获取更多和更有效的数据上,如果你没有某个场景的数据,可能遇到这种情况就不知道怎么去处理。

 

所以,我个人的观点一直对自动驾驶是谨慎保守的态度,因为如果仅仅依靠大数据训练出来的自动驾驶系统,一定会遇到它从来没有遇到过的情况,一旦遇到这种情况的话,肯定是要出事的。

 

另外AI还是烧钱的,将来公司的成功与否就看有没有一个很好的算法和很好的一个系统能把它的服务最有效的提供给用户。另外一块是现在是基于大数据的深度学习框架,遇到了数据的瓶颈,现在变成了可能最重要的问题。如何解决这个问题?有没有可能从认知科学、从人脑认知的机理去借鉴而打造一个新的框架?如何能把人的一些认知或者推理功能揉进现在的大数据框架里面?我觉得这是一些方向。当然,还有很多数据隐私保护问题、AI的一些伦理,都是要考虑的一些重要事情。

 

那么我这里面稍微提一下数据问题。现在基于深度学习的人工智能技术越来层数越深,而我们今天太依赖数据,所以数据成为我们的瓶颈,这在工业界尤其明显。我们现在特别怕定制一些人工智能服务,因为你要定制的话,就意味着你要为那个应用去收集、标注很多数据,这个工作量消耗的资源是巨大的。

 

现在的AI还需要很强的计算能力,多少算力才足够?没有人知道。


用一个开放的框架可能会解决部分问题,科大讯飞早就把自己的语音识别服务开放出来给开发者使用,同时今天我们也提供很多开放的软件、用户界面、云服务、用户数据给开发者。新一代人工智能产业技术创新战略联盟一个重要的职责就是促进中国在开放平台方面的建设。作为科技部第一批新一代人工智能开放平台,科大讯飞担任建设智能语音开放平台的重任。

 

此外,在用户数据的保护方面,我们需要开放的系统、标准和规则,这是条很漫长的道路。

 

最后谈谈作为一个创业者,在人工智能领域可以做哪些呢?

 

第一,人才培养和教育,这也许是人工智能发展过程中的一个很重要的产业,会成为一个很大的产业。因为以后对这个方面的人才需求越来越多,更多的需要会运用AI一些工具解决具体问题的AI应用人才。所以,这里面可能有很多潜力。

 

第二,AI数据的标注。那么如何更有效的准备数据、标注数据,并且在保护用户隐私的情况下,还能用这些数据去分享、共享,能促进整个AI往前发展,这是另外一大块。也许,将来的数据工厂不再是一个完全靠人力的数据工厂,而是一个更聪明的利用AI工具的智能工厂。

 

第三,算力,到底计算应该放在端上,还是放在云上,还是一个云、端、边缘计算的优化?当然解决算力的AI芯片也许还有很多的机会。

 

今天大家都在布局AI芯片,但是一个巨大的挑战是AI的最终框架是什么,谁也不知道。所以也许今天你做了AI芯片,为某个框架去优化,也许再过两年就会改变。我们还没有像英特尔X86这样的架构能做所有的事情。

 

第四,人机耦合,和谐发展。


现在的大数据、人工智能还有一些解决不了的问题,在一些关键领域,我们如何能让机器告诉人类,前面我遇到一个很复杂的场景,我没法处理了,人类是否应该快速介入。由此衍生出一个很有意思的课题,在机器为你推荐某些事情的时候,是不是也要给你一个可信度,这样在可信度低的情况下,人类就把它接过来,避免很多无谓的事故,或者一些严重的问题。这都是一些还没解决的问题,但是很有前景。

 

第五,正确性的角度,很多统计上有意义的事情,也许在其他层面上并不正确。

 

第六,系统,我们为什么解决问题要靠一个单一的信号源?其实把多个数据融合在一起也许是未来之路;即使做语音识别,为什么只停留在语音信号,为什么不能把你的口型、体态放进去,把我们的位置信息、时间信息都放进去,把我们知道的更高层次的数据放进去,这也许对未来人工智能发展带来更多的好处。

 

第七,细节,人工智能为什么越做越怕?因为最后都是在细节上,没有关于某方面的一些大量细致的数据,永远做不到极致。

 

第八,知识图谱和大数据,在今天大家都在讲知识图谱和大数据,其实还没有特别好的框架把这两者有机结合起来,我们看到很多领域大家已经在尝试这方面的工作。

 

第九,AI应用商店,我们知道中美之间很多有差距的地方在于美国掌握了很多应用生态,例如苹果应用商店、安卓的应用商店,在今天AI领域中,我们要不要建立一套属于我们能控制的应用生态?

 

例如,今天很多人在做智慧医疗,智慧医疗涉及的病种非常多,每家公司不可能全都做到,有没有一个智慧医疗的统一的框架,让大家把自己的能力、技能都放到里面去,组合在一起,会形成一个更大或者更好、更全面的系统?因而,这也是值得大家关注的一个领域。

 

更多的是一些展望,到今天,AI还是一个提高生产力的工具,而且会犯错,目前AI的准确率可以达到80%、90%。所以,你一定要有一个容忍态度,不要期望太高。但即使这样,它仍然能帮我们极大地提高效率,人机耦合的方法是目前AI应用的正确方法。

 

还有数据的花费与雇专家的花费,现在实际上是差不多了。那么你做人工智能企业的话要考虑,我是雇更多的比较便宜的标注数据的工人,还是去雇佣一个比较贵的算法专家?

 

还有一个就是数据驱动的算法,可能会创造一些新的技术领域。比如说多光谱,比如嗅觉传感器。嗅觉很有意思。气味跟传感器发生一些化学反应就能产生各种信号。但是这里面难在哪里呢?难在你不知道各种气味它对应的是什么样的信号和数据。所以,如果把数据驱动的方法放进来,那么可以产生新的AI领域。同样还有一些新材料、制药等都是这数据驱动方法可以解决的一些问题,会带来一些新的产业机会。


钟琨讯飞读写科技总经理):

 

如何使用人工智能技术去制造或者说去创造产品。

 

人工智能实际上是到了一定阶段,但又不是可以放心大胆去使用的这样一个阶段,这其实就是产品当中应该去探讨的。

 

大家总是对它能够做到这样一些特性有忽高或者忽低的认知。但如果我们要很好的设计产品,趋利避害,知道它最适合去应用的那个点,并且把和用户、人的需求好好结合在一起的话,是可以做很多的事情。换句话说,人工智能的应用产品对于一个产品经理,对于智能的拿捏,是非常关键的。

 

我举一个简单例子,酒店行业,比如温控器,根据不同的用户以及不同的外部气侯条件、不同时段等,调适出来一个当前最舒服的温度,像这些就是一个很好的人工智能应用场景。

   

我们真正对人工智能引起重视的话,其实跟两件事情是相关的,第一个当然是围棋大赛,第二当然是自动驾驶。我们大致认为,是在于人工智能真正能够解决或者改变的问题在于所有人的非创造性的劳动,其实都有可能会被人工智能所取代。

 

什么是非创造性的呢?体力是一部分,第二个就是属于没有太多创造性的,这种脑力劳动。比如说我会把今天我所讲的内容,去总结和凝练,这实际上是没有创造性的。所以实际上我们认为这件事情洪流是无法取代的,我们会一步步看到这个时机的到来。


很多时候是因为我们训练集远大于测试集或者应用集,所以其实它是一种数据的基础,或者说把人的一些经验在大样本当中去获得归类以后,应用在具体的一个应用场景当中。听起来是不够智能的,但实际上作为我们一个设计产品,或者考虑它如何去用的角度上来说,它其实是够用的。

 

设计产品的时候,不应该去考虑,它是否足够智能,或者是说它是否有足够的创造性,那不重要。重要的是它能不能解决问题和创造价值。今天自动驾驶所做的一切工作,都是希望让车经过各种各样的场景的训练,各种天气,各种路况,各种车况,等等的训练,它如果见的比司机要多得多,它可以把车开上路上,可以把大家的精力节约下来,这就够了。

 

我们会看到四六级的作文题,也是由机器进行人工的二评。简单看一下数字,机器和专家分数之间的一致率大概是92%,人和人之间在四六级上只能达到82%,在语文高考的作文上,专家之间一致率只能达到87%。机器能够达到94%。但是有一个问题,人们对于机器的容错率、容忍度是极其低的。

 

从另外一个角度上看,因为我们对于机器的要求是百分之百,大家都是这样的观点,因为你出问题,你下次一定还会出问题。但是我们从产品设计的另外一个侧面看待这件事情,一方面可能会是不公正的,对于产品的态度。另外一方面,我们要理解,当我自己是一个用户的时候,我也是这样苛求机器的。

 

从一个产品的角度看,产品当中必须要考虑到的,有可能你本身就要去规避的这些问题存在的可能性。

 

大家都会注意到,AI产品目前其实没有一个大品类。就是不会像很多行业,以前所经历的时代一样,比如在PC时代,到PC移动互联网时代,有很多的硬件能够喷涌而出。以及PC互联网时代,先出硬件后出软件,再是移动通信时代,都是这样一个特点。当然后来,渐渐地都是属于软硬一体。但是今天真正在消费电子领域的人工智能产品,虽然有很多个别的产品,但其实没有大品类。

 

今天如果我们要去考虑人工智能到底做什么的话我们必须要从原则性,或者从源头的角度上去考虑问题。其实有两个偶像,第一个是索尼,用一个简单的理念,在去改变我们的周围(特指消费电子领域),它是用声音去改变每一个事物。

 

第二个是戴森,它有一个共同的特征,它其实一直在玩风,它用流体力学去改变每一个事物。戴森去年发布了一盏台灯,因为他发现,几乎所有的灯具使用的年限,都和它的受热会有一定的关系,所以它的时间,使用寿命会缩短。戴森在他所发布的灯上面去使用了这种空气导轨,热空气能够流动的导轨,使得它的LED的灯珠,一直运行在比较低的温度下,让一盏灯能够运行40—50年。实际上我们会看到,几乎代森的每一个东西,都是用风在去改变生活。

   

我想讲这个例子是为什么呢?


AI产品创新的几个原则

 

就是说我们在看因为我们没有办法在copy to China,没有办法从美国再去探究什么。其我们反而要回到源头去看待一些基本的规则。

   

第一个原则是聚焦场景,为什么要强调这句话?今天做任何一件事情,只要不带运动部分,只要不带轮子或者是机械臂等的运动部分,你都逃不开一个话题就是云。这个东西不是手机可以做的。你做任何事情,其实大家都会问这个话题,但是实际上我们不要被手机桎梏了我们的思维,手机是万能的,但是它不是场景万能的。很多场合,其实不适合用手机。简单的例子,比如说在学校当中,在老师授课的时候,其实孩子用手机的话,一方面是尊重和礼貌的问题,第二方面,其实他根本控制不住自己的注意力。我们应该聚焦场景,去考虑产品的创造。

   

第二个方面,是改进现有的。今天人类的吃穿住行,其实已经前几次工业革命,差不多都已经被满足过一遍了。以全新的物种去满足人的这种特殊需求,基本上没有了。所以在这里面的话,我们的建议是,不需要改,不需要创造全新物种,把更多的实际上应该去改进现有的这样一些产品。

   

第三个方面,关键突破。我们认为,如果要想创造一个产品的话,必须要实现关键突破,我们在这里面用了一个词,叫做KFA(Killer Feature with AI),就是用AI所带来的关键特性,进行效率的提升。所以我们认为,聚焦场景改进现有和关键突破这三个点的话,能够创造,足以让消费者所喜爱的一些消费品。

   

以讯飞智能办公本为例,解决可能在书写或者笔记当中存在的一些问题。比如轻度办公这样的场合,笔记本电脑太重,纸张又存在容易丢、记不全和找不到的问题。所以这样一个场景,改进现有纸张或者纸质笔记本,并且用AI带来大幅度的效率提升,这可能就是一种新的产品。

 

我们怎么做的?

 

科大讯飞智能本将手写能力和AI能力能够结合在一起。首先谈突破的问题,记不全的问题怎么办?讯飞听见等这样一些设备,能够很好地记全。另外,就是智慧的记录,我想大家很容易理解。比如今天的演讲。其实当中有大量的废话,你不需要百分之百地记录下来。但是人的一个特质就是在于,如果我认真听,我就很难记的全,如果我非要追求记的全的话,我就是速记员,我根本没有办法深度思考。这个平衡点在于哪里?让机器去记录,你只需要记录你真正感兴趣的那个关键词,或者是提纲。

 

机器解决全的问题,你的提纲又会和文字和机器记录的结果进行一一对应,以至于你将来需要去回听,或者详细回述今天下午所谈的话题的时候,能够精准地找到。这是我们所看的第一个问题的解决之道。

 

第二个方面,是关于智能检索。我们每个人,每天都会去记录,一个月下来五六十页很正常,当我记下来几百篇的内容,我根本找不着。我们通过人工智能的方式,无论多复杂的内容,它都可以一句话找得到,这就能大大地帮助你能够梳理之前的一些思考。

 

第三个方面,就是内容容易丢的问题,很多人记在纸张上。70%以上,出了这个门就会丢掉。所以,其实丢掉的是笔记,更多的是头脑当中已经存储的idea,或者是很好的一个思路。

 

我们怎么办?

 

云计算或者是云存储,这个是老生常谈的问题。另外在这个基础上,又增加了一部分内容,实现云接力。就是在这里面的一些记录,其实云端还可以通过office把它直接打开,在office上能够继续进行编辑,最终作为office发出去,让大家都能够用起来。

 

几个典型的例子。额外我们加了会议记录、笔记阅读等一些方式,把基本东西能够更好地用起来。

 

总结来看,AI时代,创造有价值的消费类电子产品,可以考虑的是聚焦场景,改进现有和关键突破,关键突破就是我们所的KFA。AI不可能在今天能够达到完美的时刻。在非完美的时候我们如何去取舍它能够达到今天在技术上,在用户体验上比较平衡的一个程度,这其实是一个产品的,或者说这是一个企业,应该考虑的一种工作方式。

本内容未经允许禁止转载,如需授权请微信联系妙投小虎哥:miaotou515
如对本稿件有异议或投诉,请联系tougao@huxiu.com
评论
0/500 妙投用户社区交流公约
最新评论
这里空空如也,期待你的发声