百度“小灵”首秀,AI为何能赚足眼球?

今年是“五四运动”一百周年,中央广播电视总台举办了主题为“我们都是追梦人”的 2019《五月的鲜花》五四晚会,在这场晚会中,百度大脑AI虚拟主持人“小灵”在众多高颜值主持人、演员中脱颖而出,赚足了观众们的眼球。

眼前一亮美少女

在很多的印象当中,机器人只是十分机械的机器与数据的结合,但是从鲜花通道中一出场的虚拟主持人“小灵”,就让人眼前一亮,得益于百度强大的3D建模技术和AR能力,化身成为立体3D的美少女,与尼格买提、王俊凯同台竞技。

活泼灵动开口脆

“小灵”并非是第一位人工智能主持人,?#19978;?#27604;于不讨好的机器音,“小灵”的音色显得自然很多,让人听着有一种舒适感,原因在于百度在AI语音库的制作上花了很大的功夫。AI语音库制作的步骤大概是三步:第一先确定音色、风格、产品的特征,将文本变成音频;第二配音员根据需求试音,收集?#23478;簦?#31532;三步?#24230;?#29983;产线,进行?#23478;?#25928;果优化,丰?#28784;?#33394;。百度大脑为此准备了几十个音库,找播音主持专业的学生专业录制了各式各样的声音,具备非常丰富的音色矩阵。

表情唇动显自然

除了声音信息外,唇动视觉同样非常重要。人的表情由面部肌肉和唇动共同组成,而人在不同的场合、心情的表情千差万别,可能有些时候我们都不能把一些表情进行正确的分类,但是“小灵”可以做到。百度基于“大量的面?#21051;?#24449;数据”提供了唇动技术,百度称之为“国内首家三维”唇动“系数预测”,可以做到“自动将输入式音频直接生成唇形动画”。百度大脑在检测到人脸后,对人脸进行分析,对眼、耳、鼻嘴等150个关键点进行定位,识别出人的年龄、性别、表情等,然后基于这些面?#21051;?#24449;,用深度学习的算法去学习归纳,学习人类的表情,使得表情更加丰富自然,便形成了我们看到的人工智能虚拟主持人“小灵”在晚会上能够“真实唇动”。

过去AI虚拟人物在说话的时候嘴巴一张一合,说话与嘴巴不匹配也让人?#26800;?#21313;分尴尬。百度大脑基于大量的面?#21051;?#24449;数据,?#36816;?#35805;人的唇动的行为特性进行了大量的?#33455;浚?#36890;过人工智能的深度学习,完成了国内首家“唇动”系数预测。截止到目前,市面上只有百度可以自动将输入式音频直接生成唇形动画。

知识积累超丰富

在晚会上,“小灵”会和观众打趣“如果掌声再热烈一点,?#19968;?#26377;更出色的表现”。还有这样一个场景:谈及自己的“第一部动画片” ,主持人小尼想要分享《喜洋洋灰太狼》,“小灵?#27604;创?#26029;他:“小尼哥,这是00后的童年回忆,属于你的应该是《黑猫警长》、《葫芦?#20540;堋貳!?/p>

“小灵”妙语连珠的口才、极佳的场控能力,不失为全场最精彩的地方。这个背后,需要实时互动与理解,更需要“知识”,而这与百度的人工智能算法和超过千亿级的知识?#35745;?#19981;无关系。

百度知识?#35745;?#20381;托海量的日志数据、网页数据和行业数据,综合运用语义理解、知识挖掘、知识整合与补全等技术,提炼出高精度知识,并组织成?#35745;祝?#36827;而基于知识?#35745;?#36827;行理解、?#35780;?#21644;计算等,在此基础上,支持百度众多产品,并且拓展出广泛的应用场景。据悉,知识?#35745;?#24050;经助力DuerOS(对话式人工智能系?#24120;?#23454;现10大类目超过100种能力,为智能音箱、智能电视等各类终端产品带来全面精准的人机交互问答能力。

知识?#35745;?#36824;能根据已有知识进行?#35780;懟?#20363;如,根据“爆炸或者燃烧物质和装置不可以带上飞机”、“酒精是爆炸或者燃烧物质”这两个知识,推断酒精不可以带上飞机,当用户输入查询之后,将直接反馈推断结果。知识?#35745;?#30340;加持,实现用户与应用之间更智能的交互。

人机交互AR

在百度APP小灵AR界面上,诸如“北大红楼名字的由?#30784;?#31561;五四主题内容,“小灵”都可以对答如流。在现场以及百度APP“五四青年节”搜索结果页都能参与的“通过人脸识别来测是什么花”活动,观众还可以通过百度APP扫描二维码,让小灵直接出现在观众的手机屏幕上,实现实时互动,这都是依托于百度AR Lab(百度增强现实实验室)。百度AR在今年的开发者大会上推出了DuMix AR 3.0,在MVP部分定义场景,然后对内容进行感知,根据不同要求进行呈?#37073;?#23545;目标进行跟踪,最后通过人脸表情、肢体手势、语音等进行人机交互,然后运用平台工具?#36816;?#26448;进行制作管理,完成上线,最后进入商业化运营。百度AR Lab的业务已广泛覆盖营销、娱乐、教育、文化等各个领域。

不得不说,“小灵”在晚会上机智又专业的首秀可谓圈粉无数。而这一切,都离不开百度大脑的多项AI技术的强大支撑。截至目前,百度大脑AI开?#29260;?#21488;开放了171项技术能力,涉及智能城?#23567;?#26234;慧教育、无人驾驶等众多领域。

说到AI开?#29260;?#21488;,自然少不了腾讯。近日,2019“AI Everything Summit”峰会在?#20064;?#22269;际贸易中心召开,腾?#37117;?#22242;高级执行副总裁刘胜义代表腾讯出席峰会并发表主题演讲,提出“AI向善”的发展观,他指出,在人工智能的时代,“人?#22791;?#20026;重要,“AI向善”将帮助人类提升生活?#20998;剩?#20026;社会发展创造新的可能。腾讯?#20013;?#25506;索将人工智能技术应用于寻回走失人员,打造“会寻人的AI”;在医?#24179;?#24247;领域,腾讯致力于打造“会?#35753;?#30340;AI”;并且投身于“AI+农业”的应用探索,在食物、能源和水?#35797;?#31561;问题上提供创新解决思路。

不管应用的领域如何,各家企业都是以“人”为出发点,从自身的基因出发寻找?#40092;?#30340;切入点,利用AI帮助人类提升生活?#20998;剩?#25552;出行?#21040;?#20915;方案。相信百度和腾讯?#19981;?#22823;胆尝试,探索更多可能。

本站互动交流QQ?#28023;?73168094:创意区 » 百度“小灵”首秀,AI为何能赚足眼球?

分享到:更多 ()
坦克世界网吧特权