【巨头打卡智博】搜狗携“虚拟主播”亮相 让你与爱豆面对面交流
重庆客户端-华龙网
2018-08-21 15:45
听新闻

重庆客户端-华龙网8月21日15时30分讯(记者 周晓雪 实习生 邱小雅)首届中国国际智能产业博览会(简称:智博会)将于8月23日在重庆开幕,不少互联网巨头将携最新“黑科技”参展。今(21)日,记者获悉,智博会上,搜狗将展示其语音、图像、问答、对话和翻译等领域的AI技术及落地应用,包括搜狗个性化语音合成、智能语音识别、虚拟主播、人脸迁移、唇语识别,以及搜狗翻译宝等AI硬件。在展台现场,观众不仅能体验唇语识别的高识别准确率,还能体验通过人脸迁移技术秒变明星的神奇效果,全方面体验搜狗以语言为核心的AI技术。

玩转“虚拟主播” 让你与爱豆面对面交流

搜狗虚拟主播技术演示。搜狗供图 华龙网发

想跟你喜欢的明星面对面交流吗?想看看你成为主播是什么样子吗?智博会现场,搜狗将展示全球首个高度实用化、定制化的虚拟主播。这个主播可以模仿你的声音和说话方式,“复制”你的容貌和面部表情并生成一个“你”,然后对任意的文本进行音视频播报。

虚拟主播技术还能根据用户上传的单张人物图片,比如明星、朋友、家人等,实时生成该人物的虚拟主播形象,用户可以与其面对面交流。

据搜狗相关负责人介绍,虚拟主播背后的技术结合了人脸识别、人脸建模、语音合成以及深度学习等多项前沿技术,能将任意文本转化为相应的唇语,为用户提供多模态的交互体验并具备高度的可定制性。

该技术可以运用在诸如新闻、媒体内容等场景中,自动实时快捷地生成富媒体内容,也可以应用于教育、医疗、客服等多个行业,节约大量的人力成本,还可以应用于各种具备交互能力的智能软硬件。

一个有趣的畅想画面是,虚拟主播可能还将催生具有情感的交互App,比如帮助粉丝和爱豆实现“面对面”的交互追星App;上传用户自己喜欢的形象,结合搜狗的问答技术,可以与之进行定制化问答的陪伴App等。

体验“变声”“变脸” 听王小川唱《我的滑板鞋》

你想听搜狗公司CEO王小川唱《我的滑板鞋》吗?本届智博会上,搜狗将展出其“个性化语音合成”技术,能将任意文字转化为清晰自然、富有表现力的语音朗读出来,相当于给机器装上了人工“嘴巴”。

搜狗将展出其“个性化语音合成”技术。搜狗供图 华龙网发

搜狗的语音合成技术目前支持离/在线、男/女、中/英共23种音色,在“BlizzardChallenge2018”语音合成大赛的可懂度和语音停顿项任务中排名第一,已被广泛应用在智能客服、新闻播报、语音导航等众多场景之中。

观众不仅能体验“变声”,还能体验“变脸”。搜狗将展出的“AI人脸迁移”结合了人脸识别、三维人脸拟合、表情控制等多项前沿技术,只需单张人物图像,就能瞬间完成换脸体验,可实现面部实时动态变化效果。

该项技术可以运用在直播、视频互动、影视制作以及教育等丰富场景中,搜狗正在不断探索这些AI新技术的应用场景,建立其与未来智能生活的连接点。

看翻译“黑科技” 只看口型就能读出你的心

在王小川看来,“语言”是AI的未来,“掌握一种语言就是掌握了一种灵魂”。本届智博会上,搜狗也将展出其自主研发的语音识别技术与机器翻译技术——机器同传。

搜狗唇语识别技术。搜狗供图 华龙网发

基于搜狗的语音识别、机器翻译以及风格迁移技术,搜狗机器同传不仅能实现语音到文字的中英实时同步翻译,还可以根据说话人的声音进行数据训练。然后,将其音色附加到翻译内容中,并输出与说话人原语音音色相同的译文语音,达到真正“音意同步”的同传效果,语音识别准确率高达98%。

识别语音对于人工智能来说,已经是“小菜一碟”了,如今,不听声音只看口型,人工智能就能读出你的心。

智博会现场,观众可以只需动动嘴,唇语识别技术就能过面部识别、唇形特征提取,并输入到模型中识别出对应的发音,从视频中识别出讲话内容。经过数千小时的真实唇语数据训练,搜狗“唇语识别”系统在非特定人开放口语测试集上,该系统达到60%以上的准确率,在垂直场景命令集如车载、智能家居等场景下甚至已经达到90%的准确率。

展位现场除了一系列前沿技术体验之外,搜狗还会带来旅行翻译宝、录音翻译笔、糖猫儿童智能硬件等产品,让观众感受AI技术带来的生活便捷体验。

(如果您有新闻线索,欢迎向我们报料,一经采纳有费用酬谢。报料微信:hualongbaoliao,报料QQ:3401582423)