来自 科技 1970-01-01 08:00 的文章

科技讯 11月22日下午消息,近日在微软小冰年度研究进展分享会上,微软小冰三大首席科学家分享了小冰近期的技术突破,包括唱歌、会比喻等。

2019年8月15日,微软正式推出了第七代小冰。微软小冰首席NLP科学家武威认为,Self-Complete(自我完备)可以很好地概括近些年来微软在小冰身上的研究成果。一个能够自我完备的对话机器人应该拥有几项能力:学习、自主管理、连结。

“我认为这三项能力贯穿起来就构成了一条纵线,贯穿了对话机器人这些年来,甚至可能是未来一段时间整个的研究与发展。” 武威表示,其实还有一条横线,横线就是微软小冰核心对话引擎的进化。小冰一开始做检索模型,通过重用已有的人类的对话来实现人机交互,后来团队又做生成模型,让小冰自己能够去合成回复,再到后来做共感模型,希望小冰能够自主的去把握整个的对话流程。

“这条横线和那条纵线实际上交错在一起,构成了一幅对话机器人发展的绚烂画卷。”

其中,学习包括能够从人类的对话中学习怎样说话,以及机器人之间互相学习。

武威透露,团队今年尝试了让两个机器人通过互相学习来共同进步。即让两个检索模型在训练过程中互为师生,互相交流。在每一次迭代的时候,一个模型都把它从数据中学到的知识传达给另外一个模型,同时又从另外一个模型中接触到它的知识,然后这两个模型互相学习,最终希望能够得到共同的进步。

微软小冰首席语音科学家栾剑提到了小冰唱歌技术的进展。他透露,小冰是从2016年开始做唱歌的,之后经过努力,小冰在语音合成领域一些大的问题已经被解决了,团队就开始寻找一个更有挑战性的课题继续来做,所以就选择了唱歌。

选择唱歌主要有三个原因:唱歌的门槛比说话高,在技术上有难点;情感表达上更加丰富激烈一些,歌曲是一种喜闻乐见的形式;它是一个很重要的娱乐形式,唱歌做好了,应该是很有市场前景、很有方向的。

深度学习其中一个很重要的支撑就是数据,现在有大数据的支持才能够把深度学习做的这么好。而“对唱歌这个任务来说,数据其实是比较困难的,因为相对于说话来说,清唱的数据是非常少,绝大部分的数据是混杂的、伴奏的音轨。”栾剑表示,团队曾经和唱片公司进行合作,利用了其数据库中已有的混合了伴奏的数据进行很好的学习。

据悉,小冰唱歌也有一定的商业化前景,比如其日本分身已经与唱片公司签约。

栾剑总结认为,接下来不管是人工智能创造,还是唱歌提高上,都要两条腿走路,一边要不断提高模型,一边要不断挖据更多的数据,这两个东西如果做的更好,质量会不断得到提高。

小冰目前除了写诗、会画画、会作曲、会唱歌,今年另一个进展是可以创造比喻。微软小冰首席科学家宋睿华表示,希望小冰真正创造出人类不曾说过的比喻,而不是在人类已有的文章里去挖掘这种比喻句,不要用“像”、“就像”、“一样”这样子的模板把它挖掘出来。

为了帮助小冰学会“比喻”这项技能,宋睿华透露,他们从复杂的诗歌中挑选了6大类,每类122个主题,并通过小冰聊天日志过滤出了包括爱情、内心、世界、母亲、美丽、人类在内的96个常用比喻概念。随后从1000个常用词中选取了3000个最常用的形容词扩充小冰的比喻能力。

比如爱情与国足,它们共同的相关词汇可能有未来、虚幻,那么小冰就可以作出“爱情就像国足,未来都是虚幻的”这样自然的比喻句。

“我们其实想让小冰更像人,你会发现除了工作,听音乐是你很大的一个享受。我觉得人跟动物的不同在于有一定的自主性,人工智能创造体现了一种自主性,包括作曲、写诗、画画,我们做算法的人也不知道最后会产生什么样的结果,你在那一瞬间就会有一个错觉,觉得她有意识,这是非常好的一个点。”宋睿华表示。(雪梅)

热门文章