你能分辨出AI和真人的声音吗?先不要着急,现在的AI技术已经使人的声音和AI声音愚蠢地无法区分。
今年3月,人工智能初创公司偶邦(ObEN)发布了对其AI声音技术的图灵测试挑战,通过公众号、微信群、网站、微博、Twitter等社交平台发布了图灵测试的招募链接,最终吸引了700多位网友的参与。
如今,图灵测试的结果公布,结果令人惊讶:竟然有30%的人分不清AI和真人的声音。
ObEN发布的“真人or AI”听力测试
图灵测试(The Turing test)是由英国数学家阿兰·图灵(Alan Turing)于1950年的一篇论文《计算机器与智能》中提出的,图灵也是计算机时代的奠基人之一,这篇划时代的论文预言了创造出真正智能的可能性。
图灵测试的基本设想是:让计算机来冒充人,看它能不能“骗”过人类。
具体实验方法是:将测试者与被测试者隔开,双方进行五分钟的对话,再让实验者判断与之对话的是真人还是计算机。如果通过多次的实验,不足70%的人判断正确,即有超过30%的被测试者误以为和自己说话的是人而非计算机,那么就判定该机器通过了图灵测试,成功“骗”过了人类,就可以认为该计算机拥有“智能”。
根据阿兰·图灵在1950年的预测,到2000年,人类应该可以用10GB的计算机设备,制造出可以在5分钟的问答中骗过30%成年人的人工智能。
但遗憾的是,当前技术的发展远远落后于这个预测。
之前比较有名的案例是2016年宣布通过图灵测试的作诗机器人“薇薇”,该机器人由清华大学语音与语言实验中心(CSLT)研发,在“薇薇”创作的诗词中,有31%被认为是人创作的。2018年Google I/O开发者大会上,谷歌发布了具有AI订餐功能的Google Assistant,无论是声音还是反应都让人听不出是AI,这也是机器通过图灵测试的一个例子。
《未来简史》的作者尤瓦尔·赫拉利指出,“根据图灵的看法,计算机究竟有没有意识不重要,重要的是人类会怎么想”。赫拉利在书中举了一个生动的例子,阿兰·图灵本人是个同性恋,而当时同性恋在英国是违法的,图灵在1952年被判犯有同性恋行为并接受了化学阉割。图灵测试其实就是复制每个同性恋男子在1950年的英国所必须通过的日常测试:你能装成一个异性恋吗?
偶邦(ObEN)图灵测试结果
其实偶邦(ObEN)的AI技术并不算完美通过图灵测试,在测试结果中,六题中有五题错误率超过了30%,剩下一题的正确率为26.2%,但是可以说偶邦(ObEN)的技术已经无限接近图灵测试的标准了。
这种让真人都难以识别的声音背后是偶邦(ObEN)独特的文字转化语音发声引擎(TTS,Text-To-Speech)技术和个性化人工智能技术(PAI,Personal AI)。用户只需录制一段十几秒的音频,该技术就能根据用户的声音特点,生成一段与真人声音高度相似的虚拟声音,不仅能模仿真人的声音唱歌,还能让这个虚拟声音说出各国的语言。
偶邦(ObEN)的TTS技术通过了图灵测试,这也就意味着这种以假乱真的声音技术将具备广泛的商业应用场景,包括读书软件、动画/视频的配音、虚拟歌姬、人工客服等等。在不久的将来,当用户打开阅读软件听书时,那个流畅自然又声情并茂的朗读声,很可能就来自AI。
今年春节的央视网络春晚中,由偶邦(ObEN)的PAI技术驱动的虚拟主持人小小撒就与撒贝宁自然地互动,毫无违和感,引起了网友的热烈讨论。
偶邦(ObEN)以假乱真的技术让撒贝宁笑称自己的主持人职业生涯受到了人工智能的威胁。但其实不必因此对技术心怀恐惧,未来这样的技术会应用到更多社交、游戏等场景中,正如《头号玩家》与《刀剑神域》中的NPC那样,技术的进步最终都是为了造福社会,改善大家的生活。
关于偶邦(ObEN):
偶邦(ObEN)是一家来自硅谷的人工智能公司,创立于2014年,曾获K11、腾讯、软银等知名风投的融资,并先后入选IdeaLab孵化器、HTC VIVE X加速器项目。CEO Nikhil Jain是加州地区的连续创业者,COO Adam Zheng郑毅是百合网创始人之一。