米纳是明智交谈的典范比其他聊天机器人表现得更好

导读谷歌的人工智能科学家揭开了Meena的面纱。技术观察家称其为聊天机器人的突破。与人类意图相匹配的反应分数。相关单词选择要点。(叹气)听起

谷歌的人工智能科学家揭开了Meena的面纱。技术观察家称其为聊天机器人的突破。与人类意图相匹配的反应分数。相关单词选择要点。(叹气)听起来很明智。

Voicebot。我锁定了这支球队的目标。你无法接近那些沮丧的聊天机器人用户所希望的从天而降的情景。“米纳背后的科学家们建造了这个聊天机器人,让它能对人们的信息做出反应,保持话题不变,尽可能表现得像另一个人一样。”

这篇文章还指出了为什么Meena与著名的语音助手不同:“Meena理论上可以谈论任何事情,而不仅仅是已经编入程序的话题。”

其他科技观察人士的称赞之处在于,他们的谈话方式比任何现有的聊天机器人都更像是在跟另一个人说话。

谷歌推出了自己的聊天机器人Meena,“早期迹象表明,这家搜索巨头正在做一些事情,可能会改变这个行业的聊天机器人的动态。”

Neowin:“谷歌基于人工智能的聊天机器人有可能超越目前所有可用的聊天机器人。”

ZDNet表示,该程序“迄今为止几乎没有荒谬、荒谬的语句来描述聊天机器人。”就像人类评论者所评价的那样,它能很好地跟上主题,对谈话中的细节做出反应。”

道格拉斯·海恩在《麻省理工学院技术评论》中写道:“涉及广泛话题的开放式对话很难,大多数聊天机器人都跟不上。在某种程度上,大多数人说的话毫无意义,或者暴露了他们对这个世界缺乏基本知识。一个能够避免此类错误的聊天机器人,将在很大程度上使人工智能更有人情味,并使视频游戏中的角色更逼真。”

谷歌研究团队Brain Team在谷歌人工智能博客上发表了一篇文章,探讨了这个开放领域的概念:

“为了更好地处理各种会话主题,开放域对话研究探索了一种互补的方法,试图开发一种不专门的聊天机器人,但仍然可以谈论几乎任何用户想聊的东西。”

他们说,这可能会导致魅力应用:“比如进一步使计算机交互人性化,提高外语练习,以及制作相关的交互式电影和视频游戏角色。”

米纳背后的人给了自己吹嘘的权利,他们没有退缩。他们的论文题目是“向类人开放域聊天机器人的方向发展”,它在arXiv服务器上。

“我们的贡献……提出一个简单的人类为多向opendomain聊天机器人,捕捉基本评价指标,但人类谈话的重要属性…证明一个端到端的神经模型以足够低的困惑可以超越现有聊天机器人的sensibleness和特异性,依靠复杂,手工制作的框架开发多年。”

谷歌的Meena聊天机器人在“perplexity”上得分很低,在这种情况下,low是一个正数;米纳找到合适的词就没那么难了。

该团队表示,“我们推出了Meena,一款多回合开放域聊天机器人。”

Quint中的S Aadeetya解释了谷歌将Meena称为开放域平台的含义。用户可以在任何平台上输入和询问问题,并进行对话,而不限制其专业知识。

那些回顾arXiv论文的人经常强调Meena的敏感性和特异性平均(SSA)。

什么是SSA?Meena是用“人类评价”指标进行测试的,即SSA。它捕获了与人类类似的“多回合对话”的关键元素。

他们说,“如果我们能更好地优化perplexity, 86%的人类标准SSA是可以达到的。”此外,完整版的Meena(带有过滤机制和调谐解码)的SSA分数为79%,绝对SSA比我们评估的现有聊天机器人高出23%。”

谷歌的120区总经理Ofer Ronen在ZDNet的一次采访中解释了聊天机器人的成就,以及它们为什么不能总是满足用户的需求。人类喜欢说话,喜欢使用语言,而在人机交互时代,这本身就是一个问题。罗南说:“想要得到同样的东西,有很多方法。

尽管如此,蒂尔南·雷在ZDNet明确表示,米纳取得了很大的成就,但谈话经验可以预期是顺利的,但不是闪烁。

“人类被雇来作为群体工作者,对每一个这样的对话进行‘敏感性’和‘特异性’评级,而这样的例子确实比之前的聊天机器人取得了很大进步……遗憾的是,Adiwardana和同事们并没有要求这些人对‘有趣的’对话进行评级,因为这个和样本中的其他交流都非常乏味。”

但是,我们不应该就此打住,因为在审查他们的工作和尚未实现的目标时,团队似乎已经意识到了前进的步伐。他们在论文中写道:

“此外,可能有必要扩展被测量的基本类人交谈属性集,超越敏感性和特异性。一些指导可能包括幽默、同理心、深层推理、回答问题和知识讨论技巧。”

报道称,这款手机目前还处于研发的早期阶段,在你真正与它对话之前,它还将接受进一步的评估。

米纳是如何训练的?《麻省理工学院技术评论》(MIT Technology Review)提到了一个真实的“数据噪音”,因为米纳接受了341 gb的公共社交媒体聊天训练。Neowin详细阐述了他们“对341GB社交媒体对话的训练,并运用了26亿个端到端训练的神经会话模型。”

免责声明:本文由用户上传,如有侵权请联系删除!