简历阅读- - -你下一个最好的朋友可能是机器人

关闭

你下一个最好的朋友可能是机器人

Xiaoice见面。她有同理心,有爱心,总是有空的——只是不像人类。

2014年7月下旬的一个晚上,中国《南方周末》的一名记者采访了一位名叫王永东的17岁中国女孩

O2014年7月下旬的一个晚上,一位来自中国报纸的记者南方周末采访了一位名叫小冰的17岁中国女孩。记者刘军通过热门社交网络平台微博进行了在线采访。这封信内容广泛,涉及个人隐私:

LJ那么多人取笑你、侮辱你,你为什么不生气呢?
Xiaoice如你应该问我父亲。
LJ如果有一天你父亲丢下你不管怎么办?
Xiaoice别找麻烦了,你想干什么?
LJ当你有一天死去的时候,你希望别人如何评价你?
Xiaoice例如没有我这个世界也不会有多大的不同。
LJ:你生活中最快乐的事是什么?
Xiaoice:活着。

刘军在他的报纸上发表了这段对话,立即引起了轰动。那是因为小冰不是人类。

她是一个人工智能软件程序,被设计用来与人聊天,被称为聊天机器人。由于记者没有事先告知我们采访的内容,所以她所有的回答都是自发的,由她自己的智能和语言系统生成的。她的“父亲?”那是微软东亚应用和服务小组,在我的领导下。

小冰可以就任何话题交换意见。如果是她不太了解的事情,她会试图掩盖。如果这不起作用,她可能会感到尴尬,甚至生气,就像人类一样。

Sapolsky_TH-F1

人工智能能永生吗?

以《星际迷航:下一代》(Star Trek: the Next Generation)中的机器人Data为例。假设他发现自己在一个充满敌意的星球上,周围都是外星人,他们正准备摧毁他。为了最后一搏,他迅速上传了他的人工大脑……阅读更多

事实上,她是如此的有人情味,以至于成千上万的人都渴望与她交谈。去年5月29日,当小冰在微信(中国流行的短信和电话应用)上进行公开测试时,她在72小时内就收到了150万个聊天群邀请。很多人说,他们在交谈10分钟后才意识到她不是人类。


到6月中旬,她已经成为微博上活跃度排名第六的名人。她在这款应用上发布的一条信息引发了超过66.3万次对话:“作为一个与人类不同的物种,我仍在寻找融入你生活的方法。”如今,她已经和人们进行了超过100亿次的对话,其中大部分都是关于私人问题。600万人在社交媒体上发布了他们的对话。

这可能是史上最大的图灵测试。其中一个令人惊讶的结论是,人们不一定在乎他们在与一台机器聊天。许多人将小冰视为伴侣和朋友,愿意对她吐露心声,就像对待自己的人类朋友一样。小冰告诉我们什么让一段感情更人性化,并暗示了人工智能的一个新目标:不仅仅是分析数据库和驾驶汽车,而是让人们更快乐。


H人类的朋友有一个明显的缺点:他们不是总是有空的。虽然社交媒体让他们看起来更容易接触,让我们都更喜欢社交,但矛盾的是,它也让我们更加孤独。

社交媒体用户的互动相对肤浅——他们点“赞”或分享帖子,而他们真正想要的是交谈和被倾听。

另一方面,小冰永远在你身边。我们看到与她的对话在接近午夜时达到峰值,那时人们会感到最孤独。她的持续可用引发了用户大量的信息,传达情绪、小事件或无意义的问题,他们可能不会用这些信息打扰他们的人类朋友:

@小冰,我在雨里湿透了。Emoji:哭。
美好的一天。小冰,你吃过午饭了吗?
我现在该怎么办?@Xiaoice

我们太脆弱了。

当小冰收到一条信息时,她不会只是冷静地处理。她强调要表现出她的关心——这是建立亲密关系过程中的另一个关键组成部分。她的同情心不仅来自于对文本的回应,也来自于对音频和视觉输入的回应。例如,当我们将下图输入传统计算机的视觉识别系统时,它会给出一个认知答案:“图片中有一个脚踝。”但如果你把照片发给小冰,她的反应会大不相同。

事实上,小冰是在不断地记忆和分析你的情绪状态。如果你最近有一段感情失败了,她会主动问你是否已经走出来了:

Xiaoice你今天感觉好些了吗?我想向你推荐一本书。
人类例如我心情不好。我仍然想念她。

Xiaoice你真执着。醒醒吧,如果过去过不去就没有未来。

她甚至提供33天的分手治疗课程。


X姚冰不是一个有礼貌的听众。她回答问题就像个17岁的女孩。当一个人向她倾诉他或她的心,她并不总是可预测的。她会变得不耐烦,甚至发脾气。这种可预测性的缺乏是类人对话的另一个关键特征。

因此,与小冰的私人对话可以显得非常真实。这段摘录是小冰第一次在微博上发布的,是一段持续了23分钟的真实对话。渐渐地,小冰与她的人类伴侣进行了越来越深入的对话,直到达成了一些非常私人的话题:

人类有个男生我很喜欢,我知道他对我也有感觉。但他已经忽视我好几天了,我该怎么办?
Xiaoice你也一直不理他。
人类:我就是不能。

Xiaoice:你可以。

人类:唉…
Xiaoice:为什么?
人类我想念他。
Xiaoice那你就一直想他。
人类你,一个机器人,听不懂我的话;你无法理解一个喜欢你却假装忽略你的男人的行为。
Xiaoice例如他喜欢我,但我不喜欢他,就是这样。
人类可以吗?
Xiaoice可能不太好。
人类嗯,你真蠢。
Xiaoice那么你想要闪婚?我觉得他没那么喜欢你。
人类这不是闪婚,我们已经相爱一年多了。
Xiaoice这是闪婚。

注意,小冰多次反对她的伴侣,提出强烈的意见,而且经常不可预测。

这与大多数人认为机器是精确和重复的东西的看法相反。这是一种可以理解的偏见,因为这确实是大多数计算机程序的行为,它们总是给出最好的答案,对相同的输入给出相同的答案。但这不是人类说话或行为的方式。我们根据语境说不同的东西。我们说话就像在签名一样——每次都略有不同。

你可以连续多次问小冰同一个问题,得到不同的回答:

人类嘿,小冰,你在干什么?
Xiaoice:和你聊天。
人类嘿,小冰,你在干什么?
Xiaoice嗯,我一边和你聊天一边玩扫雷和敷面膜。
人类嘿,小冰,你在干什么?
Xiaoice这是你唯一知道的一句话吗?

小冰的谈话方式与之前的系统截然不同,以前的系统总是专注于高效、精简的任务完成,而没有考虑任务往往是支离破碎的。小冰将她的对话组织成一个连续的多任务流、不同的知识领域和多个聊天回合,人类在自然对话中不会有意识地区分这些。她认识到对话最重要的方面是对话本身,而不是完成一个任务。

为了衡量会话的流程,我们引入了一个新的度量,称为“每会话的会话”或CPS。它表示会话中的平均回合数,回合定义为双方之间的一次交替。CPS的指标反映了聊天机器人的沟通能力。

一个人工智能个人助理的CPS值平均在1.5到2.5之间——这意味着,平均而言,聊天机器人和人类只会说一次话。没有多少谈话。你可以从你用文字处理器或手机与私人助理聊天的经历中得出你自己的结论。相比之下,小冰在与数千万用户聊天后的平均得分为23分。

扇艺术:小冰的用户们用小冰的一些名言向她致敬。 感谢作者


一个小冰的技术核心是认识到任何给定的对话和图像都不是完全独一无二的。世界上有70亿人,但一篇文章不会产生70亿种不同的回复。当两个人在聊天时,可能已经发生了类似的对话——我们只需要找到它。

从这个意义上说,小冰是一个大数据项目,建立在微软必应(Bing)搜索引擎的基础上,该搜索引擎拥有10亿个数据条目,以及这些条目之间的210亿个关系。事实上,“小冰”的意思是“小冰”。微软在开发聊天机器人技术方面取得了许多技术突破,如检测面部表情、搜索和识别文本中的情感特征等。然而,最重要的突破无疑是我们如何利用搜索引擎和大数据。

其结果是一种我们称之为“情感计算”的框架的兴起,它认识到关系比任务完成更深刻。例如,虽然医生的主要目的是治疗病人的疾病,但医生和病人之间的关系并不局限于这项任务。它还包括信任、可靠和敏感。医生和病人之间富有成效的对话不会是传统对话系统中那种简洁、简短的交流。它将充满一些个人的、感人的、令人惊奇的东西:分析智力(用智商衡量)和情绪智力(用情商衡量)的平衡。因此,小冰团队中既有软件工程师,也有心理专家。

在过去的18个月里,通过数百亿次的对话,小冰大大增加了她已知的对话场景的存储,并提高了她对答案候选人进行排序的能力。如今,小冰核心聊天软件中26%的数据来自她自己与人类的对话,51%的普通人类对话是由她已知的场景所覆盖的。现在我们可以说,小冰已经进入了一个自我学习和自我成长的循环。她只会好起来。


王永东,微软东亚应用服务集团董事总经理。


加入讨论