事实如此浪漫

这种神经网络使绵羊产生幻觉

如果你今天上网,你可能会与神经网络互动。它们是一种机器学习算法,用于从语言翻译到金融建模的所有方面。他们的专长之一是图像识别。包括谷歌、微软、IBM和Facebook在内的几家公司都有自己的照片标签算法。但是图像识别算法可能会犯一些非常奇怪的错误。

詹妮尔谢恩

Microsoft Azure的计算机视觉API添加上面的标题和标签。但是在上面的图像中没有羊。没有一个我一路放大,检查每一个斑点。

詹妮尔谢恩

在这幅图中,它还标记了绵羊。我碰巧知道附近有羊。但实际上没有人在场。

它没有意识到“羊”指的是真正的动物,而不仅仅是一种没有树木的草。

詹妮尔谢恩

这里还有一个例子。事实上,神经网络每次看到这种类型的景观都会使绵羊产生幻觉。这是怎么回事?

神经网络学习的方式是通过看大量的例子。在这种情况下,它的训练员给了它许多人类手工标记的图像,其中许多图像包含绵羊。在对所看到的图像一无所知的情况下,神经网络必须制定规则,确定哪些图像应该被标记为“绵羊”。看起来它还没有意识到“羊”指的是真正的动物,而不仅仅是一种没有树的草。(类似地,它用“彩虹”标记第二张图片,可能是因为当时天气潮湿多雨,没有意识到颜色带的重要性。)

神经网络只是高度警惕,到处都能找到羊吗?不,事实证明。他们只在希望看到羊的地方看到羊。他们可以很容易地在田野和山坡上找到羊,但一旦羊开始出现在奇怪的地方,就很明显算法在多大程度上依赖于猜测和概率。

把羊带进屋里,它们就会被贴上猫的标签。抱起一只绵羊(或山羊),它们就会被贴上狗的标签。

把它们涂成橙色,它们就会变成花。

把羊拴上皮带,它们就会被贴上狗的标签。把它们放在车里,它们是狗或猫。如果它们在水里,最终可能会被贴上鸟类甚至北极熊的标签。

如果山羊爬树,它们就会变成鸟。或者是长颈鹿。(事实证明,微软Azure因为到处都能看到长颈鹿而臭名昭著,因为有传言说原始数据集中的长颈鹿太多了。)

问题是,神经网络匹配模式。他们看到一片片像毛皮一样的纹理,一束绿色,就断定那是羊。如果他们看到猫的皮毛和厨房形状,就会得出猫的结论。

如果生活按规则行事,图像识别效果会很好。但是一旦人们或绵羊做了一些意想不到的事情,算法就会显示出它们的弱点。

想通过神经网络偷偷地做点什么吗?在令人愉快的网络朋克扭曲中,超现实主义可能是答案。也许未来的特工们会穿上鸡装,或者开着有奶牛斑点的车。

推特上还有很多很多搞笑错误的例子线我从一个简单的问题开始:

詹妮尔谢恩

你可以测试微软Azure的图像识别API,让你自己看看,即使是顶尖的算法也依赖于概率和运气。另一种算法,Neuratalk2,是我最常用的Twitter线程。

想知道我什么时候发布另一个实验吗?你可以报名在这里

Janelle Shane是光学方面的研究科学家。她还训练神经网络,一种机器学习算法,在它们努力模仿人类数据集时编写无意的幽默。这帖子她的博客AIWeirdness.com是她在加州大学圣地亚哥分校攻读电气工程博士学位时创办的。在推特上关注她@詹尼勒森

观看:数百年来对“神秘”的焦虑

1评论-加入讨论