事实如此浪漫

mp3s,jpegs和homer simpson的脸后面的数学伎俩

N在几年前,我坐在一个大学数学物理课程中,我的教授拼出了一个想法,就是我的想法。I think it isn’t a stretch to say that this is one of the most widely applicable mathematical discoveries, with applications ranging from optics to quantum physics, radio astronomy, MP3 and JPEG compression, X-ray crystallography, voice recognition, and PET or MRI scans. This mathematical tool—named the傅里叶变换,在18世纪的法国物理学家和数学家Joseph傅里叶 - 甚至被詹姆斯·沃特森和弗朗西斯克里克解释了从Rosalind Franklin生产的X射线图案中解码DNA的双螺旋结构。(Crick是傅里叶变换的专家,并笑着写一篇文章,“傅立笛队的傅立叶变换”,解释了沃特森,一个狂热的博德。)

您可能每天使用傅里叶的想法的后代,无论您是在播放MP3,在网上查看图像,询问Siri一个问题,或调整到广播电台。(顺便说一句,傅里叶不是懒鬼。除了他在理论物理和数学的工作外,他也是第一个发现温室效果[pdf])。

那么傅里叶的发现是什么,为什么它有用?想象一下,在钢琴上演奏笔记。按钢琴键时,锤子撞击了一个振动的字符串,以某种固定速率(440次为440次)。当弦振动时,它周围的空气分子反弹和来回弹出,从而产生我们称之为声音的抖动空气分子的波浪。如果您可以观看空气进行这种定期舞蹈,您可以发现一个顺利,起伏无休止地重复曲线,称为正弦曲线或正弦波。(澄清:在钢琴键的例子中,生成了一个以上的正弦波。真正的钢琴音符的丰富性来自于主要正弦波除了生产的许多软簧。钢琴音符可以是近似作为一个正弦波,但调音叉是一个更容易的声音的例子- 单个正弦素克服。)

由钢琴注意产生的声波可以被认为是一个简单的正弦波。 米兰B通过Shutterstock

现在,而不是单键,说你一起玩三个钥匙来制作一个和弦。结果声波不是漂亮 - 它看起来像一个复杂的混乱。但隐藏在那个凌乱的声波中是一种简单的模式。毕竟,和弦只是三个钥匙击中在一起,所以结果的凌乱声波真的只是三个音符(或正弦波)的总和。

钢琴和弦产生的声波可能看起来一团糟,但它只是三个不同的音符(正弦波)加在一起。 Christine Daniloff / MIT

Fourier的洞察力是,这不仅仅是音乐和弦的特殊财产,而且更加适用于任何类型的重复波浪,是它广场,圆形,震撼,三角形,无论如何。傅里叶变换就像一个数学棱镜 - 你在波浪中喂食,它吐出该波的成分 - 当添加在一起时的票据(或正弦波)将重建波。

如果这听起来有点抽象,这里有一些不同的方式可视化傅里叶的诀窍。第一个来自我们卢卡斯诉巴博萨是一位巴西物理学生,他志愿者他的时间不可思议的数学和科学动画,他走过“卢卡斯夫”。

所以让我们拍一张Squarish的挥手,通过傅里叶的棱镜,看看是另一侧出来的。

仍然来自一个由LucasVB制作的动画

在这些图像中(点击维基百科,看看它的动画),红色Squarish波被蒸馏成一组纯净音符(蓝色正弦波)。想想这些蓝色波浪,如红波的数学成分列表。按这个类比,傅里叶变换是一种食谱 - 它告诉你究竟每个音符需要混合在一起以重建原始波.动画中的垂直蓝线本质上是一个图形,直观地表示每个音符的数量。

这是另一种思考这一点的方法提供的,马修·亨德森或“matthen,”博士。剑桥大学的学生创建了数学上奇的动画GIF.Matthen使用圈子而不是正弦波解释了芬特的伎俩。这包括一组不同大小的圆,每一个圆都以一个更大的圆的边缘为中心。然后圆圈开始旋转,大圆圈带动小圆圈旋转,小圆圈的旋转速度比大圆圈快。如果你追踪一个点在最小圆上的运动,你可以重建任意形状的波,如动画所示和下面的剧照。同样,傅里叶变换告诉您如何构建波浪:哪个圆圈,移动速度。

马修·亨德森

如果你年龄足够大玩了一个探索器,在轮子内使用车轮追踪复杂模式的想法可能是熟悉的。这是同一个动画的互动版本,你可以随意改变圆圈的大小。

为了总结,傅里叶变换告诉您每个成分“注意”(正弦波或圆圈)有助于整体波。这就是傅立叶诀窍有用的原因。想象一下,你正在通过电话与你的朋友说话,你想让他们绘制这个Squarish浪潮。繁琐的方法是要读出一段长的数字列表,其在每时每刻都表示波浪的高度。通过所有这些数字,您的朋友可以耐心地将原始波缝合在一起。这基本上是Wav文件等音频格式的旧功能。但如果你的朋友知道傅里叶的伎俩,你可以做一些非常漂亮的光滑:你可以告诉他们一些数字 - 上面图片中不同圈子的大小。然后,它们可以使用该圆形图片来重建原始波。

这不仅仅是一些模糊的数学技巧。傅里叶变换几乎无处不在挥动。无处不在的MP3格式使用傅里叶诀窍的变体来实现其在前面的WAV上的巨大压缩(发音为“)文件。一个mp3将歌曲分成短片段。对于每个音频段,傅立叶的技巧将音频波降低到其成分注意事项,然后将其存储到原始波处。傅里叶变换也告诉你每个笔记有多少贡献给这首歌,所以你知道哪些是哪些是必不可少的。真正的高音不是那么重要(我们的耳朵几乎听不到它们),所以MP3扔掉它们,导致增加了数据压缩。Audiophiles不喜欢MP3原因 - 它不是一个无损音频格式,他们声称他们可以听到差异。

这也是Smartphone App Shazam如何识别一首歌.它把音乐分成小块,然后用傅里叶的技巧找出组成每个小块的成分音符。然后,它会搜索数据库,看看这些音符的“指纹”是否与他们存档的歌曲相符。语音识别使用相同的傅里叶指纹技术来比较你演讲中的笔记和已知的单词列表。

您甚至可以使用傅里叶的图像。这是一个很棒的视频这就展示了如何使用圈子来吸取荷马辛普森的脸。在线百科全书Wolfram Alpha使用类似的想法画着名人的脸.这看起来像是一个你只会在一个非常无聊的鸡尾酒会上使用的技巧,但它也被用来将图像压缩成JPEG文件。在以前的Microsoft Paint中,图像是保存在位图(BMP)文件中,位图文件是一长串编码每个像素颜色的数字列表。JPEG是图像的MP3格式。要构建JPEG,首先要将图像分成8 * 8像素的小方块。对于每一块,你用重建侯默·辛普森的脸的相同圆的想法来重建图像的这一部分。就像mp3播放的是高音,jpeg播放的是小圆圈。其结果是文件大小大幅减少,但质量却略有下降,这一见解导致了我们都喜欢的在线视觉世界(最终给了我们猫的gif)。

兰德尔·门罗/XKCD.

傅里叶的技巧在科学中是如何运用的呢?我在推特上呼吁科学家们描述他们是如何在工作中使用傅立叶的思想的。他们的反应让我大吃一惊。做出回应的科学家们使用傅里叶变换来研究潜水结构与流体相互作用的振动,试图预测即将到来的地震,确定非常遥远的星系的成分,在大爆炸的热残留物中寻找新的物理学,从x射线衍射图中发现蛋白质的结构,为NASA分析数字信号,研究乐器的声学,完善水循环模型,寻找脉冲星(旋转的中子星),以及利用核磁共振了解分子的结构。傅里叶变换甚至被用来识别杰克逊·波洛克(Jackson Pollock)的一幅赝品,通过破译画中的化学物质。

哇!这对一个小数学伎俩来说是相当的遗产。


Aatish Bhatia是最近的物理博士。在工作中普林斯顿大学将科学与工程带入更广泛的受众。他写了屡获殊荣的科学博客经验性热情并在Twitter上作为@Aatishb.

86条评论-加入讨论