蒋宝尚、魏子敏作者

用一条数学公式破解人类记忆 | MIT媒体实验室Nature新作

MIT媒体实验室一直是一家将社会人文学科与自然科学巧妙融合的代表机构。每年,这些脑洞大开的科学家们都会发布一些非常震撼的研究。

比如2016年,他们研究了为什么每一年去世的名人都在变多?早些时候,他们发布了一个实验,研究了无人驾驶场景下,面对电车困境时,人们会做出什么样的选择。

就在上周,这个实验室发布了一篇论文,称破解出了关于人类记忆的数学公式。

这篇刊登在《自然(Naure)》杂志子刊Nature Human Behavior上的文章称,通过设定少量的几个参数,已经能画出公众对文化作品记忆力随时间变化的曲线。

真实的集体记忆力公式

论文发表在《Nature Human Behavior》

先附上论文地址

觉得阅读论文太枯燥的同学,Nature也做了一个小视频来解释这个发现👇

数学可能是距离本质最近的学科,无数人都曾经思考,人类的生命是否由一条数学公式掌握?这个问题太过异想天开,以至于只能在影视作品中以科幻的形式讨论。

《天才J》就是这样一部电影,电影中的高中生阿J破解出了人类生命的终极数学公式,利用数学公式对抗邪恶力量,拯救人类于水火。

“传说”中的生命公式

尽管破解生命的公式还遥不可及,但是,来自MIT的科学家让我们离这个目标更近了一步,巧妙的将人文学科和自然学科融合在了一起。

那么,他们是如何破解记忆力公式的呢?

具体来说,麻省理工学院媒体实验室的研究人员发现了公众注意力(记忆)时间变化,表现为双指数曲线。

在论文开头,科学家们引用了诗人Pabllo Neruda 最著名的诗歌 Poema 20(不愧是最有艺术文化感的实验室啊)。

Love is so short, forgetting is so long

爱情如此短暂,遗忘却如此漫长

这首诗歌强烈的表达了生动的爱情往往是短暂的,以及会随着岁月的流逝这种感觉会逐渐从记忆中消失。

除了诗歌和爱情,这篇论文把公众对电影,传记,专利文章以及艺术作品的注意力时间变化进行了量化。

研究发现,当人们在听歌曲、看电影以及传记时,一开始有非常强的关注度,但是注意力开始衰退时遵循的指数曲线往往是在最开始快速的下降,在后期下降的速率开始减缓。

人类集体记忆衰退的普遍模式

这种注意力的上升和下降的机制是两种不同模式的结合。第一种机制是优先依附(preferential attachmen),即文化产品的受欢迎程度吸引人的注意力。根据以前的观点,现在流行的歌曲、电影或文章在未来会比不那么受欢迎的歌曲电影吸引更多的注意力。

第二种机制是时间衰减,这是科学家通过比较观察到的,在这个阶段也分为两个小的阶段,即快速衰减阶段和缓慢衰减阶段。这也是为什么集体对某事物的关注度会以指数函数的形式衰减。

为了解释集体注意力的衰退,研究人员建立了一个基于交流记忆以及文化记忆这两个人类学概念的模型。交流记忆着重于说话产生的注意力,文化记忆着重于从书籍和硬盘的信息所得到的注意力。

模型对第一阶段之后的集体记忆衰退进行了预测。公众对诗歌,例如Poema 20,首先表现出的是交流记忆,一个有着非常强的欢迎程度但集体注意确是短暂的时期;然后是文化记忆,这个阶段涉及较少的注意力和较慢的衰减,因为在后期,诗歌会以电影、书籍、音频的模式记录下来。

这也揭示了交流记忆阶段的是注意力是非常短的情况。在传记中,交流记忆持续20~30年,音乐维持的时间大约为约5~6年。

对各种传播平台进行研究得出的注意力衰退曲线

总的来说,集体注意力会沿着一条曲线衰减,这种曲线可以解释为交流记忆和文化记忆的结合。

模型综述

研究人员使用两种类型的数据:科学论文和专利的时间序列数据、歌曲,电影和传记的横截面数据。

数据总结

在模型中把假设进行了简化,尽可能少的参数,从而得到一个操作性强的模型,该模型可以量化集体注意力主要变量,在这些假设下,交流记忆衰减的数学公式是u(t+1)=(1−p)u(t)−ru(t),文化记忆衰减为v(t+1)=(1−q)v(T)ru(T)。两者的综合模型方程为S(t)=u(t)+v(t)

交流记忆对时间求导为:du/dt=-(p+r)u

文化记忆对时间求导为:dv/dt=-qv+ru

最初的交际记忆设定为u(t=0)=N,假设过程开始时,没有文化记忆模型,即v(t=0)=0。利用初始条件,我们发现方程的解是一个双指数函数:

注:    双重指数函数(Double exponential function)是指将指数函数的指数提升为指数函数所形成的函数。

在方程S(t)=N/(p+r-q)*[(q-p)*e^-(p+r)t+re-qt] 中,p、q、r分别为参数,当这些参数变化时,双指数曲线呈现以下变化 。其中p+r是交流记忆下降的速率。q是在文化记忆中起作用的参数参数r表现了交流记忆到文化记忆中的信息流动。

经过对论文,专利,歌曲,电影和生物学等文学作品的数据分析表明,这种符合双指数函数的衰减模型在所有领域都是普遍存在的。 然而,论文,专利,歌曲,电影和传记各对应一个衰减函数,也就是其p、r、q的各取不同的值。

上面也提到了,公众的注意力衰减由两个机制构成,第一个机制是交流记忆,第二个机制是文化记忆。研究人员在论文中用t-c定义了从交流记忆过渡到文化记忆之间需要花费的时间:

通过研究发现音乐和电影的交流记忆衰减比传记的快得多。这也导致了音乐和电影比传记维持的时间短。另外,还发现对于传记而言p ≫  q,即传记的交流记忆维持的时间长于文化记忆的时间。

模型综述

最后,文摘菌也带大家推导一遍模型的表达式,这是个非常简捷的公式,对于学过大学微积分以及线性代数的同学,下面的过程完全能够看懂。

两个记忆机制的变化速率为:

利用线性代数的知识可以把方程写成矩阵的形式:

对变量初始化为:

然后,要求解方程组,首先要求出2×2矩阵的本征值,通过计算矩阵行列式(Det),即:

对于A,可以得到了λ_1=−(P+r)和λ_2=−q,然后计算特征向量,也就是求解n_1,n_2:

利用λ_1=−(P+r)和λ_1=−q,解得特征特征向量为:

通过解微分方程,得到方程式的通解为:

其中,C_1、C_2为任意常数。

利用初始条件,解得C_1=N,C_2=(N*r)/p+r-q 解得特解为:

最后,双指数函数模型为:

利用数据对模型进行拟合得到方程:

或许,我们距离用数学解释生命也没有那么遥远。

大数据文摘
大数据文摘

秉承“普及数据思维,传播数据文化,助⼒产业发展”的企业⽂化,我们专注于数据领域的资讯、案例、技术,形成了“媒体+教育+⼈才服务”的良性⽣态,致⼒于打造精准数据科学社区。

理论人类意识记忆
2
相关数据
数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

微积分技术

微积分(Calculus)是高等数学中研究函数的微分(Differentiation)、积分(Integration)以及有关概念和应用的数学分支。它是数学的一个基础学科。内容主要包括极限、微分学、积分学及其应用。微分学包括求导数的运算,是一套关于变化率的理论。它使得函数、速度、加速度和曲线的斜率等均可用一套通用的符号进行讨论。积分学,包括求积分的运算,为定义和计算面积、体积等提供一套通用的方法 。

线性代数技术

线性代数是数学的一个分支,它的研究对象是向量,向量空间(或称线性空间),线性变换和有限维的线性方程组。向量空间是现代数学的一个重要课题;因而,线性代数被广泛地应用于抽象代数和泛函分析中;通过解析几何,线性代数得以被具体表示。线性代数的理论已被泛化为算子理论。由于科学研究中的非线性模型通常可以被近似为线性模型,使得线性代数被广泛地应用于自然科学和社会科学中。

暂无评论
暂无评论~