太味儿!菊纹、粪便识别测健康,斯坦福智能马桶研究登上Nature子刊

世界上没有两片相同的雪花,「菊花」亦然。至少,斯坦福大学的一篇论文是这么说的。在这篇论文中,研究者发明了一种「菊纹识别」智能马桶,可以利用深度学习技术识别你的「菊纹」和便便,从而达到健康监测的目的。目前,该论文已经在《Nature Biomedical Engineering》期刊上发表。

深度学习三巨头之一、图灵奖获得者 Yann LeCun 看完之后一脸认真地说,「卷积网络正在马桶上落地,为人类谋福祉。」

从目前流行的指纹识别、人脸识别到「菊纹(analprint)识别」,研究人员思路的进化让人一时难以跟上。我们先来看一下这个马桶长什么样子:

智能马桶整体结构。

这个马桶乍看上去和普通马桶差不多,但仔细看就会发现里面暗藏玄机,尤其是马桶圈附近。

这个马桶圈里安装了四个摄像头:一个粪便摄像头(stool camera)、一个「菊花」摄像头(anus camera)和两个尿流摄像头(uroflow camera)。顾名思义,这些摄像头分别用来监测排便者的粪便、「菊花」和尿液。

除此之外,马桶圈上还安装有一系列传感器和试纸,可以记录人坐在马桶上的时间、分析尿液里的成分。

该马桶的工作原理可以概括为:尿液和粪便样本都通过视频采集,然后通过一组算法进行处理,这些算法可以区分正常的尿液(流速、时间、流量)、粪便特征和不正常的特征。试纸则用于测量某些分子特征,包括白细胞计数、血液污染、特定水平的蛋白质等,这些指标可以反映一系列疾病,从感染到膀胱癌再到肾衰竭。论文作者表示,该马桶目前已经可以测量 10 种不同的生物标记。

信息收集、分析装置有了,那怎么区分哪份样本是你的呢?毕竟除了独居的人之外,其他多数人都要和别人共用马桶。

这就要说到本文的关键概念——「菊纹识别」了。

在最初的版本中,研究者考虑过在冲水柄处安装指纹识别装置。这个想法很容易实现,但问题在于,如果上一个人忘记冲水怎么办?于是,他们想到了「菊纹识别」,即利用摄像头拍摄的肛门视频来识别排便者。

准确地说,他们用摄像头识别的是一个名为「肛膜(anoderm)」的部位,与肛门周围的皮肤有关,由肛门(anus)与皮膜(derm)两个词组合而成。

所有数据采集之后会上传到加密的云服务器上进行存储和分析。

这种做法虽然看起来比较难以接受,但作者表示,在几个月的时间里,已经有 21 名志愿者参与了马桶的测试。而在一项针对 300 多名智能马桶潜在用户的调查中,37% 的人表示对这个想法比较满意,甚至有 15% 的人表示对这种以精准健康为目的暴露一切的做法非常满意。

该论文已经于本周一发表于《Nature》子刊。


论文链接:https://www.nature.com/articles/s41551-020-0534-9

工作原理细节

这个马桶具体是怎么工作的呢?

针对尿液分析,马桶上有两个高速摄像头,用来观测流速,马桶的后方还安有一堆试纸。当你开始小便时,被动红外运动传感器(passive infrared motion sensor)会检测到信号并伸出一条试纸。试纸被浸湿之后会缩回马桶后方,然后由一个摄像头来分析结果。该系统针对一位男士和一位女士进行了测试,结果发现这套系统更加适合站立小便的男士,但作者表示,后续会针对男女小便的差异改进设计。

基于计算机视觉的小便监测与流量测量。

为了分析人的大便行为,马桶上有一个压力传感器,可以用来激活摄像头从而拍摄排便全程。这些图像可以反映肠道功能,由卷积神经网络进行处理。

研究者写道:「这个摄像头也能够观察到粪便的动态变化,包括马桶里粪便的形态和流动性随时间的变化,这些在之前都没有被研究过。」

具体来说,研究者使用 GoogLeNet Inception v.3 来对马桶捕捉到的图片进行识别。之所以选择 Inception v.3 是因为这是一个开源的算法,且在 ImageNet 里的一百多万张图片上进行了预训练。

研究者在十个马桶类型上重新对 Inception v.3 进行了训练,这十个类型分别是七个 BSFS 类型以及干净、仅有小便和带有厕纸这三个额外类型。

研究者表示,这些粪便图像是通过 Google,Bing 和 Yahoo 等搜索引擎(关键词包括「马桶里的粪便」和」粪便「)获得的。此外,他们还从研究参与者那里收集了 12,226 张粪便图像和相关的马桶状态图像(n=11)。随着研究参与者提供的真实粪便图像越来越多,CNN 的表现也将有明显的改善。

使用 CNN 进行粪便分析(为避免引起读者不适,此处仅截取了部分图片,内容详见论文)。

在家庭中,区分是谁的粪便显然对这个系统很重要,因此才有了「菊纹识别」这个概念。

为了实现菊纹识别,首先要用马桶上安装的摄像头给用户的屁股录制一段短视频,然后通过图像识别算法进行区分。拍摄的屁股片段被分成帧,算法将其与用户「菊纹」的参考图像数据集进行比较。

研究者使用了三种不同方法来进行「菊纹」识别,分别是:MSE(mean squared error)、SSIM(structural similarity index measure)和 CNN。其中 CNN 的结构与上文提到的粪便识别类似。研究者同样使用了迁移学习来对其进行分类训练。下图为使用「菊纹」进行生物识别的示意图。

使用指纹与肛门皱褶的生物识别。

对如此私密的部位进行拍摄难免引发人们对于隐私问题的担忧。但论文作者强调,数据将被存在一个安全的云端系统里,「我们已经采取了严密的措施,确保所有的信息在发到云端时都不会被识别,而且这些信息在发给医护工作者时会受到 HIPAA 的保护」。HIPAA 指的是限制公开医疗记录的健康保险便利和责任法案。

最后想提醒一下读者,作为正儿八经的深度学习研究,其实这篇论文还有「菊花」的图片数据。如果你正在吃午饭,请不要打开论文。

扩展阅读:这条推送有味道:征集 10 万张「便便」原图,肠道专家精心标注

参考链接:
https://www.vice.com/en_us/article/jge377/stanford-smart-toilet-uses-butthole-for-identification
入门CNNNature斯坦福大学
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

卷积神经网络技术

卷积神经网路(Convolutional Neural Network, CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。卷积神经网路由一个或多个卷积层和顶端的全连通层(对应经典的神经网路)组成,同时也包括关联权重和池化层(pooling layer)。这一结构使得卷积神经网路能够利用输入数据的二维结构。与其他深度学习结构相比,卷积神经网路在图像和语音识别方面能够给出更好的结果。这一模型也可以使用反向传播算法进行训练。相比较其他深度、前馈神经网路,卷积神经网路需要考量的参数更少,使之成为一种颇具吸引力的深度学习结构。 卷积网络是一种专门用于处理具有已知的、网格状拓扑的数据的神经网络。例如时间序列数据,它可以被认为是以一定时间间隔采样的一维网格,又如图像数据,其可以被认为是二维像素网格。

GoogLeNet技术

同样在2014年,谷歌提出了 GoogLeNet(或Inception-v1)。该网络共有22层,且包含了非常高效的Inception模块,它同样没有如同VGG-Net那样大量使用全连接网络,因此参数量非常小。GoogLeNet最大的特点就是使用了Inception模块,它的目的是设计一种具有优良局部拓扑结构的网络,即对输入图像并行地执行多个卷积运算或池化操作,并将所有输出结果拼接为一个非常深的特征图。

迁移学习技术

迁移学习是一种机器学习方法,就是把为任务 A 开发的模型作为初始点,重新使用在为任务 B 开发模型的过程中。迁移学习是通过从已学习的相关任务中转移知识来改进学习的新任务,虽然大多数机器学习算法都是为了解决单个任务而设计的,但是促进迁移学习的算法的开发是机器学习社区持续关注的话题。 迁移学习对人类来说很常见,例如,我们可能会发现学习识别苹果可能有助于识别梨,或者学习弹奏电子琴可能有助于学习钢琴。

推荐文章
暂无评论
暂无评论~