小舟、杜伟机器之心编译

老照片修复、寻找系外行星……这里有8个超赞的机器学习项目

经典有趣的机器学习项目,了解一下?


人工智能的大潮中,机器学习项目琳琅满目。哪些项目是兼具代表性和实用性的呢?近日,一位名为 Kajal Yadav 的作者列出了 8 个经典的机器学习项目,实用又有趣。目前已在 medium 上获赞 1.7K。

这 8 个项目的主题包括情绪分析、自动摘要生成、情绪检测、老照片修复以及深度学习生成音乐等。

本文作者 Kajal Yadav。

基于社交媒体的抑郁情绪分析

图源:Unsplash,摄自 dole777。

这是一个非常敏感的话题,以至于被认为是一个迫切需要解决的问题。全球有超过 2.64 亿人正在遭受抑郁症的折磨。抑郁症是全球致残的主要原因之一,也是全球疾病负担中极为重要的一部分。每年有 80 万人自杀而死。自杀是 15 到 29 岁人群的第二大致死因素。遗憾的是,抑郁症的治疗往往延迟、不准确甚至完全不起作用。

基于互联网的生活为改变早期抑郁症治疗服务提供了机会,尤其是在年轻人群中。

正如 Pew 研究中心(Pew Research Center)指出的那样,有 72% 的人使用互联网。社交网络上发布的数据集对许多领域都非常重要,例如人文科学和大脑研究。但是,仅依赖专业领域的支持还远远不够,并且显式方法论也并不奏效。

所以,通过分析社交媒体帖子中的一些标志性语言,我们可以创建一种新的深度学习模型。这种模型可以较传统方法更早地使人深入了解自身心理状态。

借助神经网络生成体育比赛视频的文本摘要

图源:Unsplash,摄自 Aksh yadav。

该项目的想法主要是基于从体育比赛视频中提取出准确的摘要。一些体育网站能够给出比赛的亮点。关于提取式文本摘要任务,已经出现了各种各样的模型,其中以神经网络的性能最佳。通常,摘要生成指的是简要介绍文章的信息,着重传达事实类信息,同时突出文章重点。

自动创建游戏视频的轮廓带来了一项挑战,即找出游戏中精彩的环节和亮点。因此,人们可以使用三维卷积网络(3D-CNN)、递归神经网络(RNN)和长短期记忆网络(LSTM)等深度学习方法,同时也可以先通过机器学习算法将视频分成几个片段然后应用支持向量机(SVM)、神经网络(NN)、k-means 算法等。

使用 CNN 的手写方程式求解器

图源:Unsplash,摄自 Antoine Dautry。

在所有问题中,手写数学表达式识别是计算机视觉研究领域令人困惑的问题之一。借助于图像处理技术加持的卷积神经网络(CNN),我们可以通过手写数字(handwritten digit)和数学符号来训练手写方程式求解器。开发这样的系统需要用数据训练机器,使其熟练学习并做出所需的预测。

使用 NLP 生成商务会议摘要

图源:Unsplash,摄自 Sebastian Herrmann 。

曾经遇到过这样的情况,每个人都只想看到摘要而不是报告的全部内容。上学的时候,我们会花费很多时间准备报告,但老师只有时间看摘要。

摘要已经成为解决数据过多问题的一种无可替代的有效方法。从对话中提取信息具有很好的商业和教育价值,这可以通过捕获具有对话结构的统计、语言和情感方面的特征来解决。

通常来说,手动将报告浓缩为一个汇总摘要要花费很多时间,但是用自然语言处理(NLP)来做就会简单很多。用深度学习生成文本摘要能够理解整篇文章的上下文,对所有需要快速生成文档摘要的人来说真是太方便了。

人脸识别来检测情绪并推荐歌曲

图源:Unsplash,摄自 Alireza Attari 。

人脸是人体的重要组成部分,它对于了解人的心理状态尤为重要。用人脸识别检测心情并推荐歌曲不仅可以省去歌曲手动分类的麻烦,而且有助于根据人的情绪特征生成适当的播放列表。

人们倾向于根据心情和兴趣听音乐。所以,我们可以创建一种应用程序,通过捕获面部表情,识别出用户的情绪并推荐相应的歌曲。

计算机视觉是一个跨学科领域,这一领域的研究致力于在计算机上对数字图像和视频做高水平的理解。计算机视觉组件可用于通过面部表情决定用户情绪。

文章《20+ Emotion Recognition APIs That Will Leave You Impressed, and Concerned》中介绍了 20 多种有趣且实用的情绪识别 API。

文章链接:https://nordicapis.com/20-emotion-recognition-apis-that-will-leave-you-impressed-and-concerned/

从开普勒等太空飞行器拍摄的图像中找出宜居的系外行星

图源:Unsplash,摄自 Nick Owuor 。

在最近十年中,对超过 100 万颗恒星进行了监测,以识别正在凌日行星(transiting planet)。人工解释系外行星候选者的工作量巨大,并且容易出现人为错误,其后果难以评估。卷积神经网络适用于在嘈杂的时间序列数据中,以比最小二乘策略更高的准确性来识别类地系外行星。

老照片修复

图源:Pikist 。

以原始方法修复受损照片是非常耗时和痛苦的。因此,我们可以通过深度学习找出所有的图像缺陷(如裂缝、划痕和孔洞),并且借助于图像修复算法,我们还可以根据像素值轻松地找出缺陷,以复原老照片,并为老照片着色。

深度学习生成音乐

图源:Unsplash,摄自 Abigail Keenan。

音乐是一种变换频率的曲调。因此,自动音乐生成(Automatic Music Generation)是一个用最少的人为调整作出一小段曲子的过程。最近,深度学习工程(deep learning engineering)已成为程序化音乐生成的最前沿技术。

以上就是本文作者分享的 8 个重要的机器学习项目,并且在每个项目的最后还提供了相关推荐文章,读者可以参考阅读,希望可以从中受益。

原文链接:https://towardsdatascience.com/8-ml-ai-projects-to-make-your-portfolio-stand-out-bfc5be94e063

入门机器学习机器学习项目
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

卷积神经网络技术

卷积神经网路(Convolutional Neural Network, CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。卷积神经网路由一个或多个卷积层和顶端的全连通层(对应经典的神经网路)组成,同时也包括关联权重和池化层(pooling layer)。这一结构使得卷积神经网路能够利用输入数据的二维结构。与其他深度学习结构相比,卷积神经网路在图像和语音识别方面能够给出更好的结果。这一模型也可以使用反向传播算法进行训练。相比较其他深度、前馈神经网路,卷积神经网路需要考量的参数更少,使之成为一种颇具吸引力的深度学习结构。 卷积网络是一种专门用于处理具有已知的、网格状拓扑的数据的神经网络。例如时间序列数据,它可以被认为是以一定时间间隔采样的一维网格,又如图像数据,其可以被认为是二维像素网格。

支持向量机技术

在机器学习中,支持向量机是在分类与回归分析中分析数据的监督式学习模型与相关的学习算法。给定一组训练实例,每个训练实例被标记为属于两个类别中的一个或另一个,SVM训练算法创建一个将新的实例分配给两个类别之一的模型,使其成为非概率二元线性分类器。SVM模型是将实例表示为空间中的点,这样映射就使得单独类别的实例被尽可能宽的明显的间隔分开。然后,将新的实例映射到同一空间,并基于它们落在间隔的哪一侧来预测所属类别。

图像处理技术

图像处理是指对图像进行分析、加工和处理,使其满足视觉、心理或其他要求的技术。 图像处理是信号处理在图像领域上的一个应用。 目前大多数的图像均是以数字形式存储,因而图像处理很多情况下指数字图像处理。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

自动摘要技术

自动摘要是指给出一段文本,我们从中提取出要点,然后再形成一个短的概括性的文本。

长短期记忆网络技术

长短期记忆(Long Short-Term Memory) 是具有长期记忆能力的一种时间递归神经网络(Recurrent Neural Network)。 其网络结构含有一个或多个具有可遗忘和记忆功能的单元组成。它在1997年被提出用于解决传统RNN(Recurrent Neural Network) 的随时间反向传播中权重消失的问题(vanishing gradient problem over backpropagation-through-time),重要组成部分包括Forget Gate, Input Gate, 和 Output Gate, 分别负责决定当前输入是否被采纳,是否被长期记忆以及决定在记忆中的输入是否在当前被输出。Gated Recurrent Unit 是 LSTM 众多版本中典型的一个。因为它具有记忆性的功能,LSTM经常被用在具有时间序列特性的数据和场景中。

图像修复技术

暂无评论
暂无评论~