CoolBoy编译

Github八月深度学习项目热搜Top 10,你Pick哪一个!

大家好!文摘菌发现了一份过去的一个月机器学习项目的Top 10,特地为大家搬运过来,看看你pick哪一个呢?

这个榜单是从过去一个月的250项开源机器学习项目中挑选出来的。作者比较了这段时间内的新的,重大的成果,并根据一系列的因子来衡量它的专业水准。

开源项目对程序员非常有用,希望你也可以从中找出启发你的那一个!

第十名

GANimation:基于单图的结构性脸部动画(Albert Pumarola等人)[Github中获得344星]

https://github.com/albertpumarola/GANimation?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

这是一个基于动作单元(AU)的新型GAN体系,它展示了一个连续多样的结构性脸部变化,从而定义面部表情。此方法允许调整每个动作单元的度量,并且可以结合其中的几个单元。

第九名

Sg2im:基于场景图的图像生成(谷歌开源) [Github中获得670星]

https://github.com/google/sg2im?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

场景图是一个视觉场景的结构表示图,其中节点表示物体,连线表示物体间的关系。此研究介绍了一个输入场景图,输出图像的端到端神经网络模型。

第八名

Stt-benchmark:语音到文字的基准衡量(Picovoice) [Github中获得294星]

https://github.com/Picovoice/stt-benchmark?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

Cheetah是Picovoice为物联网应用设计的语音识别引擎。与其他模型相比,Cheetah的表现几乎接近于最好的DeepSpeech(0.3 vs 0.32 WER)。但是,它有着快100倍的速度和少398倍的内存。这让Cheetah可以在嵌入小型货品的平台(例如Raspberry Pi)运行,并且便利于大型的,需要更多计算与存储资源的模型。

第七名

Artificial-adversary:生成对抗文本的工具,测试机器学习模型 (Airbnb Engineering)[Github中获得155星]

https://github.com/airbnb/artificial-adversary?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

在区分用户生成的文本时,用户可以有很多方式修改内容,以免被监测。这包括将字符换为类似的长相的字符。例如please wire me 10,000 US DOLLARS to bank of scamland (请给我转10,000美元)可能是一条诈骗信息,但是如果写成pl3@se.wire me 10000 US DoLars to,BANK of ScamIand,很多鉴别器将失灵。

使用这个扩展库,你就可以利用这些方法生成文本,并在你自己的机器学习算法上测试。

第六名

Soccerontable: 在你的桌面上观看足球比赛(Konstantinos Rematas)[Github中获得247星]

https://github.com/krematas/soccerontable?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

请戳文摘之前的报道:在咖啡桌上看世界杯!FB和谷歌刚刚在CVPR联合发布AR看球新方式

第五名

DanceNet:使用AutoencoderLSTM和混合密度网络的舞蹈生成器 (Keras)[Github中获得282星]

https://github.com/jsn5/dancenet?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

这是一次对舞蹈生成器的尝试☟


第四名

UnsupervisedMT:基于短语与神经非监督机器翻译(Facebook Research)[Github中获得490星]

https://github.com/facebookresearch/UnsupervisedMT?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

如今的机器翻译系统虽然接近人类的效率,但这和大量的平行语句有关。这篇文章研究了如何在单一语料库的情形下学习翻译。作者们提出了一种神经模型和一种基于短语的模型。两种模型都在初始化参数、模型降噪、平行数据的迭代生成上斟酌。它们的表现大幅超越之前的模型,并且有着更简单的结构和更少的超参数

第三名

Vid2vid:视频到视频的合成(NVIDIA AI)[Github中获得1797星]

https://github.com/NVIDIA/vid2vid?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

这篇文章提出一个新型的,利用对抗生成结构的视频到视频合成方法。Github包含了Pytorch的高分辨率实现。这个模型可以将语义标记图转为实际视频,从描边图生成真人讲话动作,或者是由姿势生成人类动作。

第二名

Glow:可逆的1x1卷积生成流(OpenAI)[Github中获得1664星]

https://github.com/openai/glow?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

Glow是一个可逆的生成模型,它被用来做1x1的可逆卷积。它延续了之前的研究(https://arxiv.org/abs/1605.08803),并简化了其结构。此模型可以生成高分辨率的图像,发现可操纵数据的特征。

第一名

Autokeras:自动化机器学习(AutoML)的开源软件库(Haifeng Jin)[Github中获得2637星]

https://github.com/jhfjhfj1/autokeras?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

Auto-Keras是一个AutoML的开源软件库。它由德州农机大学的DATA Lab开发。AutoML的最终目的是将简易的深度学习工具提供给各个领域中不具有数据科学背景的专家。Auto-Keras提供了一些函数,以建立可自动寻找结构和超参数深度学习模型。

大数据文摘
大数据文摘

秉承“普及数据思维,传播数据文化,助⼒产业发展”的企业⽂化,我们专注于数据领域的资讯、案例、技术,形成了“媒体+教育+⼈才服务”的良性⽣态,致⼒于打造精准数据科学社区。

工程深度学习GitHub
3
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

自动编码器技术

自动编码器是用于无监督学习高效编码的人工神经网络。 自动编码器的目的是学习一组数据的表示(编码),通常用于降维。 最近,自动编码器已经越来越广泛地用于生成模型的训练。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

机器翻译技术

机器翻译(MT)是利用机器的力量「自动将一种自然语言(源语言)的文本翻译成另一种语言(目标语言)」。机器翻译方法通常可分成三大类:基于规则的机器翻译(RBMT)、统计机器翻译(SMT)和神经机器翻译(NMT)。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

生成模型技术

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。 它给观测值和标注数据序列指定一个联合概率分布。 在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。

暂无评论
暂无评论~