近期值得关注的8款AI开源项目 | 本周Github精选

#基于Keras的机器学习自动化库

Auto Keras 是一个用于自动机器学习的开源框架,让缺乏机器学习背景的领域专家也能轻松使用机器学习工具和各类深度学习模型,其主要功能包括自动设计网络结构和自动调参。

项目链接

https://github.com/jhfjhfj1/autokeras

Pythia

#来自FAIR的模块化VQA框架

Pythia 是由 Facebook AI Research 开发的模块化 VQA 框架。由于 VQA 模型有着标准的设计模式,包括:问题编码,图像特征抽取,带有注意力机制的输入信息融合,答案生成等,因此本项目的长期目标为提供一个易用、可扩展的模块化平台。

项目链接

https://github.com/facebookresearch/pythia

AnyQ

#基于FAQ集合的问答系统

AnyQ (ANswer Your Questions) 开源项目主要包含面向 FAQ 集合的问答系统框架、文本语义匹配工具 SimNet。 

问答系统框架采用了配置化、插件化的设计,各功能均通过插件形式加入,当前共开放了 20+ 种插件。开发者可以使用 AnyQ 系统快速构建和定制适用于特定业务场景的 FAQ 问答系统,并加速迭代和升级。 

SimNet 是百度自然语言处理部于 2013 年自主研发的语义匹配框架,该框架在百度各产品上广泛应用,主要包括 BOW、CNN、RNN、MM-DNN 等核心网络结构形式,同时基于该框架也集成了学术界主流的语义匹配模型,如 MatchPyramid、MV-LSTM、K-NRM 等模型。SimNet 使用 PaddleFluid 和 Tensorflow 实现,可方便实现模型扩展。使用 SimNet 构建出的模型可以便捷的加入 AnyQ 系统中,增强 AnyQ 系统的语义匹配能力。

▲ AnyQ的框架结构

项目链接

https://github.com/baidu/AnyQ

ESPnet

#端到端语音处理工具箱

ESPnet 是一个端到端的语音处理工具箱,主要功能聚焦在端到端语音识别和文本转语音。本项目基于 Chainer 和 PyTorch 作为开发框架。

项目链接

https://github.com/espnet/espne

CVAT

#免费在线交互式视频和图像标注工具

CVAT 是一款用于计算机视觉的免费在线交互式视频和图像标注工具OpenCV 团队已用它标注了具有不同属性的数百万个对象,许多 UI 和 UX 决策都基于专业数据标注团队的反馈。

项目链接

https://github.com/opencv/cvat

Metrics for Object Detection

#目标检测评测指标

考虑到在目标检测任务中不同工作采用的评测指标各不相同,无法统一进行比较。本项目提供了易于使用的功能,结合了各大主流目标检测竞赛的评测指标,用户无需将检测模型修改为复杂的输入格式,避免转换为 XML 或 JSON 文件。

项目链接

https://github.com/rafaelpadilla/Object-Detection-Metrics

Torchbearer

#PyTorch模型训练库

Torchbearer 是一个专为研究人员设计的 PyTorch 模型训练库,适合于执行高级自定义操作,方便快速测试一些经典模型在新任务上的表现。

项目链接

https://github.com/ecs-vlc/torchbearer

text2sql-data

#Text2SQL代码、数据集和评测方法

本项目开源了 Text2SQL 的代码、数据集和评测方法,对于一系列领域,该项目提供:

  • 带有注释变量的句子

  • SQL 查询

  • 数据库架构

  • 一个数据库

Text2SQL 论文链接:

http://aclweb.org/anthology/P18-1033

项目链接

https://github.com/jkkummerfeld/text2sql-data

PaperWeekly
PaperWeekly

推荐、解读、讨论和报道人工智能前沿论文成果的学术平台。

入门GitHub
9
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

可扩展标记语言技术

可扩展标记语言,是一种标记语言。标记指计算机所能理解的信息符号,通过此种标记,计算机之间可以处理包含各种信息的文章等。如何定义这些标记,既可以选择国际通用的标记语言,比如HTML,也可以使用像XML这样由相关人士自由决定的标记语言,这就是语言的可扩展性。XML是从标准通用标记语言中简化修改出来的

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

注意力机制技术

我们可以粗略地把神经注意机制类比成一个可以专注于输入内容的某一子集(或特征)的神经网络. 注意力机制最早是由 DeepMind 为图像分类提出的,这让「神经网络在执行预测任务时可以更多关注输入中的相关部分,更少关注不相关的部分」。当解码器生成一个用于构成目标句子的词时,源句子中仅有少部分是相关的;因此,可以应用一个基于内容的注意力机制来根据源句子动态地生成一个(加权的)语境向量(context vector), 然后网络会根据这个语境向量而不是某个固定长度的向量来预测词。

张量技术

张量是一个可用来表示在一些矢量、标量和其他张量之间的线性关系的多线性函数,这些线性关系的基本例子有内积、外积、线性映射以及笛卡儿积。其坐标在 维空间内,有 个分量的一种量,其中每个分量都是坐标的函数,而在坐标变换时,这些分量也依照某些规则作线性变换。称为该张量的秩或阶(与矩阵的秩和阶均无关系)。 在数学里,张量是一种几何实体,或者说广义上的“数量”。张量概念包括标量、矢量和线性算子。张量可以用坐标系统来表达,记作标量的数组,但它是定义为“不依赖于参照系的选择的”。张量在物理和工程学中很重要。例如在扩散张量成像中,表达器官对于水的在各个方向的微分透性的张量可以用来产生大脑的扫描图。工程上最重要的例子可能就是应力张量和应变张量了,它们都是二阶张量,对于一般线性材料他们之间的关系由一个四阶弹性张量来决定。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

OpenCV技术

OpenCV的全称是Open Source Computer Vision Library,是一个跨平台的计算机视觉库。OpenCV是由英特尔公司发起并参与开发,以BSD许可证授权发行,可以在商业和研究领域中免费使用。OpenCV可用于开发实时的图像处理、计算机视觉以及模式识别程序。

特征抽取技术

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

查询技术

一般来说,查询是询问的一种形式。它在不同的学科里涵义有所不同。在信息检索领域,查询指的是数据库和信息系统对信息检索的精确要求

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

问答系统技术

问答系统是未来自然语言处理的明日之星。问答系统外部的行为上来看,其与目前主流资讯检索技术有两点不同:首先是查询方式为完整而口语化的问句,再来则是其回传的为高精准度网页结果或明确的答案字串。以Ask Jeeves为例,使用者不需要思考该使用什么样的问法才能够得到理想的答案,只需要用口语化的方式直接提问如“请问谁是美国总统?”即可。而系统在了解使用者问句后,会非常清楚地回答“奥巴马是美国总统”。面对这种系统,使用者不需要费心去一一检视搜索引擎回传的网页,对于资讯检索的效率与资讯的普及都有很大帮助。从系统内部来看,问答系统使用了大量有别于传统资讯检索系统自然语言处理技术,如自然语言剖析(Natural Language Parsing)、问题分类(Question Classification)、专名辨识(Named Entity Recognition)等等。少数系统甚至会使用复杂的逻辑推理机制,来区隔出需要推理机制才能够区隔出来的答案。在系统所使用的资料上,除了传统资讯检索会使用到的资料外(如字典),问答系统还会使用本体论等语义资料,或者利用网页来增加资料的丰富性。

推荐文章
暂无评论
暂无评论~