Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

shanshan编辑

CMU副教授Graham Neubig创立新公司,刘鹏飞加盟,致力于优化AI系统开发

又一位技术大牛出来创业了!

9 月 13 日,卡内基梅隆大学副教授 Graham Neubig 在 Twitter 上宣布,与 @stefan_fee 和 @odashi_en 一起成立了 Inspired Cognition 公司! 

「我们的目标是通过工具和专业知识,让构建 AI 系统(尤其是 NLP)变得更容易、更高效。」

 

1、致力于优化 AI 系统开发

人工智能 (AI) 正在成为与软件一样推动世界进步的力量。然而,与传统的软件工程不同,人工智能工程引入了各种新的挑战。具体来说,开发人工智能系统涉及大量具有不确定含义的设计选择。

「我们如何选择最好的数据和建模方法来实现我们的目标?我们如何评估我们的系统并识别它们的问题?我们如何才能不仅对我们自己的系统,而且对所有可能的人工智能研究领域形成一个全球性的理解? 

Inspired Cognition 表示,公司创立的初衷,就是如何优化 AI 系统开发,使其更高效、更有效、更可靠。目前,Inspired Cognition 提供的服务主要基于卡内基梅隆大学和许多其他贡献者开发的开源软件,包括:

DataLab:DataLab 是一个开发库,可让您有效地定位、评估和操作数据集以改进您的系统。EaaS 评估即服务:EaaS 提供「评估即服务」,允许您通过简单的 API 库使用多种最先进的技术评估机器生成文本的质量。ExplainaBoard:ExplainaBoard 提供「可解释的排行榜」,让您可以在细粒度级别上比较和对比系统的性能,识别痛点并有效地提高性能。

Inspired Cognition 一共有三位联合创始人。Graham Neubig 是首席执行官。他是卡内基梅隆大学的副教授,也是一位多产的 AI 研究人员,是许多广泛使用的开源工具包的首席开发人员。他的知识跨越自然语言处理,尤其擅长问答、代码生成、多语言应用和语音处理。 

刘鹏飞是首席战略官。他是卡内基梅隆大学博士后研究员,以在自然语言处理的学习和评估方法方面的开创性工作而闻名,他的软件项目 ExplainaBoard 和 DataLab 是核心 Inspired 产品。

Yusuke Oda 是首席技术官。他在开发行业人工智能模型方面拥有丰富的经验,包括曾在谷歌担任过职位以及在 LegalForce 担任人工智能负责人。

 

2、机器翻译「大神」Graham Neubig

身为 Inspired Cognition 的联合创始人兼首席执行官,Graham Neubig 毕业于京都大学,获博士学位,曾经任职日本奈良科学技术研究所(NAIST)副教授,其研究兴趣包括计算机科学、机器翻译语音识别语音处理、神经机器翻译

在卡内基梅隆大学语言技术研究所,Graham Neubig 研究关注的是语言及其在人类交流中的作用。长期研究目标是通过开发自然语言处理(NLP)技术来打破人与人或人机交流的障碍。

Graham Neubig 工作的第一个研究方向侧重于核心 NLP 技术的进步,这些技术提高了我们分析、翻译、生成或回复文本输入的准确性。 

第二个研究方向侧重于与其他形式相关的自然语言模型,解决问题,并利用文本与其他类型信息相关联所带来的迷人可能性。具体来说,他在语音方面进行了广泛的工作,并且对自然语言和形式语言(例如源代码)之间的关联也很感兴趣。

第三个研究方向侧重于通过使用无监督、半监督或主动学习从自然发生的数据中学习 NLP 模型,这使我们能够利用这些数据来改进模型,同时减少昂贵的手动注释的必要性。 

Graham Neubig 会定期在自然语言处理机器学习和演讲领域的顶级刊物上发表文章,他的作品偶尔也会获得诸如 EMNLP、EACL 和 WNMT 的最佳论文等奖项。他还积极开发开源软件,是 DyNet 神经网络工具包的主要开发人员。

LTIatCMU 最初成立于 1986 年,由机器翻译先驱 Jaime Carbonell 教授创办,并从 1996 年开始授予学位。LTIatCMU 研究重点包括机器翻译语音识别语音合成信息检索、信息提取和多模态机器学习等。

除了 Graham Neubig,该研究所的著名教授还包括 Alan W Black(语音)、Louis-Philippe Morency(多模态机器学习)、Scott Fahlman(知识表征)、Justine Cassell、Eduard Hovy、Eric Nyberg 和邢波(Eric Xing)等。

资料来源:

http://inspiredco.ai/

https://www.lti.cs.cmu.edu/people/222217661/graham-neubig

https://www.youtube.com/watch?v=OObrN8yMYZU

http://www.phontron.com/](http://www.phontron.com/

产业Graham NeubigCMU
相关数据
邢波人物

卡内基梅隆大学计算机科学学院教授,机器学习系副主任,专攻机器学习、计算生物学和统计方法等方向。他与合作者开发了Petuum平台,利用工作站、分布式计算机、移动设备或嵌入式设备来解决大型机器学习的问题。2016年11月,邢波创立Petuum公司,担任CEO和首席科学家。

信息检索技术

信息检索(IR)是基于用于查询检索信息的任务。流行的信息检索模型包括布尔模型、向量空间模型、概率模型和语言模型。信息检索最典型和最常见的应用是搜索引擎。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

知识表征技术

知识表示是人工智能的一部分,它关心代理人(agent)如何在决定做什么时使用它所知道的知识, 这是一门将思考作为计算过程的研究。严格来说知识表示和知识推理是同一研究领域密切相关的两个概念,但实际上知识表示也经常用来直接指代包含推理的广义概念,因此在这里沿用后者,即知识表示等价于知识表示与推理。这是一个涉及使用符号来表示一些推定代理人(putative agent)相信的命题集合的研究领域。 但是在另一方面,我们同时不想坚持这些符号必须代表代理人相信的主张。因为实际上代理人可能相信无数的命题,但只有一部分被表示出来。 而弥合所代表的事物与所相信的事物之间的差距将成为推理(reasoning)在知识表示中所承担的责任。因此,推理一般来说是对代表一系列代理所相信的命题符号进行形式化处理,以产生新的表征。 符号需要比它们表示的命题更容易操纵,因此它们必须足够具体,以便我们可以操纵它们(移动它们,拆开它们,复制它们,串起它们) 构建新命题的表征。

神经机器翻译技术

2013 年,Nal Kalchbrenner 和 Phil Blunsom 提出了一种用于机器翻译的新型端到端编码器-解码器结构 [4]。该模型可以使用卷积神经网络(CNN)将给定的一段源文本编码成一个连续的向量,然后再使用循环神经网络(RNN)作为解码器将该状态向量转换成目标语言。他们的研究成果可以说是神经机器翻译(NMT)的诞生;神经机器翻译是一种使用深度学习神经网络获取自然语言之间的映射关系的方法。NMT 的非线性映射不同于线性的 SMT 模型,而且是使用了连接编码器和解码器的状态向量来描述语义的等价关系。此外,RNN 应该还能得到无限长句子背后的信息,从而解决所谓的「长距离重新排序(long distance reordering)」问题。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

语音合成技术

语音合成,又称文语转换(Text to Speech)技术,是将人类语音用人工的方式所产生,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,也即让机器像人一样开口说话。

机器翻译技术

机器翻译(MT)是利用机器的力量「自动将一种自然语言(源语言)的文本翻译成另一种语言(目标语言)」。机器翻译方法通常可分成三大类:基于规则的机器翻译(RBMT)、统计机器翻译(SMT)和神经机器翻译(NMT)。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

主动学习技术

主动学习是半监督机器学习的一个特例,其中学习算法能够交互式地查询用户(或其他信息源)以在新的数据点处获得期望的输出。 在统计学文献中,有时也称为最佳实验设计。

语音处理技术

语音处理(Speech processing),又称语音信号处理、人声处理,其目的是希望做出想要的信号,进一步做语音辨识,应用到手机界面甚至一般生活中,使人与电脑能进行沟通。

推荐文章
暂无评论
暂无评论~