蛋酱、魔王编辑

「小破站」真顶流,CMU语言技术研究所登陆B站:这是学术圈的新时尚?

小破站真是出息了。

当年发迹于二次元的「小破站」,俨然时代顶流了。继加拿大滑铁卢大学教授在 B 站开设《差分隐私》课程之后,现在又有国外机构来小破站开课了!😏

1 月 20 日,一个名为「LTIatCMU」(卡耐基梅隆大学语言技术研究所)的账号,悄悄在 B 站上传了 9 个视频。

CMU 副教授 Graham Neubig 发推表示,这些讲座集结了语言技术研究所(LTI)成员与客座讲师,在 YouTube 和 B 站均有资源。

「我们的中国朋友也可以观看 bilibili:https://space.bilibili.com/1377044784」

该系列视频主要涵盖 CMU 语言技术研究所 2020 年秋季学术研讨会(Fall 2020 Colloquium)的内容,介绍了自然语言处理领域的前沿研究。

LTI Colloquium 已举办数年,每届研讨会都会邀请不同语言技术领域的专家学者举办讲座。2020 年秋季研讨会涉及预训练语言模型 XLNet、聊天机器人 Emora、人脑中的语言系统、数据和语言学自然语言生成中的重要性、混合启动对话搜索、直观推理与(无)监督神经生成等,讲师来自 CMU、埃默里大学、MIT、佐治亚理工学院、马萨诸塞大学阿默斯特分校、华盛顿大学多所机构。

「众所周知,B 站是一个学习网站。」虽然但是,在此之前,我们也是没想到小破站会如此「声名远播」。有网友问 Graham Neubig:「你怎么知道 B 站的?」

Graham Neubig 表示,这次在 B 站的账号开通和内容上传等工作都是由自己的博士生 Shuyan Zhou 负责的(另:这位小姐姐也是哈工大的校友)。

不过 Graham Neubig 对 Bilibili 算是「久仰大名」了,而且他自己也略懂一点中文,有时也会上中文网站。

看得出来,「小破站」果然不是当年的「小破站」了。上一次,机器之心隆重推荐了滑铁卢大学计算机教授 Gautam Kamath 的账号,他在入驻 B 站一个月后,已经收获了 2.7 万粉丝和超过 33 万的播放量。

他的好友、CMU 计算机科学教授 Ryan O'Donnell 的 UP 主事业也蒸蒸日上:

没个 B 站账号,还怎么混圈?

LTIatCMU 的 YouTube 账号是在 2020 年 8 月 15 日注册的,半年多以来,积攒了 300 多位粉丝和 2000 多的播放量。当然,LTIatCMU 目前在 B 站的粉丝数量也不算多,还处于运营初期。

有朋自远方来,要不要一键三连?

关于 LTIatCMU

LTIatCMU 目前拥有 30 多名教职人员,研究重点包括机器翻译语音识别语音合成信息检索、信息提取和多模态机器学习等。LTIatCMU 最初成立于 1986 年,由机器翻译先驱 Jaime Carbonell 教授创办,并从 1996 年开始授予学位。

该研究所的著名教授包括 Alan W Black(语音)、Louis-Philippe Morency(多模态机器学习)、Scott Fahlman(知识表征), Graham Neubig(机器翻译)、Justine Cassell、Eduard Hovy、Eric Nyberg 和邢波(Eric Xing)。

LTI 网站显示,LTI 2021 年春季研讨会将于 2 月 5 日开始,为期 3 个月,将邀请 10 多名学者进行讲座,斯坦福大学副教授 Percy Liang、微软亚洲研究院副院长刘铁岩也会参与。

看样子,B 站新晋 Up 主 @LTIatCMU 很快就要更新视频了。


入门B站课程卡内基梅隆大学
相关数据
微软亚洲研究院机构

微软亚洲研究院于1998年在北京成立,是微软公司在亚太地区设立的基础及应用研究机构,也是微软在美国本土以外规模最大的一个研究院。微软亚洲研究院从事自然用户界面、智能多媒体、大数据与知识挖掘、人工智能、云和边缘计算、计算机科学基础等领域的研究,致力于推动计算机科学前沿发展,着眼下一代革命性技术的创新,助力微软实现长远发展战略。

www.msra.cn
邢波人物

卡内基梅隆大学计算机科学学院教授,机器学习系副主任,专攻机器学习、计算生物学和统计方法等方向。他与合作者开发了Petuum平台,利用工作站、分布式计算机、移动设备或嵌入式设备来解决大型机器学习的问题。2016年11月,邢波创立Petuum公司,担任CEO和首席科学家。

刘铁岩人物

刘铁岩博士毕业于清华大学电子工程系。现任微软亚洲研究院主任研究员,互联网经济与计算广告学研究组负责人。他是美国计算机学会(ACM)、国际电子电气工程师学会(IEEE)、和中国计算机学会(CCF)的高级会员。中国科技大学和南开大学的客座教授。

信息检索技术

信息检索(IR)是基于用于查询检索信息的任务。流行的信息检索模型包括布尔模型、向量空间模型、概率模型和语言模型。信息检索最典型和最常见的应用是搜索引擎。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

知识表征技术

知识表示是人工智能的一部分,它关心代理人(agent)如何在决定做什么时使用它所知道的知识, 这是一门将思考作为计算过程的研究。严格来说知识表示和知识推理是同一研究领域密切相关的两个概念,但实际上知识表示也经常用来直接指代包含推理的广义概念,因此在这里沿用后者,即知识表示等价于知识表示与推理。这是一个涉及使用符号来表示一些推定代理人(putative agent)相信的命题集合的研究领域。 但是在另一方面,我们同时不想坚持这些符号必须代表代理人相信的主张。因为实际上代理人可能相信无数的命题,但只有一部分被表示出来。 而弥合所代表的事物与所相信的事物之间的差距将成为推理(reasoning)在知识表示中所承担的责任。因此,推理一般来说是对代表一系列代理所相信的命题符号进行形式化处理,以产生新的表征。 符号需要比它们表示的命题更容易操纵,因此它们必须足够具体,以便我们可以操纵它们(移动它们,拆开它们,复制它们,串起它们) 构建新命题的表征。

机器翻译技术

机器翻译(MT)是利用机器的力量「自动将一种自然语言(源语言)的文本翻译成另一种语言(目标语言)」。机器翻译方法通常可分成三大类:基于规则的机器翻译(RBMT)、统计机器翻译(SMT)和神经机器翻译(NMT)。

聊天机器人技术

聊天机器人是经由对话或文字进行交谈的计算机程序。能够模拟人类对话,通过图灵测试。 聊天机器人可用于实用的目的,如客户服务或资讯获取。有些聊天机器人会搭载自然语言处理系统,但大多简单的系统只会撷取输入的关键字,再从数据库中找寻最合适的应答句。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

自然语言生成技术

自然语言生成(NLG)是自然语言处理的一部分,从知识库或逻辑形式等等机器表述系统去生成自然语言。这种形式表述当作心理表述的模型时,心理语言学家会选用语言产出这个术语。自然语言生成系统可以说是一种将资料转换成自然语言表述的翻译器。不过产生最终语言的方法不同于编译程式,因为自然语言多样的表达。NLG出现已久,但是商业NLG技术直到最近才变得普及。自然语言生成可以视为自然语言理解的反向: 自然语言理解系统须要厘清输入句的意涵,从而产生机器表述语言;自然语言生成系统须要决定如何把概念转化成语言。

机器之心机构

机器之心,成立于2014年,是国内最具影响力、最专业、唯一用于国际品牌的人工智能信息服务与产业服务平台。目前机器之心已经建立起涵盖媒体、数据、活动、研究及咨询、线下物理空间于一体的业务体系,为各类人工智能从业者提供综合信息服务和产业服务。

https://www.jiqizhixin.com/
语言学技术

每种人类语言都是知识和能力的复合体,语言的使用者能够相互交流,表达想法,假设,情感,欲望以及所有其他需要表达的事物。语言学是对这些知识体系各方面的研究:如何构建这样的知识体系,如何获取,如何在消息的制作和理解中使用它,它是如何随时间变化的?语言学家因此关注语言本质的一些特殊问题。比如: 所有人类语言都有哪些共同属性?语言如何不同,系统的差异程度如何,我们能否在差异中找到模式?孩子如何在短时间内获得如此完整的语言知识?语言随时间变化的方式有哪些,语言变化的局限性是什么?当我们产生和理解语言时,认知过程的本质是什么?语言学研究的就是这些最本质的问题。

语言模型技术

统计式的语言模型是借由一个几率分布,而指派几率给字词所组成的字串。语言模型经常使用在许多自然语言处理方面的应用,如语音识别,机器翻译,词性标注,句法分析和资讯检索。

语音合成技术

语音合成是通过机械的、电子的方法产生人造语音的技术。TTS技术(又称文语转换技术)隶属于语音合成,它是将计算机自己产生的、或外部输入的文字信息转变为可以听得懂的、流利的汉语口语输出的技术。

推荐文章
暂无评论
暂无评论~