CMU课程上新:Neural Networks for NLP(18年视频课件放出)

今天文摘菌给大家推荐一门非常棒的课程《Neural Networks for NLP》。这个课程首先简要介绍一下神经网络的基本知识,然后课程的大部讲分如何将神经网络应用于自然语言处理

课程中的每一节都会介绍自然语言中的特定问题和现象,并描述建模的难点,当然,并也会绍几个解决这些问题的模型。

总的来说,这个“神课”会涉及用神经网络建模过程中所使用的各种技术,包括如何处理结构化句子,如何处理大数据,以及半监督和无监督学习,结构化预测和多语言建模等等。

注意,修读本门课程需要有一定的自然语言处理的知识储备,按照课程的要求,就是应该上过《17-711,NLP算法》。

2018年的课程视频已经公开,无法上外网的同学,国内也有热心的小伙伴将课程搬到了国内的B站,通过下面的链接可以打开哟

https://www.bilibili.com/video/av31156700/

19年的春季新课程新增了ELMo/BERT上下文词表示、模型可解释性等内容,PyTorch/DyNet代码示例。

19年课程的课程目录等详细信息,可以去课程主页去查看哟~~文摘菌在下面给大家简单介绍一下这门课程的师资以及作业等情况。

https://phontron.com/class/nn4nlp2019/schedule.html

师资力量

本课程有两位主讲教师,分别是:Graham Neubig、Antonios Anastasopoulos。其中Graham Neubig是卡内基梅陇大学的教授,主要研究自然语言处理,他对机器学习非常感兴趣。Antonios Anastasopoulos我是圣母大学的在读博士,目前David Chiang自然语言处理技术组的成员。专注于“濒危”语言的机器翻译语音识别

除了上课的教师外,还有一大批助教来解答同学们的疑惑。从助教安排,我们可以看出,课程在尽量做到有问必答。

作业介绍及资料公开

在课程的官网上,对课程的每一次作业都做了详细的说明,包括评分要求,完成作业的条件等等。除此之外还给出了作业示例。

课程官网也贴心的给大家准备好了每一次讲课的PPT,在上课之前,大家多多预习哟~

PPT下载地址:https://phontron.com/class/nn4nlp2019/schedule.html

此次课程,初步是线下课程。请大家关注大数据文摘,如果后期有视频放出,文摘菌也一定会为大家更新的。

最后,再次给出课程主页:https://phontron.com/class/nn4nlp2019/schedule.html

大数据文摘
大数据文摘

秉承“普及数据思维,传播数据文化,助⼒产业发展”的企业⽂化,我们专注于数据领域的资讯、案例、技术,形成了“媒体+教育+⼈才服务”的良性⽣态,致⼒于打造精准数据科学社区。

入门CMU神经网络自然语言处理
3
相关数据
基于Transformer 的双向编码器表征技术

BERT是谷歌发布的基于双向 Transformer的大规模预训练语言模型,该预训练模型能高效抽取文本信息并应用于各种NLP任务,并刷新了 11 项 NLP 任务的当前最优性能记录。BERT的全称是基于Transformer的双向编码器表征,其中“双向”表示模型在处理某一个词时,它能同时利用前面的词和后面的词两部分信息。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

机器翻译技术

机器翻译(MT)是利用机器的力量「自动将一种自然语言(源语言)的文本翻译成另一种语言(目标语言)」。机器翻译方法通常可分成三大类:基于规则的机器翻译(RBMT)、统计机器翻译(SMT)和神经机器翻译(NMT)。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

推荐文章
暂无评论
暂无评论~