Synced 深度研学社 每周干货,每周五为大家推荐机器学习的入门教程、技术分析、以及资源分享。不多不少,每周进步一点点~
【入门书籍】Python Machine Learning
by Kevin Patrick Murphy
简介:作者曾是加州大学伯克利分校的计算机科学教授,后以research scientist的身份加入Google。这本书出版于2015年,是一本非常优秀的Python工具书,粗浅地介绍了机器学习的概念和在各个领域的应用。虽然这本书并没有深入到理论的层次,但涉及内容广泛,有诸多举例阐释和数学公式的罗列,解释了各举措的意义何在,很具有使用价值。不过不少读者反馈typo略多,建议结合一些更正一并阅读。
【技术分析】Comparative Study of CNN and RNN for Natural Language Processing
by Wenpeng Yin, Katharina Kann, Mo Yu, Hinrich Schütze
简介:作者们来自业界和学术界,在这篇论文中第一次系统地对比了在自然语言处理中CNN和RNN的应用,旨在为DNN选择上提供一些基本指导。DNN指Deep Neural Network,公认地引起了自然语言处理领域的变革。其主要类型是CNN和RNN,即Convolutional Neural Network和Recurrent Neural Network。文中对比的NLP中诸多重要任务,比如情感分类、关系分类、词性标注、答案选择等,得出了不少有价值的结论,总体来讲RNN在大部分任务中表现比DNN更好。
【资源分享】SQuAD: 100,000+ Questions for Machine Comprehension of Text
by Pranav Rajpurkar, Jian Zhang, Konstantin Lopyrev , Percy Liang
简介:SQuAD全称为Stanford Question Answering Dataset,是一个包括有十万个问答的集合,通过群体合作从维基百科的文章中收集而来,每个问题的答案是一段从原文回答中提取的文本。作者主要通过dependency tree和constituency tree来分析和学习回答每类问题所需的推理类型和方法,并开发出一个logistic regression model来模拟问答,达到了51.0%的F1分数。相关论文和数据库链接如下: