Synced 深度研学社 每周干货,每周五为大家推荐机器学习的入门教程、技术分析、以及资源分享。不多不少,每天进步一点点~
【入门教程】Machine Learning in a Week
by Per Harald Borgen
内容介绍:Per Harald 也是一名程序猿,与传统的机器学习入门惯例不同,他采用由上到下的学习方式。
周一:观看将机器学习应用在股票投资上的全过程,对机器学习应用的步骤有大致的概念和了解。
周二:利用已有的数据库,提出一个问题,并尝试用机器学习的方法解决。
周三:回到最底层写算法,以对算法核心的内容有扎实的理解。
周四:到 ML 竞赛网站参与比赛,用挑战性和成就感激励自己。
周五:选择一门 ML 入门在线课程,再一次从细节学起。
scikit-learn Python 机器学习库:http://scikit-learn.org/stable/index.html
scikit-learn 算法选择思维导图:http://scikit-learn.org/stable/tutorial/machine_learning_map/
Sentdex 关于使用 scikit 的教学文章:https://pythonprogramming.net/machine-learning-python-sklearn-intro/
Udacity 的机器学习入门课:https://www.udacity.com/course/intro-to-machine-learning--ud120
ML 竞赛网站 Kaggle 的参赛介绍页面:https://www.kaggle.com/c/word2vec-nlp-tutorial
kaggle 的入门教程 bag of words:https://www.kaggle.com/c/word2vec-nlp-tutorial/details/part-1-for-beginners-bag-of-words
【技术分析】Comparison of Symbolic Deep Learning Frameworks
by Anusua Trivedi
作者是微软的数据科学家。文章从多个维度和应用层面对比了 Theano、TensorFlow、MXNET 等框架,文章用图表清晰地展示了各个框架的差异与优势。
文章链接:http://blog.revolutionanalytics.com/2016/08/deep-learning-part-1.html
【资源分享】Google Open Images 图像数据集
Google Research 发布的图像数据集。用谷歌云视觉 API 这样的视觉模型自动进行图像层次的注释已经变得很流行。在验证数据集上,我们有人类评定等级查证这些自动标签,并移除里面的假正例。平均而言,每个图像有大约 8 个标签。该模型被用于微调应用和其他事件时表现足够的好,比如用于 Deep Dream 或艺术风格迁移这样的需要较好层次结构的过滤器的任务。