史上最完整AI知识清单!!!涵盖神经网络、机器学习、深度学习和大数据等领域

本文涵盖了人工智能神经网络机器学习深度学习和大数据等领域的知识清单。具体如下:
  • 神经网络

  • Scikit-learn

  • Microsoft Azure机器学习

  • Python for Data Science

  • TensorFlow

  • Keras

  • NumPy

  • Pandas

  • Data Wrangling

  • Scipy

  • Matplotlib

  • Data Visualization

  • PySpark

  • Big-O

神经网络

神经网络清单

神经网络图清单

神经网络清单

机器学习概述

机器学习:Scikit-learn算法

该流程图将帮助您查看每个估算器的文档和粗略指南,以帮助您了解有关问题的更多信息以及解决方法。

Scikit-learn

Scikit-learn(以前称为scikits.learn)是一个用于Python编程语言的免费软件机器学习库。它有各种分类、回归和聚类算法,包括支持向量机、随机森林、梯度增强、k -means和DBSCAN,旨在与Python数值、科学库NumPy和SciPy能互操作。

Microsoft Azure机器学习备忘单

Microsoft Azure的这款机器学习备忘单将帮助您为预测分析解决方案选择合适的机器学习算法。首先,备忘单将询问您数据的性质,然后为该作业建议最佳算法。

Python for Data Science

Python数据科学备忘单

大数据备忘单

TensorFlow

2017年5月,Google发布了第二代TPU,以及Google Compute Engine中 TPU的可用性。第二代TPU可提供高达180 teraflops的性能,当组织成64个TPU的簇时,可提供高达11.5 petaflops的性能。

Keras

2017年,Google的TensorFlow团队决定在TensorFlow的核心库中支持Keras。Chollet解释说,Keras被认为是一个界面,而不是端到端的机器学习框架。它提供了更高级别,更直观的抽象集,无论后端科学计算库如何,都可以轻松配置神经网络

NumPy

NumPy的目标是Python 的CPython参考实现,它是一个非优化的字节码解释器。为此版本的Python编写的数学算法通常比编译的等效算法慢得多。NumPy通过提供多维数组以及在数组上高效运行的函数和运算符来解决缓慢问题,需要重写一些代码,主要是使用NumPy的内部循环。

Pandas

“Pandas”这个名称来自术语“ 面板数据 ”,这是一个多维结构化数据集的计量经济学术语。

Data Wrangling with pandas

Data Wrangling with dplyr and tidyr

SciPy

SciPy构建于NumPy数组对象之上,包括Matplotlib/pandas和SymPy等工具,以及一组不断扩展的科学计算库。这个NumPy具有与其他应用程序类似的用户,例如MATLAB、GNU Octave和Scilab。

matplotlib

matplotlib提供了一个面向对象的 API,用于使用通用GUI工具包(如Tkinter、wxPython、Qt或GTK +)将绘图嵌入到应用程序中。

数据可视化

数据可视化备忘单

ggplot备忘单

PySpark

Big-O

Big-O算法备忘单

Big-O算法复杂度图

BIG-O算法数据结构操作

Big-O阵列排序算法

信息来源:https://becominghuman.ai/cheat-sheets-for-ai-neural-networks-machine-learning-deep-learning-big-data-678c51b4b463

AMiner学术头条
AMiner学术头条

AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权。系统2006年上线,吸引了全球220个国家/地区800多万独立IP访问,数据下载量230万次,年度访问量1000万,成为学术搜索和社会网络挖掘研究的重要数据和实验平台。

https://www.aminer.cn/
专栏二维码
入门pandasNumpyKerasTensorFlowSciKit-Learn大数据深度学习机器学习神经网络
131
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

排序算法技术

排序算法是将一串数据依照特定排序方式进行排列的算法,最常用到的排序方式是数值顺序以及字典顺序。基本上,排序算法的输出必须遵守下列两个原则:输出结果为递增序列(递增是针对所需的排序顺序而言);输出结果是原输入的一种排列、或是重组。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

数据科学技术

数据科学,又称资料科学,是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。

TensorFlow技术

TensorFlow是一个开源软件库,用于各种感知和语言理解任务的机器学习。目前被50个团队用于研究和生产许多Google商业产品,如语音识别、Gmail、Google 相册和搜索,其中许多产品曾使用过其前任软件DistBelief。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

随机森林技术

在机器学习中,随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。 Leo Breiman和Adele Cutler发展出推论出随机森林的算法。而"Random Forests"是他们的商标。这个术语是1995年由贝尔实验室的Tin Kam Ho所提出的随机决策森林(random decision forests)而来的。这个方法则是结合Breimans的"Bootstrap aggregating"想法和Ho的"random subspace method" 以建造决策树的集合。

支持向量机技术

在机器学习中,支持向量机是在分类与回归分析中分析数据的监督式学习模型与相关的学习算法。给定一组训练实例,每个训练实例被标记为属于两个类别中的一个或另一个,SVM训练算法创建一个将新的实例分配给两个类别之一的模型,使其成为非概率二元线性分类器。SVM模型是将实例表示为空间中的点,这样映射就使得单独类别的实例被尽可能宽的明显的间隔分开。然后,将新的实例映射到同一空间,并基于它们落在间隔的哪一侧来预测所属类别。

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

推荐文章