Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

陈萍报道

《Python机器学习》畅销书作者又出新书了,全方位扩展你的机器学习知识

近年来,随着机器学习和人工智能的快速发展,研究人员和从业者一直在努力跟上关于 AI 领域的概念和技术相关信息。与此同时,了解人工智能和深度学习的最新进展对于使用这些技术的专业人士和组织来说至关重要。

考虑到这一点,机器学习和 AI 研究员 Sebastian Raschka 最近出了一本新书,书籍名为《Machine Learning Q and AI》。Sebastian 表示这本书是从去年夏天开始撰写的,阅读该书,可以扩展你的机器学习知识,即便你是经验丰富的机器学习研究人员和从业者也会学到一些新的东西。

这本书涵盖了机器学习和 AI 中的 30 个关键概念,涉及的主题包括:
  • 解释多 GPU 训练范例;
  • 微调 Transformer;
  • 编码器和解码器风格的 LLM。

此外,该书适用于已经熟练掌握机器学习并渴望学习新知识的人,换句话说,这本书是为那些有初级或中级机器学习背景的人准备的。值得注意的是,这本书没有晦涩的数学公式和代码,当你阅读时也无需解决任何证明,非常轻松的就能学到知识。
图片
书籍地址:https://leanpub.com/machine-learning-q-and-ai/

不过需要注意的是,本书不是完全免费的,只有部分章节免费获得。

本书共分为五个章节:

  • 第一章涵盖深度神经网络深度学习相关问题,这些问题并不限定于特定的子领域。例如,本章讨论了监督学习的替代方案和减少过度拟合的技术。
  • 第二章主要介绍计算机视觉。涵盖参数数量、全连接和卷积层、以及用于视觉 Transformers 的大型训练集。
  • 第三章涵盖与文本有关的各种主题,包括用于文本的数据增强、自注意力、编码器和解码器风格 Transformers、微调预训练 Transformers、如何评估生成语言模型
  • 第四章介绍关于 AI 的生产、实际和部署场景,内容涵盖无状态和有状态训练、以数据为中心的 AI、加速推理等。
  • 第五章主要介绍预测性能和模型评估,例如,更改损失函数、设置 k-fold 交叉验证以及处理有限的标记数据。

书籍目录:
图片
图片
图片

作者介绍

图片
个人主页:https://sebastianraschka.com/

Sebastian Raschka 是一名机器学习人工智能研究员,对教育有着强烈的热情。作为 Lightning AI 的首席 AI 教育家,他让关于 AI 和深度学习相关的内容更加容易获得,并教人们如何大规模利用这些技术。

在全身心投入 Lightning AI 之前,Sebastian 曾在威斯康星大学麦迪逊分校担任统计学助理教授,专门研究深度学习机器学习,你可以在他的网站上找到更多关于他的研究。此外,Sebastian 热衷于开源软件,十多年来一直是一个充满热情的开源贡献者。他提出的方法现已成功应用于 Kaggle 等机器学习竞赛。在空闲时间,Sebastian 还会研究运动型预测模型。

除了编写代码,Sebastian 还喜欢写作,并撰写了畅销书《Python Machine Learning》(《Python 机器学习》)和《Machine Learning with PyTorch and ScikitLearn》。

除此以外,Sebastian 还喜欢研究数据科学机器学习和 Python,他也非常愿意帮助人们开发数据驱动的解决方案,而无需任何机器学习背景。
理论Sebastian Raschka《Machine Learning Q and AI》
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

自注意力技术

自注意力(Self-attention),有时也称为内部注意力,它是一种涉及单序列不同位置的注意力机制,并能计算序列的表征。自注意力在多种任务中都有非常成功的应用,例如阅读理解、摘要概括、文字蕴含和语句表征等。自注意力这种在序列内部执行 Attention 的方法可以视为搜索序列内部的隐藏关系,这种内部关系对于翻译以及序列任务的性能非常重要。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

数据科学技术

数据科学,又称资料科学,是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。

损失函数技术

在数学优化,统计学,计量经济学,决策理论,机器学习和计算神经科学等领域,损失函数或成本函数是将一或多个变量的一个事件或值映射为可以直观地表示某种与之相关“成本”的实数的函数。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

监督学习技术

监督式学习(Supervised learning),是机器学习中的一个方法,可以由标记好的训练集中学到或建立一个模式(函数 / learning model),并依此模式推测新的实例。训练集是由一系列的训练范例组成,每个训练范例则由输入对象(通常是向量)和预期输出所组成。函数的输出可以是一个连续的值(称为回归分析),或是预测一个分类标签(称作分类)。

交叉验证技术

交叉验证,有时亦称循环估计, 是一种统计学上将数据样本切割成较小子集的实用方法。于是可以先在一个子集上做分析, 而其它子集则用来做后续对此分析的确认及验证。 一开始的子集被称为训练集。而其它的子集则被称为验证集或测试集。交叉验证的目标是定义一个数据集到“测试”的模型在训练阶段,以便减少像过拟合的问题,得到该模型将如何衍生到一个独立的数据集的提示。

深度神经网络技术

深度神经网络(DNN)是深度学习的一种框架,它是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。

语言模型技术

语言模型经常使用在许多自然语言处理方面的应用,如语音识别,机器翻译,词性标注,句法分析和资讯检索。由于字词与句子都是任意组合的长度,因此在训练过的语言模型中会出现未曾出现的字串(资料稀疏的问题),也使得在语料库中估算字串的机率变得很困难,这也是要使用近似的平滑n元语法(N-gram)模型之原因。

推荐文章
暂无评论
暂无评论~