参与路雪 王淑婷

TensorFlow推出新工具Seedbank:即刻使用的预训练模型库

今日,TensorFlow 推出新工具 Seedbank,用户可在该平台上查找大量机器学习示例(包括教程、研究文章等等),这些示例还具备相应的 Colab notebook,使应用更加简单明了。

工具链接:http://tools.google.com/seedbank/

发现并开始新的机器学习项目有点艰难。也许你有一个关于项目的模糊想法,正在寻找从何处入手。或者你正在寻找灵感,看看有哪些可能。

今天,TensorFlow 推出 Seedbank,这是一个发现交互式机器学习示例的地方,你可以直接从浏览器运行,无需其他设置。每个示例都是启发你的一颗小种子,你可以对其进行编辑、扩展,甚至将其融入自己的项目和想法中,例如数据分析问题、艺术项目等等。

近期谷歌以 Colab notebook 的形式发布了很多机器学习代码示例。Colaboratory 是谷歌的 Jupyter notebook 环境,允许用户使用谷歌提供的免费 GPU 通过浏览器直接运行代码,无需任何设置。

这些示例包括在 tensorflow.org 上的新入门经验、机器学习速成教程、distill.pub 上的研究文章,以及 tensorflow.org 上越来越多的教程(如神经机器翻译教程)。TF Hub 还提供多种可直接应用的预训练机器学习模块,它们通常具备 Colab notebook 来说明如何应用,使操作更加简单。

现在 Seedbank 提供了一个平台来搜索 Colab 支持的机器学习示例。你可以使用最高级类别(top-level category)来缩小探索范围,在 notebook 中搜索关键词。每个种子都有一个预览,可以让你快速评估是否想要继续探索。一旦你点击前往 Colab notebook,你将立刻被连接到一个 GPU 核,然后就可以通过示例或教程开始工作。现在,Seedbank 只能追踪谷歌发布的 notebook,不过未来会索引用户创建的内容。TensorFlow 的工作人员将尽己所能定期更新 Seedbank,并确保更新 TensorFlow.org 上的新内容。

但最好的一点是 Colab 可以让你编辑 notebook、将副本保存到 Google Drive,并与朋友或在社交媒体上共享那些衍生品,以及可以一直使用 Colab GPU 进行快速训练和推断。你还可以从 Google Drive 中读取数据,使用 Google Drive 导入大型数据集也只是一瞬间的事儿。查看该网址:https://tools.google.com/seedbank/seed/5646239437684736,在 Seedbank 上查看进行此类操作的示例。

希望大家能够更快地找到自己的 idea,并且种下美妙想法的种子。

原文链接:https://medium.com/tensorflow/seedbank-discover-machine-learning-examples-2ff894542b57

工程预训练模型TensorFlow
3
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

神经机器翻译技术

2013 年,Nal Kalchbrenner 和 Phil Blunsom 提出了一种用于机器翻译的新型端到端编码器-解码器结构 [4]。该模型可以使用卷积神经网络(CNN)将给定的一段源文本编码成一个连续的向量,然后再使用循环神经网络(RNN)作为解码器将该状态向量转换成目标语言。他们的研究成果可以说是神经机器翻译(NMT)的诞生;神经机器翻译是一种使用深度学习神经网络获取自然语言之间的映射关系的方法。NMT 的非线性映射不同于线性的 SMT 模型,而且是使用了连接编码器和解码器的状态向量来描述语义的等价关系。此外,RNN 应该还能得到无限长句子背后的信息,从而解决所谓的「长距离重新排序(long distance reordering)」问题。

TensorFlow技术

TensorFlow是一个开源软件库,用于各种感知和语言理解任务的机器学习。目前被50个团队用于研究和生产许多Google商业产品,如语音识别、Gmail、Google 相册和搜索,其中许多产品曾使用过其前任软件DistBelief。

张量技术

张量是一个可用来表示在一些矢量、标量和其他张量之间的线性关系的多线性函数,这些线性关系的基本例子有内积、外积、线性映射以及笛卡儿积。其坐标在 维空间内,有 个分量的一种量,其中每个分量都是坐标的函数,而在坐标变换时,这些分量也依照某些规则作线性变换。称为该张量的秩或阶(与矩阵的秩和阶均无关系)。 在数学里,张量是一种几何实体,或者说广义上的“数量”。张量概念包括标量、矢量和线性算子。张量可以用坐标系统来表达,记作标量的数组,但它是定义为“不依赖于参照系的选择的”。张量在物理和工程学中很重要。例如在扩散张量成像中,表达器官对于水的在各个方向的微分透性的张量可以用来产生大脑的扫描图。工程上最重要的例子可能就是应力张量和应变张量了,它们都是二阶张量,对于一般线性材料他们之间的关系由一个四阶弹性张量来决定。

推荐文章
暂无评论
暂无评论~