​Python又添一大科学计算库,基于Armadillo矩阵库的PyArmadillo发布

目前,Python 拥有众多科学计算库, 最为著名的如 NumPy 和 SciPy。但从代数运算以及使用语法来看, 这些库往往会带来不必要的繁琐,没办法直观地管理其中的数据类型。因此将 Armadillo 作为底层的 PyArmadillo 库基于这一点,重新塑造了类似 Matlab 和 Octave 等简单易用的语法。此外,由于 pybind11 的用法相对简单,PyArmadillo 将 pybind11 用来连接 C++ 与 Python。该库已于近日正式发布。


作为 C++ 中与 Eigen 并驾齐驱的一大科学计算库, Armadillo 因其简单易用的特性深受广大程序员和科学家的喜爱,也获得了 Facebook、NASA、Boeing、Siemens、Deutsche Bank、MIT、 CMU、Stanford 等公司和高校的广泛使用。此外, Armadillo 的主作者和 Rcpp 的主作者联合开发了 RcppArmadillo,作为 R 语言中的主要科学计算库,在 Github 每月下载量高达 97.2 万次。除此以外,Armadillo 还在著名开源机器学习库 mlpack 中被用作主要的依赖库之一, 获得了极高的知名度。

此次 PyArmadillo 库的开发耗时 2 个月,在 Armadillo 主作者 Conrad Sanderson 的指导建议下,由 Data61 的实习生并在读于昆士兰科技大学(QUT)本科的 Jason Rumengan 和在读于新南威尔士大学(UNSW)本科的 Terry Yue Zhuo 开发完成。其中,Terry 受 Conrad 邀请参与到 PyArmadillo 中与 Jason 共同开发两大类型 mat 与 cube,也是唯一一位华人。Jason 主要负责 mat 部分以及编译方面而 Terry 则负责 cube 部分以及文档和测试。

项目地址:https://github.com/terryyz/PyArmadillo

具体而言,PyArmadillo 是一个 Python 语言的线性代数库,强调易用性。该库旨在提供类似于 Matlab 或者 Octave 的高级语法和功能,使得用户以熟悉且自然的方式表达数学运算。

PyArmadillo 还提供了用于矩阵和多维数据集(cube)的对象,以及 200 多个用于处理对象中存储数据的相关函数。所有功能都可以在一个平面结构中访问,并且支持整数、浮点数和复数。通过集成 LAPACK 或者 Intel MKL、OpenBLAS 等高性能替代产品,该库可以提供各种矩阵分解

安装指南

PyArmadillo 库的具体用例如下图所示:

安装 PyArmadillo 需要满足以下要求:

  • 大于 Python3.6,推荐为 3.8 及以上;

  • 支持至少 C++ 11 标准的 C++ 编译器;

  • 至少 8G RAM;

  • 64-bit 的 CPU, 最好 4 核以上;

  • 安装之前已安装好 OpenBLAS 和 LAPACK。


目前支持的操作系统

  • Linux;

  • MacOS;

  • Window x64 (x86 暂不支持)。


当前 PyArmadillo 仅为 MVP(minimum viable product),更多的功能还在开发当中。如果使用途中遇到问题,可以通过官网作者的联系方式与他们交流或者在 GitLab 的仓库内汇报。

作者简介

Jason Rumengan,昆士兰科技大学信息技术本科生。研究兴趣在于软件开发、信息安全、网络连接、数据分析等。

Jason Rumengan 个人主页:https://www.jasonrumengan.my.id

Conrad Sanderson 为 Armadillo 的主要作者,曾受 Yoshua Bengio 弟弟 Samy Bengio 指导进入博士后(PostDoc)研究。在 Samy Bengio 为数不多的学生之中,Conrad 是唯一一个他指导过的 PostDoc。后来,Conrad 来到早期为 NICTA 而现今为 CSIRO 一部分的 Data61 担任研究科学进行研究,并且从计算机视觉研究过渡到开源科学计算库的开发工作。在 Armadillo 大获成功之后,Conrad 开始与 Debian 和 R 的主要开发人之一以及 Rcpp 的主作者 Dirk Eddelbuettel 合作进行 RcppArmadillo 的开发。主要研究兴趣在于机器学习、AI、模式识别计算机视觉、高性能数值计算等。

Conrad Sanderson 个人主页:https://conradsanderson.id.au

华人作者 Terry Yue Zhuo 现为新南威尔士大学(UNSW)计算机科学本科生,主要研究兴趣在于自然语言处理(NLP)、AI 和图像处理等。

Terry Yue Zhuo 个人主页:https://terryyz.github.io

相关链接:

PyArmadillo 官网:https://pyarma.sourceforge.io
PyArmadillo 技术报告:https://pyarma.sourceforge.io/pyarmadillo_tech_report_2021.pdf
Armadillo 官网:http://arma.sourceforge.net
GitLab 开源地址:https://gitlab.com/jason-rumengan/pyarma
RcppArmadillo 官方仓库:https://github.com/RcppCore/RcppArmadillo



工程Python科学计算
1
相关数据
数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

模式识别技术

模式识别(英语:Pattern recognition),就是通过计算机用数学技术方法来研究模式的自动处理和判读。 我们把环境与客体统称为“模式”。 随着计算机技术的发展,人类有可能研究复杂的信息处理过程。 信息处理过程的一个重要形式是生命体对环境及客体的识别。其概念与数据挖掘、机器学习类似。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

操作系统技术

操作系统(英语:operating system,缩写作 OS)是管理计算机硬件与软件资源的计算机程序,同时也是计算机系统的内核与基石。操作系统需要处理如管理与配置内存、决定系统资源供需的优先次序、控制输入与输出设备、操作网络与管理文件系统等基本事务。操作系统也提供一个让用户与系统交互的操作界面。

图像处理技术

图像处理是指对图像进行分析、加工和处理,使其满足视觉、心理或其他要求的技术。 图像处理是信号处理在图像领域上的一个应用。 目前大多数的图像均是以数字形式存储,因而图像处理很多情况下指数字图像处理。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

线性代数技术

线性代数是数学的一个分支,它的研究对象是向量,向量空间(或称线性空间),线性变换和有限维的线性方程组。向量空间是现代数学的一个重要课题;因而,线性代数被广泛地应用于抽象代数和泛函分析中;通过解析几何,线性代数得以被具体表示。线性代数的理论已被泛化为算子理论。由于科学研究中的非线性模型通常可以被近似为线性模型,使得线性代数被广泛地应用于自然科学和社会科学中。

矩阵分解技术

矩阵分解是一种将矩阵简化为其组成部分的方法。这种方法可以简化更复杂的矩阵运算,这些运算可以在分解的矩阵上执行,而不是在原始矩阵本身上执行。它的衍生Non-negative matrix factorization也被用于降维等操作上。

暂无评论
暂无评论~