AI科技大本营授权自

15000个Python开源项目中精选Top30!

本文基于项目质量、用户参与度以及其他因素为你列出Python开源项目Top 30。

继推出2017年机器学习开源项目Top 30榜单后,Mybridge AI又推出了一个Python开源项目Top 30榜单,包括开源Python库、工具等。该榜单基于项目质量、用户参与度以及其他几个方面进行了评估,从大约15000个开源项目中挑选了Top 30,差不多都是在2017年1-12月发布。这些项目在Github上的平均star为3707。

No 1:Home-assistant (v0.6+)

基于Python 3的开源家庭自动化平台[Github 11357 stars,由Paulus Schoutsen提供]

https://github.com/home-assistant/home-assistant

No 2:Pytorch

PyTorch是使用GPU和CPU优化的深度学习张量库,基于Python语言编写。[Github 11019 stars,由PyTorch团队的Adam Paszke和其他人提供]

https://github.com/pytorch/pytorch

No 3:Grumpy

Grumpy是一个Python to Go的源代码翻译编译器和运行时,旨在取代CPython 2.7。关键区别在于,Grumpy是将Python源码编译为Go源代码,然后将其编译为native code,而不是bytecode。这也就意味着Grumpy没有虚拟机(VM)。编译好的Go源码是对Grumpy运行时的一系列调用,一个Go库服务于具有相似目的的Python C API。 [Github 8367 stars,由Google的Dylan Trotter及其他工作人员提供]。

https://github.com/google/grumpy

No 4:Sanic

该项目是一个类 Flask 的 Python 3.5+ 网页服务器,专为加速而设计。Sanic支持异步请求处理,意味着你可以使用Python 3.5中一些async/await语法。。[Github 8028 stars,由Channel Cat和Eli Uriegas提供]

https://github.com/channelcat/sanic

No 5:Python-fire

一个可以从任何Python对象自动生成命令行界面(CLI)的库。 [Github 7775 stars,来自Google Brain 的 David Bieber]

https://github.com/channelcat/sanic

No 6:spaCy(v2.0)

该项目是一个使用Python和Cython的进行高级自然语言处理(NLP)的开源库 [Github 7633 stars,由Matthew Honnibal提供]

https://github.com/explosion/spaCy

No 7:Pipenv

Python.org官方推荐的Python打包工具。它会自动为项目创建和管理virtualenv,并在安装/卸载软件包时从Pipfile中添加/删除软件包。 [Github 7273 stars,由Kenneth Reitz提供]

https://github.com/pypa/pipenv

No 8:MicroPython

一个脱胎于Python且非常高效的Python实现,主要是为了能在嵌入式硬件上(这里特指微控制器级别)更简单地实现对底层的操作。[Github 5728 stars]

https://github.com/micropython/micropython

No 9:Prophet

该工具是Facebook开源的一款用于为多周期性的线性或非线性时间序列数据生成高质量预测的工具。[Github 4369 stars,由Facebook提供]

https://github.com/facebook/prophet

No 10:Serpent AI

该项目是一个Python写的游戏代理框架,简单而强大,可帮助开发者创建游戏代理。可将任何视频游戏变成一个Python写成的成熟沙箱环境。该框架的目的是为机器学习和AI研究提供一个有价值的工具,不过对于爱好者来说也是非常有趣的。[Github 3411 stars,由Nicholas Brochu提供]

https://github.com/SerpentAI/SerpentAI

No 11:Dash

Dash是一个纯Python写成的框架,无需JavaScript即可构建交互式的分析类web应用程序。[Github 3281 stars,由Chris P提供]

https://github.com/plotly/dash

No 12:InstaPy

Instagram机器人,喜欢/评论/Follow 自动化脚本。[Github 3179 stars,由TimG提供]。

https://github.com/timgrossmann/InstaPy

No 13:Apistar

专为Python 3定制的Web API框架[Github 3024 stars,Tom Christie提供]。

https://github.com/encode/apistar

No 14:Faiss

用于密集向量的高效相似性搜索库和聚类的库 [GitHub 2717 stars,贡献者Facebook Research]

https://github.com/facebookresearch/faiss

No 15:MechanicalSoup

一个与网站自动交互的Python库,自动存储和发送cookies,支持重定向,并可以跟踪链接和提交表格。[Github 2244 stars]

https://github.com/MechanicalSoup/MechanicalSoup

No 16:Better-exceptions

该项目以更友好的形式展示Python中的异常信息。[Github 2121 stars,贡献者Qix]

https://github.com/Qix-/better-exceptions

No 17:Flashtext

该项目基于FlashText算法,用以高效搜索句子中的关键词并进行替代。[Github 2019 stars,由Vikash Singh提供]。

https://github.com/vi3k6i5/flashtext

No 18:Maya

在不同系统上的不同语言环境中,Python对日期时间的处理非常不畅,Maya主要就是为了解决解析网站时间数据问题。[Github 1828 stars,Kenneth Reitz提供]

https://github.com/kennethreitz/maya

No 19:Mimesis

是一个快速易用的Python库,可以用不同语言为基于不同的目的生成合成数据。这些数据在软件开发和测试阶段非常有用。[Github 1732 stars,由LíkieGeimfari提供]

https://github.com/lk-geimfari/mimesis

No 20:Open-paperless

该项目是一个一个文件管理系统,可扫描、索引和归档所有纸张文档。[Github 1717 stars,由Tina Zhou提供]

https://github.com/zhoubear/open-paperless

No 21:Fsociety

黑客工具包,渗透测试框架。[Github 1585 stars,Manis Manisso提供]

No 22:LivePython

Python代码实时可视化跟踪。[Github 1577 stars,由Anastasis Germanidis提供]

https://github.com/agermanidis/livepython

No 23:Hatch

一个Python项目、包以及虚拟环境的管理工具。[Github 1537 stars,由Ofek Lev提供]

https://github.com/ofek/hatch

No 24:Tangent

该项目是谷歌开源的一个用于自动微分的源到源纯Python库。[Github 1433 stars,来自Google Brain的Alex Wiltschko以及其他人]。

https://github.com/google/tangent

No 25:Clairvoyant

一个Python程序,用于识别和监控短期库存移动的历史线索[Github 1159 stars,由Anthony Federico提供]。

https://github.com/anfederico/Clairvoyant

No 26:MonkeyType

该项目是Instagram开源的一款适用于Python的工具,通过收集运行时类型来生成静态类型注释。[Github 1137 stars,由Instagram工程师Carl Meyer提供]。

https://github.com/Instagram/MonkeyType

No 27:Eel

该项目是一个小型Python库,用于制作简单的类似 Electron的离线HTML/JS GUI应用程序,当前仅支持Python3。 [Github 1137 stars]

https://github.com/ChrisKnott/Eel

No 28:Surprise v1.0

用于构建和分析推荐系统的Python scikit  [Github 1103 stars]

https://github.com/NicolasHug/Surprise

No 29:Gain

Web爬虫框架。[Github 1009 stars,由高久力提供]

https://github.com/gaojiuli/gain

No 30:PDFTabExtract

一组用于从PDF文件中提取表格的工具,有助于在扫描的文档上进行数据挖掘。 [Github 722 stars]

https://github.com/WZBSocialScienceCenter/pdftabextract

原文地址:

https://medium.mybridge.co/30-amazing-python-projects-for-the-past-year-v-2018-9c310b04cdb3

THU数据派
THU数据派

THU数据派"基于清华,放眼世界",以扎实的理工功底闯荡“数据江湖”。发布全球大数据资讯,定期组织线下活动,分享前沿产业动态。了解清华大数据,敬请关注姐妹号“数据派THU”。

工程深度学习机器学习Python
4
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

张量技术

张量是一个可用来表示在一些矢量、标量和其他张量之间的线性关系的多线性函数,这些线性关系的基本例子有内积、外积、线性映射以及笛卡儿积。其坐标在 维空间内,有 个分量的一种量,其中每个分量都是坐标的函数,而在坐标变换时,这些分量也依照某些规则作线性变换。称为该张量的秩或阶(与矩阵的秩和阶均无关系)。 在数学里,张量是一种几何实体,或者说广义上的“数量”。张量概念包括标量、矢量和线性算子。张量可以用坐标系统来表达,记作标量的数组,但它是定义为“不依赖于参照系的选择的”。张量在物理和工程学中很重要。例如在扩散张量成像中,表达器官对于水的在各个方向的微分透性的张量可以用来产生大脑的扫描图。工程上最重要的例子可能就是应力张量和应变张量了,它们都是二阶张量,对于一般线性材料他们之间的关系由一个四阶弹性张量来决定。

推荐系统技术

推荐系统(RS)主要是指应用协同智能(collaborative intelligence)做推荐的技术。推荐系统的两大主流类型是基于内容的推荐系统和协同过滤(Collaborative Filtering)。另外还有基于知识的推荐系统(包括基于本体和基于案例的推荐系统)是一类特殊的推荐系统,这类系统更加注重知识表征和推理。

数据挖掘技术

数据挖掘(英语:data mining)是一个跨学科的计算机科学分支 它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的数据集中发现模式的计算过程。 数据挖掘过程的总体目标是从一个数据集中提取信息,并将其转换成可理解的结构,以进一步使用。

家庭自动化技术

家庭自动化系指利用微处理电子技术,来集成或控制家中的电子电器产品或系统,例如:照明灯、咖啡炉、电脑设备、保安系统、暖气及冷气系统、视讯及音响系统等。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

聚类技术

将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。聚类分析起源于分类学,但是聚类不等于分类。聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。

推荐文章
暂无评论
暂无评论~