Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

Claire D作者李诗萌、蛋酱编译

选Python还是选Java?2020年,顶尖程序员最应该掌握的7种编程语言


哪种编程语言最好?这个问题可能永远不会有答案。萝卜白菜,各有所爱,AI 工程师和科学家可以根据项目需要,从众多编程语言中选择最适合自己的。

有人曾经将编程比作做菜,那编程语言就是首先要准备的食材或厨具。

C:一把菜刀一口炒锅,一个很好用的灶,隔壁有个菜市场。

Java:碎菜器,切菜机,绞肉机,和面机,烤箱,微波炉……

Python:大超市的速冻柜台,要成品有成品,要半成品有半成品,什么都有。它能让你快速获得一桌还能吃的饭,但是深究口味火候什么的不那么容易。

C++:一套顶级厨具,光刀就十几把,切肉的切片的雕花的;锅有爆炒的闷烧的平底煎肉的煎蛋的炖汤的……有人试图用二十一天掌握这套工具的用法,结果往往是玩刀伤了自己,或者是炸了厨房。

选自知乎用户:https://www.zhihu.com/question/284549387/answer/451018336


尽管在刚开始开发 AI 时,有很多编程语言都可以满足你的需求,但没有一种编程语言是可以一站式解决 AI 编程的问题,因为在每一个项目中,不同的目标需要特定的方法。

和做菜时的精挑细选一样,在成为一个「高手」的过程中,我们要学会的是找到最适合自己的编程语言。

Python

Python 是可读的最强大的语言。—Pau Dubois


Python 编程。图源:Unsplash。

Python 开发于 1991 年,一项民意调查表明,在开发 AI 时,超过 57% 的开发者将 Python 作为首选编程语言,而不是 C++。因为易于学习,Python 让程序员和数据科学家可以更轻松地进入开发 AI 的世界。

Python 是一个程序员需要多少自由度的「实验」。太自由,没人可以读懂别人的代码;太不自由,就会没那么强的表现力。—Guido van Rossum


使用 Python,你不仅可以获得优秀的社区支持和广泛的库集,还能享受到其灵活性。你从 Python 中得到的最大的好处可能是平台独立性和针对深度学习机器学习的广泛框架。

用 Python 编码的乐趣在于可以看到短小精悍、可读性高的类,这些类可以用少量清晰的代码表达大量行为(而不是用大量代码烦死读者)。——Guido van Rossum


Python 代码片段示例:

Python 代码段落示例。

常用的库

  • TensorFlow——用于机器学习工作负载和用数据集处理;

  • scikit-learn——训练机器学习模型;

  • PyTorch——计算机视觉自然语言处理

  • Keras——高度复杂性的数学计算和操作的代码接口;

  • SparkMLib——类似 Apache Spark机器学习库,通过算法和实用程序等工具,让每一个人都能轻松地进行机器学习

  • MXNet——Apache 的另一个库,可以简化深度学习流程;

  • Theano——定义、优化和评价数学表达式的库;

  • Pybrain——用于强大的机器学习算法。


另外,根据 GitHub 库的贡献度,Python 已经超越了 Java,成为世界第二受欢迎的语言。Stack Overflow 将 Python 称为「成长最快」的主流编程语言。


Python 入门课程

  • 《三门免费的 Python 入门课程:2020 版》


课程链接:https://hackernoon.com/3-free-python-courses-for-beginners-2020-edition-j7c23y3u

  • 《完整 Python 训练营:用 Python 3 从小白到大师》


课程链接:https://www.udemy.com/course/complete-python-bootcamp/?LSNPUBID=JVFxdTr9V80&ranEAID=JVFxdTr9V80&ranMID=39197&ranSiteID=JVFxdTr9V80-lB6TwxSdouentAk36.qjmw

Java

编写一次,随时运行。


Java 被公认为世界上最好的编程语言之一,它在过去 20 年间的使用情况就是最好的证明。

凭借其用户友好度、灵活的特性以及平台独立性,Java 以各种方式参与到了 AI 的开发中,比如:

  • TensorFlow——TensorFlow 支持的编程语言中也列出了带有 API 的 Java。虽然不像其他完全支持的语言那样功能丰富,但确实支持 Java,并且在迅速地改进。

  • Deep Java Library(深度 Java 库)——亚马逊开发的、用 Java 来创建并部署深度学习能力的库。

  • Kubeflow——Kubeflow 使在 Kubernetes 上部署和管理机器学习堆栈更容易,还提供了现成的 ML 解决方案。

  • OpenNLP——Apache 的 OpenNLP 是用于自然语言处理机器学习工具。

  • Java Machine Learning Library(Java 机器学习库)——Java-ML 为开发者提供了多种机器学习算法。

  • Neuroph——Neuroph 借助 Neuroph GUI,利用 Java 开源框架设计了神经网络


如果 Java 可以垃圾回收,大多数程序都会在执行时删除自己。——Robert Sewell


Java 代码片段示例:

Java 代码段示例。

Java 入门课程

  • 《五大在线 Java 编程入门课程——最好的》


课程链接:https://javarevisited.blogspot.com/2018/05/top-5-java-courses-for-beginners-to-learn-online.html

R

Ross Ihaka 和 Robert Gentleman 在 1995 年发布了第一版 R 语言。现在由 R 开发核心队伍维护,R 是 S 编程语言的实现,用于统计软件的开发和数据的分析。

R 的基础特征是善于处理大量数据,相比 Python 中不够完善的 NumPy 包,R 是更好的选择;你可以用 R 处理各种不同的编程范式,比如函数式编程、矢量计算和面向对象编程等。

R 适用的 AI 编程包:

  • Gmodels——提供了一系列拟合模型用的工具;

  • Tm——文本挖掘应用的框架;

  • RODBC——R 的 ODBC 接口;

  • OneR——用来实现单规则机器学习分类算法,适用于机器学习模型。


数据挖掘者和统计学家中,广泛使用的 R 的功能有:

  • 多种用于扩展功能的库和包;

  • 活跃的支持社区;

  • 能和 C、C++ 和 Fortran 协同工作;

  • 多个有助于扩展功能的包;

  • 支持生成高质量的图形。


Prolog

逻辑编程(Logic Programming)的简称。Prolog 最早出现在 1972 年,适用于开发人工智能,尤其是自然语言处理Prolog 最适合创建聊天机器人,ELIZA 是有史以来第一个用 Prolog 创建的聊天机器人
第一个成功的聊天机器人

为了理解 Prolog,你必须熟悉一些指导 Prolog 工作的基本术语:
  • 事实(Fact)定义了正确的陈述;

  • 规则(Rule)定义了有附加条件的陈述;

  • 目标(Goal)根据知识库定义了提交陈述的位置;

  • 查询(Query)定义了如何使你的陈述正确,以及对事实和规则的最终分析。

Prolog 提供了两种实现 AI 的方法,这两种方法已经实现很久了,并且在数据科学家和研究人员中广为人知:
  • 符号方法包括基于规则的专家系统、定理证明和基于约束的方法;

  • 统计方法包括神经网络数据挖掘机器学习以及其他方法。

Lisp
用 Lisp 编码创建有 n 个输入 m 个单元的一层感知机。

列表处理(List Processing)的简称。这是继 Fortran 后第二古老的编程语言。也被称作 AI 的奠基语言之一,由 John McCarthy 与 1958 年创建。

Lisp 是用来实现不可能的语言。——Kent Pitman
Lisp 是可以编程的实用数学符号,很快就成为了开发人员首选的 AI 编程语言。Lisp 因为其特有的功能,成为机器学习 AI 项目的最佳选择之一:
  • 快速创建原型;

  • 创建动态对象;

  • 垃圾回收;

  • 灵活性。

随着其他竞争的编程语言的重大改进,其他语言集成了 Lisp 特有的一些功能。涉及到 Lisp 的著名项目有 Reddit 和 HackerNews。

说到 Lisp,这是世界上最美的语言——至少在 Haskell 出现之前是这样。——Larry Wall

Haskell

Haskell 创建于 1990 年,以著名数学家 Haskell Brooks Curry 的名字命名。Haskell 是纯粹的函数式和静态类型的编程语言,与惰性计算和短代码配合使用。

Haskell 是一种非常安全的编程语言,因为和其他编程语言相比,Haskell 很少出现错误,所以在处理错误方面提供了更大的灵活性。即便发生了错误,也可以在编译(而非运行)时捕获大多数非语法错误。Haskell 提供的功能包括:
  • 强大的抽象能力;

  • 内置的内存管理;

  • 代码的可重用性;

  • 易于理解。

SQL、Lisp 和 Haskell 是我所见过的唯一可以把时间花在思考而不是打字上的编程语言。——Philip Greenspun

Haskell 的功能有助于提高程序员的生产率。Haskell 与其他编程语言非常相似,但只有一小部分开发人员使用。撇开挑战不谈,随着开发者社区使用率的增加,可以证明 Haskell 和其他用于 AI 的竞争语言一样出色。

Julia

Julia 是一种高性能的通用动态编程语言,可以创建几乎任何应用,但最适合进行数值分析和计算科学。和 Julia 一起使用的工具还包括:

  • 像 Vim 和 Emacs 这样流行的编辑器;

  • 像 Juno 和 Visual Studio 这样的 IDE。

Julia 源代码组织。

Julia 中有一些功能使其成为 AI 编程、机器学习、统计和数据建模的重要选择,这些功能有:

  • 动态类型系统;

  • 内置的包管理器;

  • 能够进行并行和分布式计算;

  • 宏和元编程能力;

  • 支持多分派;

  • 直接支持 C 函数。


Julia 是为了消除其他编程语言的弱点而构建的,和其他工具(如 TensorFlow.jl、MLBase.jl 和 MXNet.jl)集成后还可以用于机器学习,利用 Julia 的可伸缩性还可以做更多事。

谷歌趋势——Julia 的使用趋势。

总结

AI 工程师和科学家可以根据项目的需求,从多种编程语言中进行选择。每一种 AI 编程语言都有优缺点。随着这些语言的不断改进,AI 开发很快就可以有更舒适的体验,这样就会有更多人加入这一创新浪潮。出色的社区支持使新人们可以更好地工作,社区对包和扩展的贡献让每个人的工作都变得更加轻松。

参考链接:
https://towardsdatascience.com/top-programming-languages-for-ai-engineers-in-2020-33a9f16a80b0

工程PythonJava编程语言程序员
1
相关数据
Amazon机构

亚马逊(英语:Amazon.com Inc.,NASDAQ:AMZN)是一家总部位于美国西雅图的跨国电子商务企业,业务起始于线上书店,不久之后商品走向多元化。目前是全球最大的互联网线上零售商之一,也是美国《财富》杂志2016年评选的全球最大500家公司的排行榜中的第44名。

https://www.amazon.com/
相关技术
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

专家系统技术

专家系统(ES)是人工智能最活跃和最广泛的领域之一。专家系统定义为:使用人类专家推理的计算机模型来处理现实世界中需要专家作出解释的复杂问题,并得出与专家相同的结论。简言之,如图1所示,专家系统可视作“知识库(knowledge base)”和“推理机(inference machine)” 的结合。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

Julia技术

Julia 是MIT设计的一个面向科学计算的高性能动态高级程序设计语言,项目大约于2009年中开始,2018年8月JuliaCon2018 发布会上发布Julia 1.0。据介绍,Julia 目前下载量已经达到了 200 万次,且 Julia 社区开发了超过 1900 多个扩展包。这些扩展包包含各种各样的数学库、数学运算工具和用于通用计算的库。除此之外,Julia 语言还可以轻松使用 Python、R、C/C++ 和 Java 中的库,这极大地扩展了 Julia 语言的使用范围。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

数据科学技术

数据科学,又称资料科学,是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。

Apache Spark技术

Apache Spark是一款快速、灵活且对开发者友好的工具,也是大型SQL、批处理、流处理和机器学习的领先平台。它是一个围绕速度、易用性和复杂分析构建的大数据处理框架,提供了一个全面、统一的框架用于管理各种不同性质(文本数据、图表数据等)数据集和数据源(批量数据或实时的流数据)的大数据处理的需求。

TensorFlow技术

TensorFlow是一个开源软件库,用于各种感知和语言理解任务的机器学习。目前被50个团队用于研究和生产许多Google商业产品,如语音识别、Gmail、Google 相册和搜索,其中许多产品曾使用过其前任软件DistBelief。

知识库技术

知识库是用于知识管理的一种特殊的数据库,以便于有关领域知识的采集、整理以及提取。知识库中的知识源于领域专家,它是求解问题所需领域知识的集合,包括基本事实、规则和其它有关信息。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

数据挖掘技术

数据挖掘(英语:data mining)是一个跨学科的计算机科学分支 它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的数据集中发现模式的计算过程。 数据挖掘过程的总体目标是从一个数据集中提取信息,并将其转换成可理解的结构,以进一步使用。

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

Prolog技术

Prolog是一种逻辑编程语言。它创建在逻辑学的理论基础之上, 最初被运用于自然语言等研究领域。现在它已广泛的应用在人工智能的研究中,它可以用来建造专家系统、自然语言理解、智能知识库等。

逻辑编程技术

逻辑编程是种编程范型,它设置答案须匹配的规则来解决问题,而非设置步骤来解决问题。过程是 事实+规则=结果。 不同的方法,可以看Inductive logic programming。 逻辑编程的要点是将正规的逻辑风格带入计算机程序设计之中。数学家和哲学家发现逻辑是有效的理论分析工具。

聊天机器人技术

聊天机器人是经由对话或文字进行交谈的计算机程序。能够模拟人类对话,通过图灵测试。 聊天机器人可用于实用的目的,如客户服务或资讯获取。有些聊天机器人会搭载自然语言处理系统,但大多简单的系统只会撷取输入的关键字,再从数据库中找寻最合适的应答句。

查询技术

一般来说,查询是询问的一种形式。它在不同的学科里涵义有所不同。在信息检索领域,查询指的是数据库和信息系统对信息检索的精确要求

MXNet技术

MXNet是开源的,用来训练部署深层神经网络的深度学习框架。它是可扩展的,允许快速模型训练,并灵活支持多种语言(C ++,Python,Julia,Matlab,JavaScript, Go,R,Scala,Perl,Wolfram语言)

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

文本挖掘技术

文本挖掘有时也被称为文字探勘、文本数据挖掘等,大致相当于文字分析,一般指文本处理过程中产生高质量的信息。高质量的信息通常通过分类和预测来产生,如模式识别。文本挖掘通常涉及输入文本的处理过程,产生结构化数据,并最终评价和解释输出。'高品质'的文本挖掘通常是指某种组合的相关性,新颖性和趣味性。

知乎机构

知乎,中文互联网综合性内容平台,自 2010 年成立以来,知乎凭借认真、专业、友善的社区氛围,独特的产品机制,以及结构化、易获得的优质内容,聚集了中文互联网科技、商业、影视、时尚、文化等领域最具创造力的人群,已成为综合性、全品类,在诸多领域具有关键影响力的内容平台。知乎将AI广泛应用与社区,构建了人、内容之间的多元连接,提升了社区的运转效率和用户体验。知乎通过内容生产、分发,社区治理等领域的AI应用,也创造了独有的技术优势和社区AI创新样本。

zhihu.com
合合信息机构
推荐文章
暂无评论
暂无评论~