谁才是机器学习时代最合适的编程语言?

2017-11-16 16:02:27 来源: 36大数据
标签:
开发者到底应该学习哪种编程语言才能获得机器学习数据科学这类工作呢?这是一个非常重要的问题。我们在许多论坛上都有讨论过。现在,我可以提供我自己的答案并解释原因,但我们先看一些数据。毕竟,这是机器学习者和数据科学家应该做的事情:看数据,而不是看观点。
 
让我们看一些数据。我将在Indeed.com上使用趋势搜索。它可以根据时间搜寻实际工作机会中特定的条款。这表明了雇主们正在寻找拥有该技能的人才。然而,请注意,这并不是一项有效使用技能的民意调查。这种指标更能体现技能的受欢迎程度。
 
话不多说,上数据。我搜索了与“机器学习”和“数据科学”一起使用的技能,搜索选项包括编程语言Java、C、C+++和JavaScript。然后还包括了Python和R,因为我们知道它在机器学习和数据科学方面很受欢迎,当然还有Scala,考虑到它与Spark的关系,再加上Julia,一些开发中认为这是“the next big thing”。运行这个查询,我们得到的数据如下:
 
 
当我们关注机器学习时,我们得到了类似的数据:
 
 
我们能从这些数据中得到什么启示呢?
 
首先,我们看到并不是一招通吃。在这种情况下,各种机器学习编程语言都很受欢迎。
 
其次,所有这些编程语言都在急剧增长,反映出在过去几年里,企业对机器学习和数据科学的关注和需求正在急速增加。
 
第三,Python很明显的领导者,其次是Java,然后是R,再然后是C++。Python对Java的领先优势正在增加,而Java在R上的领先地位正在下降。必须承认,我很惊讶地看到Java名列第二;我本来是以为是R语言。
 
第四,Scala的增长令人印象深刻。它在三年前几乎是不存在的,现在和这些成熟的编程语言几乎在同一个层面。当我们切换到Indeed.com上的数据的相对视图时,这更容易发现。
 
 
第五,Julia的受欢迎程度虽然不明显,但肯定有上升的趋势。Julia将成为一种流行机器学习和数据科学编程语言吗?未来会告诉你。
 
如果我们忽略Scala和Julia,以便能够聚焦其他编程语言的增长,那么我们毫无疑问可以确认:Python和R的增长速度要快于通用语言。
 
 
考虑到增长率的差异,R的受欢迎程度可能很快就会超过Java。
 
当我们专注于深度学习这个问题时,数据是完全不同的:
 
 
这时,Python仍然是领导者,但C++现在是第二,然后是Java,而C在第四,R只在第5。这里显然强调了高性能计算语言。Java正在快速发展。它可以很快达到第二名,就像一般的机器学习一样。R不会很快接近顶部。令我惊讶的是Lua的缺席,尽管它在一个主要的深度学习框架(orch)中使用,而Julia不存在。
 
到这时,到底哪种语言才是最受欢迎的编程语言呢?答案应该很清楚了。当涉及到机器学习和数据科学工作时,Python、Java和R是最流行的技能。如果你想专注于深度学习,而不是一般的机器学习,那么,在某种程度上来说C++、C也是值得考虑的。然而,请记住,这只是看待问题的一种方式。如果你想找一份工作,或者你只是想在业余时间学习机器学习和数据科学,你可能会得到不同的答案。
 
我的个人答案呢?除了有许多顶级机器学习框架的支持之外,Python对我来说很适合,因为我有计算机科学的背景。对于开发新的算法,我也会感到很舒服,因为我的大部分职业生涯都是用这种语言编程的。但这就是我,有不同背景的人可能会觉得用另一种语言更好。一个拥有有限编程技能的统计学家肯定会更喜欢R。一个强大的Java开发人员可以使用他最喜欢的语言,因为有大量的Java API的开放源代码。对于这些图表上的任何一种语言,都可以有类似的例子。
 
因此,我的建议是,在花大量时间学习一门语言之前,根据自己的情况来决定选择哪种编程语言,切记千万不可跟风。
 
关注与非网微信 ( ee-focus )
限量版产业观察、行业动态、技术大餐每日推荐
享受快时代的精品慢阅读
 

 

继续阅读
“小声比比”勇捅马蜂窝,揭露互联网背后的江湖险恶

起因是微信上有一篇《估值175亿的马蜂窝,竟是一座僵尸和水军构成的鬼城?》迅速爆红,瞬间炸开了锅。这篇文章主要说的是,利用一些技术手段,并进行了详细的评论对比后,发现了马蜂窝的很多点评都是抄袭自携程、艺龙、美团、Agoda、Yelp等,就此说明马蜂窝的水军数量并不在少数。

中国AI产业链生存状态大观,“智能”下藏着多少“人工”?

有多少“智能”,就有多少“人工”,这位人工智能数据标注创业者的梦想是建一个“富士康”,但希望越来越渺茫

为什么要学习单片机?有多重要?

学习单片机课程与理论课程不一样,不能只做作业,而是要实际使用单片机,下面就如何准备学习单片机的条件和学习步骤简述一些不成熟的想法。

AI要真正落地,还需要哪些推力?

现阶段AI的落地应用成为AI比拼的新赛道,开启了万里长征的第一步。但细究落地的背后含义,其实就是一场将AI触角延伸至B端及C端的过程,而这会走像PC一样的普及之路吗?如果真要让AI普及,还需要哪些“神助攻”?

恩智浦引领边缘设备机器学习

借助恩智浦面向重点应用领域推出的eIQ边缘智能软件环境和可自定义的系统级解决方案,边缘节点开发人员如今可利用数学升级来推动云上机器学习(ML)的历史性发展。

更多资讯
从FPGA到ACAP,“万能芯片” 的华丽转身
从FPGA到ACAP,“万能芯片” 的华丽转身

FPGA被誉为“万能芯片”,能量就只有这么一点?当然不是的,目前FPGA在数据中心领域已经得到认可,加速卡解决方案成为数据中心的首选。而人工智能通过深度学习算法在认知智能和推理智能上遇到难题,擅长推理的FPGA被寄予厚望。

《深度强化学习》手稿开放

一年前,机器之心发布了加拿大阿尔伯塔大学计算机系博士 Yuxi Li 的深度强化学习综述论文,该论文概述了在深度强化学习(Deep Reinforcement Learning)方面喜人的进展。而这本刚上线的《深度强化学习》手稿对前面的版本《深度强化学习综述》做了大规模的改进;从一年多前的 70 页扩充到现在的 150 页。

GICv3架构中,对中断的分组解析

GICv3架构中,对中断进行了分组。分成了以下三个组

想要学好大数据需掌握这十二大技术

大数据是对海量数据进行存储、计算、统计、分析处理的一系列处理手段,处理的数据量通常是TB级,甚至是PB或EB级的数据,这是传统数据处理手段所无法完成的,其涉及的技术有分布式计算、高并发处理、高可用处理、集群、实时性计算等,汇集了当前IT领域热门流行的IT技术。

基于SRAM工艺FPGA的保密性问题

在现代电子系统设计中,由于可编程逻辑器件的卓越性能、灵活方便的可升级特性,而得到了广泛的应用。

Moore8直播课堂