择的编程语言,但它正在迅速地让位给Python。最大原因是:Python更通用且相对容易学习,而R需要掌握复杂的编程环境。
R:不是真正的语言
人们学习R很困难的一部分原因是,它并不是一种真正的编程语言。John
Cook是一位R专家,他曾说:“R是一个做统计的交互环境,不是一种真正的编程语言。把R看做包含有编程语言的交互环境会更有帮助。”
但正如BobMuenchen强调的,R甚至对于那些精通SAS和SPSS数据统计工具的人来说都是困难的。关于R为分析师降低了复杂性的问题,还有待争议,虽然R包含宏和矩阵语言,此外,你还需要掌握像SPSS等工具。但是对于那些期待R去实现类似Stata的功能的人,他们注定要失望。
综合考虑,R的与众不同使它较难学习。
Python降低数据科学技术壁垒
然而,Python更加平易近人。一方面,各种各样的开发人员都熟悉Python并在广泛的应用领域使用它。不像R几乎只用于数据分析,一个开发人员在第一次编写他的网站脚本或其他应用程序时,就可以体验到Python。
随着企业竭尽所能地使用数据,他们也正在努力寻找合格的数据科学家。然而,正如Gartner的SvetlanaSicular所假设的,在本公司内对员工培训一些简单的大数据技术,比培训新雇佣的数据科学家复杂的商业知识更有效率。
Python”所向披靡“
但是,除了可以利用现成的Python开发者资源,用Python语言做数据科学的最大好处之一是:在不同的应用程序中使用一种编程语言所增加的效率。德克萨斯大学奥斯汀分校研究助理TalYarkoni解释说:“事实证明,使用一种语言来做所有的开发和分析的好处是相当可观的。一方面,当你可以用同一种语言做所有的事情的时候,你就不必一直提醒自己:Ruby使用blocks而不是comprehensions,在Python中得到数组的大小应当调用len(array),而不是array.length……
另外,你不需要再担心项目的不同模块采用不同语言的接口问题。没有什么比在Python中解析一些文本数据,然后将它转换成内部使用所需要的格式,最后才发现必须将它以另一种格式写到磁盘上,以便R或者MATLAB去做分析更烦人的了。只要使用单一的语言,所有这些开销都将消失。”
我们可以夸赞某个技术完美地解决了一个问题,但往往胜出的技术是解决一系列问题的通用工具。正如AppNexus优化和分析主管DavidHimrod指出:“AppNexus面临的最大挑战之一是如何让不同的员工使用相同的技术来工作。Python为具有不同背景的员工(尤其是工程师,数学家和分析师)提供了一种常见的、容易理解的语言,可用于公司将新功能进行标准化。”
使用Python的主流数据科学
相比R丰富的数据分析能力,Python尚有很多不足,但是它正在迅速的缩小差距。请记住:Python成功的关键并不是它比R或其他分析工具能够处理更神秘的功能,而在于它的平易近人和通用的性质。数据科学正在走出头号怪胎的领域,上个月在纽约举行的O'Reilly's Strata会议这一点尤为明显:过去的与会者多是学术领域的博士,现在则是关键的业务分析师和其他被企业要求去弄清楚大数据业务的人。
相比R,这种新的,早期的“数据科学家”,将更多地使用Python。Python使用起来相对简单,而且他们可能已经将其用于一个项目中了。至于在其他市场,相比于那些功能强大但复杂的工具,熟悉或者容易学习的工具更容易取胜。
分享到:
相关推荐
Python培训之Python超过R,成为数据科学和机器学习的最常用语言.docx
Python数据科学速查表 - Bokeh Python数据科学速查表 - Jupyter Notebook Python数据科学速查表 - Keras Python数据科学速查表 - Matplotlib 绘图 Python数据科学速查表 - Numpy 基础 Python数据科学速查表 - Pandas...
python数据科学手册PDF+源代码,非常好的学习数据科学的资料,建议下载学习。
数据科学导论_Python语言实现_数据科学与工程技术丛书,epub电子书。
Python数据科学手册--.pdf
朝乐门-Python编程从数据分析到数据科学 上课时老师给的一些教程 跟大数据分析方向有关的 着呢分享一下,希望能有所帮助
《python数据科学指南》的源代码,本书从讲解如何在数据科学中应用Python开始,陆续介绍了Python的工作环境,如何用Python分析数据,以及数据挖掘的概念,然后又扩展到机器学习。本书还涵盖了缩减原则、集成方法、...
数据科学Python语言实战.pdf数据科学Python语言实战.pdf数据科学Python语言实战.pdf数据科学Python语言实战.pdf数据科学Python语言实战.pdf
[图灵程序设计丛书].Python数据科学手册
涵盖基础知识、爬虫采集、数据处理、可视化、数据建模,难得一见的Python体系全面数据科学课程,起步之路有高度;精品质量。课程设计环节紧凑,循循善诱;课堂教学如行云流水,让人受益匪浅 第一章:Python与数据...
本书共五章,每章介绍一到两个Python数据科学中的重点工具包。首先从IPython和Jupyter开始,它们提供了数据科学家需要的计算环境;第2章讲解能提供ndarray对象的NumPy,它可以用Python高效地存储和操作大型数组;第3...
“Python数据科学手册”Jupyter笔记,晋升 Python 数据科学家之路
【数据分析应用】Python数据科学实践-(附代码+数据).zip
数据科学实践的入门手册,通过R和python的学习,可以慢慢逐步的了解数据科学,成为数据科学家
免费,超级有用的速查表,内容清晰明了,值得反复翻阅,总共十四张。我将他们汇总成了一个pdf文件,方便查阅~
python数据科学手册-思维导图。IPython 和 Jupyter(第 1 章) 这两个程序包为许多使用 Python 的数据科学家提供了计算环境。 NumPy(第 2 章) 这个程序库提供了 ndarray 对象,可以用 Python 高效地存储和操 ...
《Python科学计算与数据处理》课报告要求.docx《Python科学计算与数据处理》课报告要求.docx《Python科学计算与数据处理》课报告要求.docx《Python科学计算与数据处理》课报告要求.docx《Python科学计算与数据处理》...
pdf Python是一种跨平台的计算机程序设计语言。 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。最初被设计用于编写自动化脚本(shell)
数据科学导论Python语言实现