搞大数据必须得学java吗( 四 )


Java在大数据开发中的应用
Java,以及基于Java的框架,被发现俨然成为了硅谷最大的那些高科技公司的骨骼支架。 “如果你去看Twitter,LinkedIn和Facebook,那么你会发现,Java是它们所有数据工程基础设施的基础语言,”Driscoll说。
Java不能提供R和Python同样质量的可视化,并且它并非统计建模的最佳选择。但是,如果你移动到过去的原型制作并需要建立大型系统,那么Java往往是你的最佳选择。

■网友
Java语言产生于1995年,距今已经20多年了。相信很多朋友对Java都不陌生,Java作为一个纯粹的面向对象的语言,不论是在Web开发还是企业级应用中,都占有很大的市场份额。很多朋友也已经用Java做开发很多年了,早已成了老朋友。
那么我们再来看看大数据:大数据是近几年非常热门的一个话题。所谓大数据,那首先数据量上很大,现在的数据量很容易就达到了TB级,甚至PB级。大家想想现在的购物节就很容易理解,现在我们缺少的再也不是数据,而是如何从这海量的数据中挖掘出有用的信息,从而有效地支撑企业领导者做出决策或提高用户的体验度。这也正是我们大数据所要研究的内容。
那么Java和大数据有什么关系呢?
如果您对大数据有所了解,可能知道,现在的大多数大数据平台,支持的语言实际上除了Java,还支持Python,Scala或R语言。既然支持这么多语言。为什么单独把Java拿出来呢?之所以把Java拿出来,是因为很多朋友对Java都已经非常熟悉了,想告诉大家的就是这样的朋友想转行大数据其实是很容易的,这是其一。第二是,即便您原先没接触过Java,Java也是很容易上手的一门语言,很亲民哦。第三是,Java虽然流行这么多年了,但从来没有停止过前进的步伐。北京时间2019年3月12号,Java12正式发布了,官方列出了8个新特性,这说明Java不但没有落伍,而是越来越优秀了。
第四个给大家推荐Java的理由,也是我要重点介绍的。提到大数据技术,我们首先想到的就是Hadoop。Hadoop中主要有两块内容,一个是分布式存储HDFS,一个是离线计算MapReduce。MapReduce提供了丰富的Java API,并且只支持Java。另外,现在流行的大数据技术Spark,支持多种语言,其中一种就是Java。并且Spark支持的另外一种语言Scala,也是运行在Java虚拟机JVM之上。Scala可以和Java无缝混编,可以在任何地方调用Java类中提供的方法。Flink技术同样支持Java。
Java作为一个门槛很低,容易上手,又被众多大数据技术所支持的语言,我们有什么理由不选择它呢?
如果原先您没有接触过Java,那么我们可以先学习JavaSE,就是Java基础。这里会涉及到最基础的变量、语句以及一些高级特性,如集合框架、IO流、多线程等等。接下来我们就可以学习Java Web开发了,这里有HTML,jsp,servlet等技术。如果我们给自己定位的是大数据研发,Java学到这里就可以了。后面就可以进入大数据领域的学习了。

■网友
必须用,其他语言欠缺的太多了。


推荐阅读