Spark SQL 到底咋搭建起来把Spark二进

把Spark二进制包下载并解压到某一台*nux的机器上，这段代码中‘/Users/jilu/Downloads/’这段换成你自己的路径，这就是单机执行SparkSQL的代码，在这个程序中，我已经创建好sqlContext了，以后的部分就是SparkSQL教程了。这是我更新完1.3版之后新改的程序，不出意外1.X的版本都是这样用的。PS：补充一下这个是Python API，不是Scala的。import osimport sysimport traceback# Path for spark source folderos.environ="/Users/jilu/Downloads/spark-1.3.0-bin-hadoop2.4"# Append pyspark to Python Pathsys.path.append("/Users/jilu/Downloads/spark-1.3.0-bin-hadoop2.4/python/")sys.path.append("/Users/jilu/Downloads/spark-1.3.0-bin-hadoop2.4/python/lib/py4j-0.8.2.1-src.zip")# try to import needed modelstry: from pyspark import SparkContextfrom pyspark import SparkConffrom pyspark.sql import SQLContext, Rowprint ("Successfully imported Spark Modules")except ImportError as e: print ("Can not import Spark Modules {}".format(traceback.format_exc())) sys.exit(1)# config spark envconf = SparkConf().setAppName("myApp").setMaster("local")sc = SparkContext(conf=conf)sqlContext = SQLContext(sc)
■网友
想快速建立一个hadoop+spark的环境，你可以直接装cloudera 的 CDH。他们把上面一切都很好的整合在一起了。如果还想更简单一点，装一个cloudera 的quickstart 虚拟机， Cloudera QuickStart VM。一个虚拟机，什么都有了。
■网友
vm问题是太损性能如果集群要nb的机器＊＊＊测试环境用docker好些机器损耗小普通macmini都可以搭出hadoop／spark最小三节点集群参考使用docker打造spark集群＊＊＊生产环境未来生产环境部署hadoop／spark到物理机应该情景不多多是云端的大数据处理paas例如azure的hdinsight（当然云端也可以用docker）节省成本少维护少硬件损耗（aws azure的数据流入流量都是不计费的）尽快上算法／应用才是王道spark在aws上已经能做到1tb数据－》1rmb成本了基本大数据的运算量12tb 的spark运算成本是12rmb（节点无限伸缩）按照这个成本自建hadoop／spark集群的硬件意义不大（这个百节点要上百万还有维护损耗顶级国安或者军事金融部门的需求另说当然如果有采购贪污需求的也另说其它行业正经做事不用云处理大数据是傻蛋）问题是大数据的场景何在 weblog 达到12tb／天的网站中国过不去10家嘿嘿
■网友
建议搜索顺序应该是：1、怎么搭建hadoop？2、怎么搭建hive？3、hive和mysql怎么互通？4、怎么安装scala？5、怎么搭建spark？6、怎么使用spark sql？循序渐进的话，版本坑的问题可以跳过很多。spark sql本来就算是hadoop生态系统里最顶层的了，路还得一步一步走。
■网友
楼上说的很对啊，你知道一个名词叫cdh就行了，去搭建这个呀，这不就简单了。
■网友
SparkSQL就是Spark的一个模块，只要成功安装了Hadoop和Spark，最后开发的时候在pom文件里加上SparkSQL的依赖，并且在代码里引SparkSQL的包就行了，所以关键还是搭Hadoop和Spark的集群，Hadoop2.6.0（现在已经出到2.7了）和Spark1.3.1的搭建教程网上都可以找到，照着教程一步步做就行了

Spark SQL 到底咋搭建起来

推荐阅读

白泽兽图片?白泽神兽五行属什么?

奥迪R8全新车型中国首秀杀入市场，或触发超跑市场新一轮竞争

「乐枋文化」千万不要正面撞上，吵架时火力全开的星座

占星的少女|也从不主动攻击他人的3个星座，即使内心再生气

【农村小王爱吃鬼】素饺子做法集锦

每日科学■会变更好看？马斯克透露或对电动皮卡外观进行调整

数据安全|李佳琦方回应数据造假:将追究造谣者法律责任

「佳作有约」让你下你就下，信不？说个笑话也生气，开电梯的，我让你上你就上

冬天生姜怎样储存不会烂

和德国老公在中国领了结婚证，如果没领德国的结婚证，对我们有影响吗

NIODay 2020 媒体采访李斌回应了关于蔚来的部分问题

九游网|《元气众生录》宝石攻略职业宝石搭配推荐

【真实真心姐姐】这些坏习惯，容易加快皮肤衰老，夏天

ar导航和普通导航哪个更费流量 ar实景导航收费吗

#余文林整形博士#造一个耳朵，需要取多少条肋软骨？

磊磊趣闻@老丈人说：我家有规矩，吃饭时不能说话，笑话：第一次去nv友家

牛油果的正确吃法图片;牛油果怎么吃最好？

巴菲特的弟弟|沪指30年首次大修订：剔除ST，引入科创板！，股市又一利好!

「防控」广州市各区新型冠状病毒肺炎疫情防控分区分级情况

红尖椒文化|让少奶奶李纨，输给了丫头袭人，贾府中的咄咄怪事：两场宴席