网易首页 > 网易号 > 正文 申请入驻

Spark安装与配置

0
分享至

Spark安装与配置

Apache Spark是一个开源集群运算框架,最初是由加州大学柏克莱分校AMPLab所开发。相对于Hadoop的MapReduce会在运行完工作后将中介资料存放到磁盘中,Spark使用了存储器内运算技术,能在资料尚未写入硬盘时即在存储器内分析运算。Spark在存储器内运行程序的运算速度能做到比Hadoop MapReduce的运算速度快上100倍,即便是运行程序于硬盘时,Spark也能快上10倍速度。Spark允许用户将资料加载至集群存储器,并多次对其进行查询,非常适合用于机器学习算法。

使用Spark需要搭配集群管理员和分布式存储系统。Spark支持独立模式(本地Spark集群)、Hadoop YARN或Apache Mesos的集群管理。在分布式存储方面,Spark可以和 Alluxio, HDFS、 Cassandra、OpenStack Swift和Amazon S3等接口搭载。 Spark也支持伪分布式(pseudo-distributed)本地模式,不过通常只用于开发或测试时以本机文件系统取代分布式存储系统。在这样的情况下,Spark仅在一台机器上使用每个CPU核心运行程序。

在2014年有超过465位贡献者投入Spark开发,让其成为Apache软件基金会以及大数据众多开源项目中最为活跃的项目。

二、安装Spark
1、从官网下载spark-3.0.1

https://www.apache.org/dyn/closer.lua/spark/spark-3.0.1/spark-3.0.1-bin-hadoop2.7.tgz

将安装包上传至Linux系统,这里上传至/root。

2、解压Spark

$ sudo tar -zxf spark-3.0.1-bin-hadoop2.7.tgz

3、配置环境变量

$ vim /etc/profile

写入如下内容

export SPARK_HOME=/root/spark-3.0.1-bin-hadoop2.7

export PATH=$SPARK_HOME/bin

应用环境变量

$ source /etc/profile

4、复制配置文件spark-env并修改

$ cp /root/spark-3.0.1-bin-hadoop2.7/conf/spark-env.sh.template /root/spark-3.0.1-bin-hadoop2.7/conf/spark-env.sh

修改配置文件

$ vim /root/spark-3.0.1-bin-hadoop2.7/conf/spark-env.sh

写入如下内容

export JAVA_HOME=/usr/java/jdk1.8.0_261-amd64

export SPARK_MASTER_IP=localhost

export SPARK_MASTER_PORT=7077

注:JAVA_HOME作为安装服务器java路径。

5、复制配置文件slaves并修改

$ cp /root/spark-3.0.1-bin-hadoop2.7/conf/slaves.template /root/spark-3.0.1-bin-hadoop2.7/conf/slaves

修改配置文件

$ vim /root/spark-3.0.1-bin-hadoop2.7/conf/slaves

写入如下内容,在文件中添加子节点所在位置(Worker节点)

localhost

6、启动Spark

进入Spark的sbin目录下

$ cd /root/spark-3.0.1-bin-hadoop2.7/sbin

启动spark master服务

$ start-master.sh

启动spark slave服务

$ start-slave.sh spark://localhost:7077

查看运行进程情况

$ jps

查看到有Master和Worker进程即为启动成功。

举报

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
当年直播香港回归的4位主持人:2人去世,1人落魄,1人退休......

当年直播香港回归的4位主持人:2人去世,1人落魄,1人退休......

华人星光
2024-12-01 12:24:06
这个两面人,跑不掉了

这个两面人,跑不掉了

毛豆论道
2024-11-30 10:02:58
微软警告:在不符合要求的电脑上运行 Win11 后果自负

微软警告:在不符合要求的电脑上运行 Win11 后果自负

IT之家
2024-12-02 10:00:12
朱棣身边最恐怖的“阴谋家”

朱棣身边最恐怖的“阴谋家”

最爱历史
2024-12-02 11:35:07
港媒:香港餐厅开始学习“内地模式”,成为香港餐饮业一条新出路

港媒:香港餐厅开始学习“内地模式”,成为香港餐饮业一条新出路

环球网资讯
2024-12-03 06:38:57
29名建筑工赴香港打工月薪3万

29名建筑工赴香港打工月薪3万

大象新闻
2024-12-02 22:28:05
史无前例!洛克菲勒国际主席警告:美国市场正酝酿一个超大型泡沫

史无前例!洛克菲勒国际主席警告:美国市场正酝酿一个超大型泡沫

财联社
2024-12-03 17:28:21
抗美援朝战争,志愿军被俘那么多人,为何只有几千余人选择回国?

抗美援朝战争,志愿军被俘那么多人,为何只有几千余人选择回国?

无所而不能
2024-12-02 02:19:30
辽宁榆树村事件:照片曝光,女方是二婚,知情村民透露很多隐情!

辽宁榆树村事件:照片曝光,女方是二婚,知情村民透露很多隐情!

来条娱吃
2024-12-03 18:33:12
真舔不下去了!那个曾赞美、歌颂印度的中国女人,彻底崩溃了!

真舔不下去了!那个曾赞美、歌颂印度的中国女人,彻底崩溃了!

青青子衿
2024-12-03 21:18:09
四维空间:无法解释的玄学,很准,照做,不要问为什么

四维空间:无法解释的玄学,很准,照做,不要问为什么

黄河新流域
2024-12-03 13:07:12
《人民日报》20句堪称封神的句子,句句带着光芒,句句都想收藏

《人民日报》20句堪称封神的句子,句句带着光芒,句句都想收藏

浩源的妈妈
2024-09-09 05:50:59
就在刚刚!首版福建米其林榜单公布!厦门三家餐厅入选一星

就在刚刚!首版福建米其林榜单公布!厦门三家餐厅入选一星

厦门日报
2024-12-03 12:48:51
16站147万奖金,上缴日本乒协,扣除费用,张本智和还剩多少?

16站147万奖金,上缴日本乒协,扣除费用,张本智和还剩多少?

东球弟
2024-12-03 10:06:06
74岁刘晓庆扮嫩惹争议,与48岁李小冉同框显尴尬,合影蹲向太前面

74岁刘晓庆扮嫩惹争议,与48岁李小冉同框显尴尬,合影蹲向太前面

南城无双
2024-12-03 13:53:17
性生活传闻大揭秘:别再被误导啦!

性生活传闻大揭秘:别再被误导啦!

今日养生之道
2024-12-02 17:02:09
两名11岁女孩上学途中失踪后续:已找到!走失原因曝光,家长发声

两名11岁女孩上学途中失踪后续:已找到!走失原因曝光,家长发声

荷兰豆爱健康
2024-12-03 15:42:04
如果不是法媒的披露,我都不敢相信,我国不需再向世界证明什么了

如果不是法媒的披露,我都不敢相信,我国不需再向世界证明什么了

听风者说
2024-12-02 20:39:13
12月3日,工商银行存款利率调整:23万元存三年,收益是多少?

12月3日,工商银行存款利率调整:23万元存三年,收益是多少?

王五说说看
2024-12-03 09:37:24
50万解放军武力统一台湾,马英九:朝鲜战争让台湾有了喘息机会

50万解放军武力统一台湾,马英九:朝鲜战争让台湾有了喘息机会

历史龙元阁
2024-12-01 22:07:37
2024-12-04 05:32:49
读历史学知识
读历史学知识
读历史学知识
44文章数 20关注度
往期回顾 全部

科技要闻

美国芯片慎用!中国四大行业协会发声

头条要闻

韩国最大在野党指责总统涉嫌煽动内乱

头条要闻

韩国最大在野党指责总统涉嫌煽动内乱

体育要闻

特鲁姆普:我还是从前那个少年

娱乐要闻

50岁林志玲生日晒娃引热议

财经要闻

梁建章:建议对生孩子家庭发10万元

汽车要闻

标配Lion5.0科技座舱 风云A8L将于12月17日上市

态度原创

教育
时尚
亲子
健康
军事航空

教育要闻

温州日报作文版作文选登:张芮熙《小猫“七七”》

星N代赶超贵族后裔,巴黎名媛舞会降级了?

亲子要闻

跳跳马玩具真的可以给宝宝安排上

花18万治疗阿尔茨海默病,值不值?

军事要闻

古特雷斯就叙利亚局势发表声明

无障碍浏览 进入关怀版