Livy概述
Livy是Apache Spark的一个REST服务,通过Livy,可以实现在任意的平台上通过Http请求提交Spark任务。
- 通过livy提交的spark任务,对原始的spark脚本没有任何入侵
- livy支持多用户、多任务并行的和spark集群进行交互
- 可以在python、scala、java中通过livy进行spark批任务的处理
Livy部署
Livy的部署只需要在spark集群的master节点上进行部署即可。
这里默认依赖的spark和hadoop都已经就位,并不需要从头安装。
下载livy
修改配置文件
修改livy.conf
需要调整的基础信息如下:
修改livy-env.sh
需要调整的基础信息如下:
启动Livy
Livy使用
livy默认的接口为8998, 在配置文件没有显式的声明其他端口的时候,可以直接向当前的端口提交任务。
通过上述命令提交后,返回如下,会包含生成的livy-session的id。