Docker安装Presto连接Hive的详细过程

本站所有内容来自互联网收集,仅供学习和交流,请勿用于商业用途。如有侵权、不妥之处,请第一时间联系我们删除!Q群:迪思分享

免费资源网 – https://freexyz.cn/

1、简介

Presto 是一个开源分布式 SQL 查询引擎,用于针对从千兆字节到 PB 级的各种规模的数据源运行交互式分析查询。Presto 允许查询数据所在的位置,包括 Hive、Cassandra、关系数据库甚至专有数据存储。单个 Presto 查询可以组合来自多个来源的数据,从而允许对整个组织进行分析。

2、下载安装

1)下载镜像

docker pull starburstdata/presto

2)下载客户端jar

因为pull下来的镜像是server,是没有presto-cli命令的,所以需要下载presto-cli-0.260.1-executable.jar,然后将下载好的jar包拉入Linux系统中。

下载完成后,run容器:

#端口号为8080,请自行修改,名字为presto docker run -d -p 8080:8080 –name presto starburstdata/presto

将客户端jar包拷贝到容器中的bin目录下:

docker cp [客户端jar包所在的linux路径] [容器名]:/bin

进入到hadoop配置文件目录,将core-site.xml和hdfs-site.xml复制到容器中

cd ${HADOOP_HOME}/etc/hadoop docker cp core-site.xml presto:/usr/lib/presto/etc/ docker cp core-site.xml presto:/usr/lib/presto/etc/

进入容器(以下不标注都是在容器中进行的操作):

#以root用户进入容器,防止没有权限操作文件 docker exec –user=root -it presto /bin/bash

将客户端jar包改名并赋予可执行权限:

cd bin mv presto-cli-0.260.1-executable.jar presto-cli chmod a+x presto-cli

3、配置文件

进入配置文件目录,创建hive配置文件:

cd /usr/lib/presto/etc/catalog vi hive.properties

hive.properties:

#连接名,固定 connector.name=hive-hadoop2 #hive元数据uri,在hive-site.xml里能够找到,请自行修改ip和端口 hive.metastore.uri=thrift://192.168.10.51:9083 #hive配置的资源 core-site.xml和hdfs-site.xml,请根据自己集群中的配置文件路径进行修改,中间用逗号隔开 hive.config.resources=/usr/lib/presto/etc/core-site.xml,/usr/lib/presto/etc/hdfs-site.xml

wq保存退出

重启容器(在linux命令行下):

docker restart presto

4、测试连接

进入容器:

#以root用户进入容器,防止没有权限操作文件 docker exec –user=root -it presto /bin/bash #进入bin目录 cd bin #执行命令行脚本并测试hive连接,连接到hive配置文件,数据库是default ./presto-cli –server localhost:8080 –catalog hive –schema default presto>show tables;
免费资源网 – https://freexyz.cn/


© 版权声明
THE END
★喜欢这篇文章吗?喜欢的话,麻烦动动手指支持一下!★
点赞9 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容