news 2026/2/7 6:58:58

<span class=“js_title_inner“>Apache Hadoop生态组件部署分享-zookeeper</span>

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
<span class=“js_title_inner“>Apache Hadoop生态组件部署分享-zookeeper</span>

前言

随着国产化信创的推进,cloudera产品逐渐被国产大数据平台替换,从一个运维角度来说其实是不太愿意看到这种情况,虽说底层都是hadoop那一套,但是各个厂商集成后的产品还是有很大差别的,或多或少都加入了自研产品。

作为使用方角度,通过了解底层hadoop集群搭建的过程还是有很大程度上能够更快的适应各个厂商的集群的。

下面分享一下自己的搭建过程,因为是完全搭建好才分享的,所以步骤可能会有漏掉,实际步骤会有些许出入.

下面各个组件版本是经过大量编译、部署并验证基础场景SQL 操作没有问题后才最终确认其兼容版本,除了sqoop抽取关系型数据库到hbase有点问题,其他操作均未发现问题.

最后希望能帮助到有想集成hadoop且会免费开源产品的那些人吧,hadoop集成的产品真没必要五花八门! 下面步骤内容仅限测试练习使用!

版本介绍

系统版本: centos7

组件版本:

kafka4.x 版本可以像flink一样独立部署hadoop集群外.因为它不再依赖zk。下面给出集成好的基础功能截图后续会逐个分享各个组件部署过程。

机器列表

192.168.242.230 apache230.hadoop.com

192.168.242.231 apache231.hadoop.com

192.168.242.232 apache232.hadoop.com

功能实现

zookeeper:

hadoop:

hive:

hbase:

impala:

ranger :

hue:

接下来介绍各个组件部署过程-此次文章主要为zookeeper

zookeeper

1.1 分发并解压到指定路径

分发至其他节点: ansible hadoopsrcclustero -m copy -a "src=/opt/softs/apache-zookeeper-3.9.2-bin.tar.gz dest=/opt/softs/"解压到指定路径: ansible hadoopsrccluster -m shell -a "tar -xf /opt/softs/apache-zookeeper-3.9.2-bin.tar.gz -C /opt/apache_v00/"修改名称: ansible hadoopsrccluster -m shell -a "mv /opt/apache_v00/apache-zookeeper-3.9.2-bin /opt/apache_v00/apache-zookeeper-3.9.2"

1.2 配置文件设置

#创建数据目录:ansible hadoopsrccluster -m shell -a "mkdir -p /opt/apache_v00/apache-zookeeper-3.9.2/data/zookeeper"#复制配置文件模板ansible hadoopsrccluster -m shell -a "cd /opt/apache_v00/apache-zookeeper-3.9.2/conf/ && cp zoo_sample.cfg zoo.cfg"

配置好后的zoo.cfg配置内容为:

tickTime=2000initLimit=10syncLimit=5dataDir=/opt/apache_v00/apache-zookeeper-3.9.2/data/zookeeperclientPort=2181autopurge.purgeInterval=1server.1=192.168.242.230:2888:3888server.2=192.168.242.231:2888:3888server.3=192.168.242.232:2888:3888

进行分发

ansible hadoopsrcclustero -m copy -a "src=/opt/apache_v00/apache-zookeeper-3.9.2/conf/zoo.cfg dest=/opt/apache_v00/apache-zookeeper-3.9.2/conf"

1.3 Myid文件设置

#apache23[0-2].hadoop.com分别执行:echo '1' > /opt/apache_v00/apache-zookeeper-3.9.2/data/zookeeper/myidecho '2' > /opt/apache_v00/apache-zookeeper-3.9.2/data/zookeeper/myidecho '3' > /opt/apache_v00/apache-zookeeper-3.9.2/data/zookeeper/myid

1.4 配置环境变量

三台节点均执行:

cat > /etc/profile.d/apache_v00.sh <<'EOF'export ZOOKEEPER_HOME=/opt/apache_v00/apache-zookeeper-3.9.2export PATH=$PATH:$ZOOKEEPER_HOME/binEOFsource /etc/profile.d/apache_v00.sh

1.5 启动zookeeper

ansible hadoopsrccluster -m shell -a "zkServer.sh start"

1.6 连接测试

zkCli.sh -server 192.168.242.230:2181
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/6 6:21:50

网盘直链下载助手:多平台下载工具的高效解决方案

网盘直链下载助手&#xff1a;多平台下载工具的高效解决方案 【免费下载链接】Online-disk-direct-link-download-assistant 可以获取网盘文件真实下载地址。基于【网盘直链下载助手】修改&#xff08;改自6.1.4版本&#xff09; &#xff0c;自用&#xff0c;去推广&#xff0…

作者头像 李华
网站建设 2026/2/7 1:05:32

RexUniNLU部署指南:从Docker镜像拉取到WebUI访问的完整链路

RexUniNLU部署指南&#xff1a;从Docker镜像拉取到WebUI访问的完整链路 RexUniNLU是一款面向中文场景的零样本通用自然语言理解模型&#xff0c;无需任务特定训练即可完成多种NLP理解任务。它不是为单一任务而生的“专才”&#xff0c;而是能灵活应对命名实体识别、关系抽取、…

作者头像 李华
网站建设 2026/2/4 19:33:14

如何突破抖音评论采集瓶颈?四大核心场景的自动化解决方案

如何突破抖音评论采集瓶颈&#xff1f;四大核心场景的自动化解决方案 【免费下载链接】TikTokCommentScraper 项目地址: https://gitcode.com/gh_mirrors/ti/TikTokCommentScraper 在社交媒体数据分析领域&#xff0c;评论数据蕴含着用户真实反馈与市场趋势信号。然而传…

作者头像 李华
网站建设 2026/2/3 1:28:04

WuliArt Qwen-Image Turbo环境部署:PyTorch+RTX 4090极简配置方案

WuliArt Qwen-Image Turbo环境部署&#xff1a;PyTorchRTX 4090极简配置方案 1. 为什么这款文生图模型值得你立刻上手&#xff1f; 你有没有试过在本地跑一个文生图模型&#xff0c;结果卡在显存不足、黑图频出、生成慢得像等开水&#xff1f;或者好不容易跑通了&#xff0c;…

作者头像 李华