前言
有时会需要安装开源的大数据集群进行测评或者验证问题,已经装过很多遍了,所以想系统的总结整理一下各个组件的安装部署,包括 Zookeeper、Hadoop、Hive、Spark 等。
版本
SSH互信
1 | # 每个节点 |
下载Zookeeper
下载地址:https://archive.apache.org/dist/zookeeper/
more >>有时会需要安装开源的大数据集群进行测评或者验证问题,已经装过很多遍了,所以想系统的总结整理一下各个组件的安装部署,包括 Zookeeper、Hadoop、Hive、Spark 等。
1 | # 每个节点 |
下载地址:https://archive.apache.org/dist/zookeeper/
more >>Conda 是一个开源的软件包和环境管理系统,在数据科学、机器学习、科学计算等领域广泛应用
总结整理 Yarn 任务运行日志。主要解决:
在命令中查看:1
yarn logs -applicationId <application ID>
Resource Manager Web UI 默认端口:8088
3.4.1 和 3.1.4 的 Web UI 界面稍微有所不同:3.4.1
:
https://nightlies.apache.org/flink/flink-docs-release-1.15/zh/docs/ops/state/savepoints/
先起一个测试任务,就用之前文章中的 cdc_mysql2mysql1
bin/sql-client.sh -f sql/cdc_mysql2mysql.sql
根据官方文档:1
bin/flink savepoint :jobId [:targetDirectory] -yid :yarnAppId
那么命令应该为1
bin/flink savepoint 24f61a106d31205a122b66e45b2984e7 /savepoint/cdc_mysql2mysql -yid application_1750755047138_0076
tag:
缺失模块。
1、请确保node版本大于6.2
2、在博客根目录(注意不是yilia根目录)执行以下命令:
npm i hexo-generator-json-content --save
3、在根目录_config.yml里添加配置:
jsonContent: meta: false pages: false posts: title: true date: true path: true text: false raw: false content: false slug: false updated: false comments: false link: false permalink: false excerpt: false categories: false tags: true