linux部署安装DataX和DataX-Web

2024-06-04 5800阅读

1.基础环境

JDK(1.8 及其以上都可以,推荐 1.8),安装过程略

Python(2 或者 3 都可以),安装过程略

Apache Maven 3.6.1+(只有DataX源码编译安装时需要)

1.1下载maven安装包

访问https://maven.apache.org/download.cgi下载官方安装包

linux部署安装DataX和DataX-Web 第1张

1.2安装maven
#创建maven目录
mkdir -p /usr/local/maven
cd /usr/local/maven/
#上传安装包至/usr/local/maven/
# 解压
tar -zxvf apache-maven-3.9.6-bin.tar.gz
1.3配置maven环境变量
vim /etc/profile
#在文件末尾增加
MAVEN_HOME=/usr/local/maven/apache-maven-3.9.6/
PATH=$MAVEN_HOME/bin:$PATH
#保存退出后,重载配置
source /etc/profile
#验证,查看maven版本
mvn -version
linux部署安装DataX和DataX-Web 第2张
1.4配置 Maven 本地仓库
#新建本地库文件夹
mkdir -p /usr/local/maven/repository
#编辑配置文件/usr/local/maven/apache-maven-3.9.6/conf/settings.xml
vim /usr/local/maven/apache-maven-3.9.6/conf/settings.xml
#在注释的localRepository节点后,增加
/usr/local/maven/repository
linux部署安装DataX和DataX-Web 第3张
1.5配置仓库镜像

在 settings.xml 配置文件中找到 mirrors 节点,添加以下内容:


    alimaven
    central
    aliyun maven
    http://maven.aliyun.com/nexus/content/repositories/central/

linux部署安装DataX和DataX-Web 第4张

1.6验证

mvn help:system

执行mvn help:system后会从mven仓库下载一些必须的插件,大概一分多钟,下载完成后会显示系统变量和环境变量。

linux部署安装DataX和DataX-Web 第5张

2.安装DataX

访问https://github.com/alibaba/DataX下载工具包

linux部署安装DataX和DataX-Web 第6张

#将下载好的安装包上传至/usr/local/
#解压
tar -zxvf datax.tar.gz -C /usr/local/
#自检脚本
python /usr/local/datax/bin/datax.py /usr/local/datax/job/job.json

linux部署安装DataX和DataX-Web 第7张

3.安装DataX-Web

3.1环境要求
  • MySQL (5.5+) 必选,对应客户端可以选装, Linux服务上若安装mysql的客户端可以通过部署脚本快速初始化数据

  • JDK (1.8.0_xxx) 必选

  • Maven (3.6.1+) 必选

  • DataX 必选

  • Python (2.x) (支持Python3需要修改替换datax/bin下面的三个python文件,替换文件在doc/datax-web/datax-python3下,网址https://github.com/WeiYe-Jing/datax-web/tree/master/doc/datax-web/datax-python3) 必选,主要用于调度执行底层DataX的启动脚本,默认的方式是以Java子进程方式执行DataX,用户可以选择以Python方式来做自定义的改造

    3.2下载安装包

    访问https://github.com/WeiYe-Jing/datax-web/blob/master/doc/datax-web/datax-web-deploy.md,下载官方安装包

    linux部署安装DataX和DataX-Web 第8张

    上传至/usr/local/

    3.3安装
    #解压
    tar -zxvf datax-web-2.1.2.tar.gz -C /usr/local/
    #执行安装脚本
    /usr/local/datax-web-2.1.2/bin/install.sh --force
    3.4数据库配置

    在mysql中创建datax_web数据库,执行数据库脚本/bin/db/datax-web.sql

    修改DataX-web的配置文件/usr/local/datax-web-2.1.2/modules/datax-admin/conf/bootstrap.properties

    linux部署安装DataX和DataX-Web 第9张

    3.5配置python 脚本路径

    编辑/usr/local/datax-web-2.1.2/modules/datax-executor/bin/env.properties

    PYTHON_PATH=/usr/local/datax/bin/datax.py

    linux部署安装DataX和DataX-Web 第10张

    3.6启动服务

    /usr/local/datax-web-2.1.2/bin/start-all.sh
    #查看服务,出现DataXAdminApplication和DataXExecutorApplication进程,表示项目运行成功
    jps
    linux部署安装DataX和DataX-Web 第11张
    3.7访问UI界面

    访问地址http://服务器IP:9527/index.html#/login?redirect=%2Fdashboard,其中9527为默认端口,默认账户信息:用户名 admin 密码 123456

    linux部署安装DataX和DataX-Web 第12张linux部署安装DataX和DataX-Web 第13张

    4.常见问题

    [DataX引擎配置错误,该问题通常是由于DataX安装错误引起,请联系您的运维解决 .].  - 在有总bps限速条件下,单个channel的bps值不能为空,也不能为非正数

    linux部署安装DataX和DataX-Web 第14张

    编辑/usr/local/datax/conf/core.json,调整core.transport​​​​​​​.channel​​​​​​​.speed​​​​​​​.byte为2000000(即2MB)保存即可,无需重启。
    linux部署安装DataX和DataX-Web 第15张

    参考文章:

    DataX官方指引

    DataX-Web官方指引

    https://blog.csdn.net/weixin_46560589/article/details/134592916


    免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理! 图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库和百度,360,搜狗等多加搜索引擎自动关键词搜索配图,如有侵权的图片,请第一时间联系我们,邮箱:ciyunidc@ciyunshuju.com。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!

    目录[+]