datax-web使用手册_datax web用户手册
📘 DataX-Web 使用手册(完整版)
一、简介
DataX-Web 是基于阿里巴巴开源项目 DataX 构建的可视化数据同步平台。它提供了一个 Web 管理界面,便于用户配置、调度、监控 DataX 的同步任务。
通过 DataX-Web,你可以:
二、访问地址
默认访问地址为:
http://:9527
默认账号密码:
- 用户名:
admin - 密码:
123456
⚠️ 首次登录后建议修改默认密码。
三、使用流程图
添加数据源 → 创建同步任务 → 配置调度策略 → 执行任务 → 查看日志
四、详细操作指南
1️⃣ 添加数据源
步骤:
- 点击左侧菜单 【数据源管理】。
- 点击 【新增】。
- 填写数据源信息:
- 点击 保存。
✅ 支持的数据库:MySQL、Oracle、PostgreSQL、SQL Server、Hive、HDFS、HBase、MongoDB、ClickHouse、StarRocks、Kafka 等。
2️⃣ 创建同步任务
方法一:图形化配置任务(推荐)
- 点击左侧菜单 【任务管理】 > 【任务列表】。
- 点击 【新增】。
- 选择源数据源和目标数据源。
- 配置同步字段(可全选或自定义字段)。
- 系统自动生成 DataX 的 JSON 配置。
- 点击 保存。
方法二:手动编辑 JSON(高级)
- 点击【自定义任务】。
- 手动输入 DataX 任务 JSON 配置(格式参考 DataX 官方文档)。
- 点击保存。
💡 示例:MySQL 到 Hive 的 JSON 任务配置,可向我提出,我将为您生成。
3️⃣ 配置任务调度
- 回到 【任务列表】。
- 点击 【调度】 按钮。
- 填写调度参数:
0 0 1 * * ?(每天 1 点)- 点击 【调度启动】。
⚠️ 请确保已部署并启动调度中心(如 Xxl-Job),否则调度不会生效。
4️⃣ 执行任务 & 查看日志
执行方式:
- 点击 【执行一次】:手动执行一次任务
- 或等待调度器触发定时执行
查看日志:
- 点击左侧 【任务管理】 > 【执行日志】。
- 选择任务,点击 【查看】。
- 查看以下信息:
5️⃣ 监控与报警
监控功能:
- 在 【执行日志】 页面查看实时任务状态
- 在 【调度日志】 页面查看调度历史
报警设置:
- 点击任务详情页的 【报警配置】。
- 填写报警方式:
- 邮件地址
- 钉钉 Webhook
- 企业微信 Webhook
- 选择报警条件:
- 任务失败时报警
- 任务超时时报警
五、高级功能(可选)
1️⃣ 权限管理(可选模块)
- 可基于角色分配任务查看、执行权限
- 需在后台配置用户和角色权限
2️⃣ 多节点部署
- Executor 可部署多个节点,支持分布式执行
- 在 Web 端选择不同执行器运行任务
3️⃣ 增量同步
- 在同步字段中添加 WHERE 条件,实现增量同步
- 示例:
where id > 10000
4️⃣ 多表批量同步
- 可通过脚本或批量导入的方式,快速创建多个任务
六、常见问题与解决方法
七、任务 JSON 配置模板(示例)
示例一:MySQL → MySQL 同步
{ \"job\": { \"content\": [ { \"reader\": { \"name\": \"mysqlreader\", \"parameter\": { \"username\": \"root\", \"password\": \"123456\", \"connection\": [ { \"jdbcUrl\": \"jdbc:mysql://192.168.1.10:3306/source_db\", \"table\": [\"source_table\"] } ] } }, \"writer\": { \"name\": \"mysqlwriter\", \"parameter\": { \"username\": \"root\", \"password\": \"123456\", \"connection\": [ { \"jdbcUrl\": \"jdbc:mysql://192.168.1.11:3306/target_db\", \"table\": \"target_table\" } ], \"column\": [\"*\"], \"preSql\": [\"TRUNCATE target_table\"], \"writeMode\": \"replace\" } } } ], \"setting\": { \"speed\": { \"channel\": 3 } } }}
八、其他建议
- 数据一致性:建议使用主键或时间戳字段进行增量同步
- 并发控制:根据服务器性能设置合适的 channel 数量
- 定期备份任务配置:防止误删
九、联系方式 & 社区支持
- 项目地址:https://github.com/your-repo/datax-web
- 交流群:加入钉钉群、微信群
- 邮箱支持:datax-web@yourcompany.com
如您需要我为您生成特定任务模板(如 MySQL 到 Hive、HDFS 到 HBase 等),请告诉我源和目标类型,我将为您生成 JSON 配置文件。


