从Kudu中导出、导入数据
程序员文章站
2022-05-05 16:33:38
...
从kudu的表中导出数据,源码中提供了一系列的工具包。
这是一个spark Application,根据代码中的用法:
可以选择导入或者导出数据
可以选择文件格式(csv,avro)
可以选择表名
可以选择输出路径
可以选择kudu的master
如果有特殊需求可以修改源码。
1. 用maven编译:
mvn package -DskipTests
2. 然后运行spark 任务
./spark-submit \
--master local \
--jars /home/libs/spark-avro_2.11-3.2.0.jar \
--class org.apache.kudu.spark.tools.ImportExportFiles \
/home/kudu/kudu/java/kudu-spark-tools/target/kudu-spark2-tools_2.11-1.6.0-SNAPSHOT.jar \
--operation=import --format=avro --master-addrs=192.168.1.1 --path=/data/apps/data/kudu/users --table-name=test_users
kudu源码中还有一些tools,用Maven编译后可以使用,具体使用可以看代码中的usage。
上一篇: MySQL数据管理(外键的创建与删除)
下一篇: 多表操作_外键_关联表_查询