前言
在开始学习Hudi的时候,我们知道通过df.write.format("hudi").save
可以实现写Hudi,并且写Hudi的逻辑是在HoodieSparkSqlWriter.write
实现的,但是始终有一个疑问:它怎么从df.write.format("hudi").save
跳到HoodieSparkSqlWriter.write
中的呢?本文就是主要来回答这个问题的。
版本
Spark 2.4.4
Hudi 0.12.0-SNAPSHOT,和上篇文章Hudi Spark SQL源码学习总结-CTAS用的Hudi代码一样
示例代码
还是拿源码里的TestCreateTable
中的测试语句
1 | import spark.implicits._ |