欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

spark - 分区自动探测 博客分类: spark spark 分区探测 

程序员文章站 2024-03-12 18:26:56
...

spark支持分区的自动探测

例如:目录如下:
spark -  分区自动探测
            
    
    博客分类: spark spark 分区探测 
 

df读取的时候,分别传不同的路径进去,schema是不一样的,通过下图可以看到,spark可以探测到当前路径下的分区
spark -  分区自动探测
            
    
    博客分类: spark spark 分区探测 

 

可以控制这个参数,决定是否开启自动类型推测(控制的是类型推测,如果设为false,都是分区字段string类型)

spark.sql.sources.partitionColumnTypeInference.enabled

 

 

测试代码:


spark -  分区自动探测
            
    
    博客分类: spark spark 分区探测 
 

 

分区类型推测的源码位置:


spark -  分区自动探测
            
    
    博客分类: spark spark 分区探测 
 

 

 

  • spark -  分区自动探测
            
    
    博客分类: spark spark 分区探测 
  • 大小: 24.5 KB
  • spark -  分区自动探测
            
    
    博客分类: spark spark 分区探测 
  • 大小: 26.4 KB
  • spark -  分区自动探测
            
    
    博客分类: spark spark 分区探测 
  • 大小: 52.2 KB
  • spark -  分区自动探测
            
    
    博客分类: spark spark 分区探测 
  • 大小: 24 KB
相关标签: spark 分区探测