欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

flume 对接spark streaming 博客分类: flume flume对接spark streaming 

程序员文章站 2024-03-12 19:10:14
...

1.flume对接kafka的两种方式:pull 和 push 流程如下:


flume 对接spark streaming
            
    
    博客分类: flume flume对接spark streaming 
 
flume 对接spark streaming
            
    
    博客分类: flume flume对接spark streaming 
 

2.两者的区别


flume 对接spark streaming
            
    
    博客分类: flume flume对接spark streaming 
 

3.使用pull方式可能遇到的问题:

本地测试环境:

  • spark 2.3
  • flume 1.8

   使用pull方式,flume报错如下:

  (官网上存在这个bug,尚未修复:https://issues.apache.org/jira/browse/SPARK-17152

 

java.lang.IllegalStateException: begin() called when transaction is OPEN!
 

 

网上的解决方法:

这个报错是因为scala版本问题造成,把flume lib下的scala-library版本替换掉即可(亲测,好用)

flume 对接spark streaming
            
    
    博客分类: flume flume对接spark streaming 
 

 

 

  • flume 对接spark streaming
            
    
    博客分类: flume flume对接spark streaming 
  • 大小: 158.5 KB
  • flume 对接spark streaming
            
    
    博客分类: flume flume对接spark streaming 
  • 大小: 154 KB
  • flume 对接spark streaming
            
    
    博客分类: flume flume对接spark streaming 
  • 大小: 74.1 KB
  • flume 对接spark streaming
            
    
    博客分类: flume flume对接spark streaming 
  • 大小: 21.3 KB