欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

kafka开发中遇到的问题集

程序员文章站 2022-06-14 09:27:34
...
  • 错误: Spark prints an avalanche of warning messages from Parquet when reading parquet files written by older versions of Parquet-mr
    原因: spark2.10存在的bug
    参考: https://issues.apache.org/jira/browse/SPARK-17993

  • --conf spark.streaming.kafka.maxRatePerPartition=1000
    设置每个batch最多处理条数, 超过的话分为几个batch处理

  • 写kafka时会socket连接有时会出现断开, 这时需要设置retries = 3 或者 5, 甚至在foreachPartition中加一个try, catch尝试重新建立连接(close掉上一个连接)