[jira] [Comment Edited] (KAFKA-14328) KafkaAdminClient should be Changing the exception level When an exception occurs

shizhenzhen (Jira) Fri, 21 Oct 2022 01:57:08 -0700

    [ 
https://issues.apache.org/jira/browse/KAFKA-14328?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanel&focusedCommentId=17622136#comment-17622136
 ]


shizhenzhen edited comment on KAFKA-14328 at 10/21/22 8:56 AM:
---------------------------------------------------------------

[~showuon]   感谢回复, 像你说的一样，我们期望通过重试能够解决这个异常，但是如果超时时间范围内不能够解决呢？

 

这个时候抛出来的异常就是  Timed out waiting for a node assignment. Call: metadata

 

但是这么简单的异常，谁能够知道具体的原因是什么呢？

 

所以对于排查问题来说很不友好

 

如果这里改成 log.warn 或许能够帮助我们寻找到一些蛛丝马迹。

 

如果说 等到超时的时候能够把这个具体的异常能够返回回去，那当然会更优雅一点

 

但是这似乎做起来并没有 直接改成 log.warn来的简单。

 

因为超时的时候是没有具体异常信息的，判断了某个请求超时了，只给了下列的信息

 

!image-2022-10-21-16-54-40-588.png!

 

!image-2022-10-21-16-56-45-448.png!

 


was (Author: shizhenzhen):
[~showuon]   感谢回复, 像你说的一样，我们期望通过重试能够解决这个异常，但是如果超时时间范围内不能够解决呢？

 

这个时候抛出来的异常就是  Timed out waiting for a node assignment. Call: metadata

 

但是这么简单的异常，谁能够知道具体的原因是什么呢？

 

所以对于排查问题来说很不友好

 

如果这里改成 log.warn 或许能够帮助我们寻找到一些蛛丝马迹。

 

如果说 等到超时的时候能够把这个具体的异常能够返回回去，那当然会更优雅一点

 

但是这似乎做起来并没有 直接改成 log.warn来的简单。

 

因为超时的时候是没有具体异常信息的，判断了某个请求超时了，只给了下列的信息

 

!image-2022-10-21-16-54-40-588.png!

 

 

 

> KafkaAdminClient should be Changing the exception level When an exception 
> occurs
> --------------------------------------------------------------------------------
>
>                 Key: KAFKA-14328
>                 URL: https://issues.apache.org/jira/browse/KAFKA-14328
>             Project: Kafka
>          Issue Type: Improvement
>          Components: admin
>    Affects Versions: 3.3
>            Reporter: shizhenzhen
>            Priority: Major
>         Attachments: image-2022-10-21-11-19-21-064.png, 
> image-2022-10-21-14-56-31-753.png, image-2022-10-21-16-54-40-588.png, 
> image-2022-10-21-16-56-45-448.png
>
>
>  
>  
> KafkaAdminClient 的一些日志全部是 log.trace.  当遇到异常的时候根本不知道什么原因，导致排查问题非常艰难。
>  
> 就比如下面这里，当去请求Metadata请求的时候，如果查询到的Topic有分区Leader=-1的时候，就会抛出异常；
>  
> 但是这个时候实际上异常是被吞掉了的，这里往上面抛出异常之后，到了下面第二张图的 Catch部分。
> 他会把这个请求重新放到到请求队列中。然后就会陷入无限读重试之后，直到达到超时时间抛出异常：Timed out waiting for a node 
> assignment. Call: metadata
>  
> 无法给Metadata请求分配节点，正常情况下谁知道他真正的异常其实是
>  
> ```
> org.apache.kafka.common.errors.LeaderNotAvailableException: There is no 
> leader for this topic-partition as we are in the middle of a leadership 
> election.
>  
> ```
>  
>  
>  
>  
> !https://user-images.githubusercontent.com/10442648/196944422-e11b732f-6f7f-4f77-8d9c-1f0544257461.png!
>  
>  
>  
> 下面截图那里是我改成的warn基本的日志
> !image-2022-10-21-11-19-21-064.png!
>  
> 所以我希望这里的log.trace 能改成 log.warn ; 给一个提醒。
> 就可以说明当前因为某个异常的原因而导致可能的重试。
>  
>  
> ----
>  
>  
> !image-2022-10-21-14-56-31-753.png!
>  



--
This message was sent by Atlassian Jira
(v8.20.10#820010)

[jira] [Comment Edited] (KAFKA-14328) KafkaAdminClient should be Changing the exception level When an exception occurs

Reply via email to