LogStash中 filter如何使用
更新:HHH   时间:2023-1-7


LogStash中 filter如何使用,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。

<一> grok

  1. 自定义grok格式

    在conf 文件的文件夹同级目录下,一般是在patterns 文件夹下,建立自己的pattern 文件,比如extra 文件

    # contents of ./patterns/postfix:

    POSTFIX_QUEUEID [0-9A-F]{10,11}

使用举例,针对日志格式:Jan 1 06:25:43 mailserver14 postfix/cleanup[21403]: BEF25A72965: message-id=<20130101142543.5828399CCAF@mailserver14

conf 配置:

 grok{

    patterns_dir => "./patterns"

    match => [ "message", "%{SYSLOGBASE} %{POSTFIX_QUEUEID:queue_id}: %{GREEDYDATA:syslog_message}" ]

  }

}

结果为:

匹配正确

2.一些比较神奇的Grok Pattern

比如:GREEDYDATA .*

说明:如果我不想面面俱到的匹配一坨东西,直接用Greedydata

举例:比如匹配,52:awfasdf0r8b123e:222g1g16:885579b2:9afr

    在filter 的grok 中,添加%{GREEDYDATA:sth},即可匹配上面那一串。如果你想更详细的匹配,那就自己写正则,对每一项进行匹配。 

<二> 

<三> 实际使用举例

1. 想处理java 日志信息,包括正常的info 与错误的堆栈信息怎么处理?

思路:

    filter 中,使用 multiline 对日志信息进行分组;然后使用grok 进行拆分。

需要注意的事情,可能会遇到换行的问题,这个时候怎么做?

这个时候的处理是这样的,使用GREEDYDATA 是无效的,因为这只是匹配 .* ,而 . 是不匹配 newline 的,这个时候,应该将 GreedyData 换成:

(?<message>(.|\r|\n)*)

看完上述内容是否对您有帮助呢?如果还想对相关知识有进一步的了解或阅读更多相关文章,请关注天达云行业资讯频道,感谢您对天达云的支持。

返回云计算教程...