logkit-pro - 用户指南 - 《Pandora中文文档手册》

用户指南

用户指南

安装 logkit Pro 到机器

进入 logkit Pro 官网，点击【机器管理】-> 【添加机器】，进入安装页面，logkit Pro 提供自动录入和手动安装两种方式添加机器。

手动安装：点击【复制地址】，就可以获取我们提供的一键式安装脚本。

在安装之前，您可以为机器指定一个标签来统一管理同一个业务下的机器。

对于linux或mac用户来说，直接在控制台粘贴并执行复制的命令即可。

对于windows用户，将复制的url在浏览器打开，将内容复制到文本文件中，并另存为 logkit.vbs，再双击执行 logkit.vbs 脚本安装。

自动录入：输入机器 ip、ssh 端口、用户信息等在服务器上安装 Agent。

安装好以后您可以在【机器管理】列表看到机器的相关信息，如机器所属标签、机器里的所有收集器、机器地址等，详细信息阅读机器管理。

收集数据

在机器上安装好 logkit Pro 之后就可以开始收集数据。进入数据收集页面，点击添加收集器开始配置收集器。

获取数据

第一步是接收数据源，logkit Pro 支持多种数据来源和读取模式，根据需要在左侧列表选取。

填写好配置信息之后，选择您添加的 agent，点击【获取数据】，系统将使用您的配置，让 agent 去获取实际的数据，并且展示样例数据以验证您的配置是否正确。

默认不需要配置高级选项，高级选项保持默认值即可。

logkit Pro 支持的采集数据源

File: 读取文件中的日志数据，包括 csv 格式的文件，kafka-rest 日志文件， nginx 日志文件等，并支持多种读取模式（fileauto、dir、file、tailx）
MySQL: 读取 MySQL 中的数据。
MSSQL: 读取 Microsoft SQL Server中的数据。
Postgre SQL: 读取 PostgreSQL 中的数据。
ElasticSearch: 读取 ElasticSearch 中的数据。
MongoDB: 读取 MongoDB 中的数据。
Kafka: 读取 Kafka 中的数据。
Redis: 读取 Redis 中的数据。
Socket: 读取 tcp\udp\unixsocket 协议中的数据。
Http: 作为 http 服务端，接受 POST 请求发送过来的数据。
Script: 支持执行脚本，读取执行结果中的数据。
Snmp: 主动抓取 Snmp 服务中的数据。
AWS CloudWatch: 主动抓取 AWS CloudWatch接口中的数据。
AWS CloudTrail: 主动抓取 AWS CloudTrail中的数据。

关于数据源类型以及高级选项详细介绍，请阅读数据源类型。

解析数据

第二步，根据数据源配置合适解析方式，抽取数据中的字段，转化为结构化数据，充分保障您的配置一定能在实际场景中生效。logkit Pro 支持多种格式的日志解析，按需选取并填写相应的配置信息即可。

按grok格式解析

通过配置 grok pattern 解析，将文本格式的字符串转化为结构化的数据。使用 grok 解析日志内容会使得日志分析更加容易。logkit Pro 提供默认匹配日志的 grok 表达式、grok 划词以及自定义 grok 表达式三种方式进行解析。

默认 grok 表达式：

使用系统匹配日志的 grok pattern 来解析您的数据：

如果默认 pattern 解析没法满足您的需求，logkit Pro 支持自定义 grok pattern。

grok划词

通过在数据上划词解析数据：在数据上点选数据内容，系统会自动匹配 grok 变量生成 pattern,字段名、字段类型与 grok 变量均可编辑。通过划词生成的 pattern 以及划词解析后的数据均可见。

如果部分数据内容无法全部用划词解析，您还可以编辑 pattern。

点击验证即查看解析结果。

您也可以直接输入自定义 pattern。

其他解析方式：

按原始日志逐行发送：直接按行读取日志内容。
按 json 格式解析：通过 json 反序列化解析日志内容，无需任何配置，系统根据日志内容自动解析。
按 csv 格式解析：按分隔符解析日志。
按 nginx 日志解析：专门解析 Nginx 日志。仅需指定 nginx 的配置文件地址，即可进行 nginx 日志解析。
按 syslog 格式解析:自动解析系统日志
七牛日志库格式解析: 七牛开源的 golang 日志库日志格式解析
按 kafkarest 日志解析: Kafkarest 日志解析
通过解析清空数据：清空读取的数据
按 mysql man 请求日志解析: mysql 慢请求日志解析

关于其他数据解析方式的详细解说，请阅读数据解析方式。

转换数据

logkit Pro 提供数据转换功能来满足一些更精细的字段解析需求。

在大多数场景下，用 Parser 解析就解决了问题，但是有些场合，用 Parser 来做数据解析可能过于简单，如 json parser。如果数据里面有一部分字段您希望做一些扩展，比如有个 IP 字符串，您希望将其扩展为 IP 对应的区域、城市、省份、运营商等信息，此时您就可以配置一个 Transformer，对 IP 字段进行转换。

再比如，当您希望做一些字符串替换的时候，只针对某个字段做一个字符串替换处理，那就可以配置一个 replace transformer。