ELK日志分析系统

发布时间 2023-04-09 20:36:02作者: 上头猪小屁

ELK日志分析系统

  一、ELK概述

  1、ELK日志分析系统

  ELK是由Elasticsearch、Logstash、Kiban三个开源软件的组合。在实时数据检索和分析场合,三者通常是配合共用,而且又都先后归于 Elastic.co 公司名下,故有此简称。

  2.、ELK中日志处理步骤

  1.将日志进行集中化管理(beats)

  2.将日志格式化(Logstash),然后将格式化后的数据输出到Elasticsearch

  3.对格式化后的数据进行索引和存储(Elasticsearch)

  4.前端数据的展示(Kibana)

  二、ELK简介

  1、ElasticSearch介绍

  Elasticsearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的

开放源码发布,是第二流行的企业搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可革,快速,安装使用方便。

  2、ElasticSearch核心概念

  (1)Elasticsearch的特性

  接近实时的搜索

  集群

  节点

  索引

  索引(库)→类型(表)→文档(记录)

  分片和副本

  (2)分片和副本

  在上述特性中,最重要的就是分片和副本,也是让es数据库(Elasticsearch)成为百度这些主流搜索引擎的主要原因,理论上能提升4倍的性能。

  结合实际情况分析:索引存储的数据可能超过单个节点的硬件限制,如一个10亿文档需1TB空间可能不适合存储在单个节点的磁盘上,或者从单个节点搜索请求太慢了,为了解决这个问

题,elasticsearch提供将索引分成多个分片的功能,当在创建索引时,可以定义想要分片的数量。每个分片就是一个全功能的独立索引,可以位于集群中任何节点上。

  分片的特点:

  水平分割扩展,增大存储量

  分布式并行跨分片操作,提供性能和吞吐量

  分布式分片的机制和搜索请求的文档如何汇总完全是有elasticsearch控制的,这些对用户而言是透明的

  网络问题等等其他问题可以在任何时候不期而至,为了健壮性,强烈建议要有个故障切换机制,无论何种故障以防止分片或者节点不可用,为此,elasticsearch让我们将索引分片复制一

份或多份,称为分片副本或副本

  副本的特点:

  高可用性,以应对分片或者节点故障,出于这个原因,分片副本要在不同的节点上

  性能加强,增加吞吐量,搜索可以并行在所有副本上执行

  3、LogStash概述

  一款强大的数据处理工具

  可实现数据传输、格式处理、格式化输出

  数据输入、数据加工(如过滤,改写等)以及数据输出

  常用插件:Input、Filter Plugin、Output

  Input:收集源数据(访问日志、错误日志等)

  Filter Plugin:用于过滤日志和格式处理

  4、Kibana概述

  一个针对Elasticsearch的开源分析及可视化平台

  搜索、查看存储在Elasticsearch索引中的数据

  通过各种图表进行高级数据分析及展示

  Kibana主要功能

  Elasticsearch无缝之集成

  Kibana架构为Elasticsearch定制,可以将任何结构化和非结构化数据加入Elasticsearch索引。Kibana还充分利用了Elasticsearch强大的搜索和分析功能。

  整合数据

  Kibana能够更好地处理海量数据,并据此创建柱形图、折线图、散点图、直方图、饼图和地图。

  复杂数据分析

  Kibana提升了Elasticsearch分析能力,能够更加智能地分析数据,执行数学转换并且根据要求对数据切割分块。

  让更多团队成员收益

  强大的数据库可视化接口让各业务岗位都能够从数据集合受益。

  接口灵活,分享更容易

  使用Kibana可以更加方便地创建、保存、分享数据,并将可视化数据快速交流。

  配置简单

  Kibana的配置和启用非常简单,用户体验非常友好。Kibana自带Web服务器,可以快速启动运行。

  可视化多数据源

  Kibana可以非常方便地把来自Logstash、ES-Hadoop、Beats或第三方技术的数据整合到Elasticsearch,支持的第三方技术包括Apache flume、 Fluentd 等。

  简单数据导出

  Kibana可以方便地导出感兴趣的数据,与其它数据集合并融合后快速建模分析,发现新结果。

  三、部署ELK日志分析系统

node1 192.168.224.100 Elasticsearch 、 Kibana
node2 192.168.224.103 Elasticsearch
Apache 192.168.224.104 Logstash Apache
systemctl stop firewalld
#关闭防火墙
setenforce 0

java -version
#查看jdk环境

cd /opt
#切换到opt目录下
rpm -ivh elasticsearch-5.5.0.rpm 
#安装elasticsearch
systemctl daemon-reload  
#重新加载system管理
systemctl  enable  elasticsearch.service 
#设置服务开机自启
vim /etc/elasticsearch/elasticsearch.yml
#修改elasticsearch配置文件
添加内容:
cluster.name: my-elk-cluster       
#设置es集群名称
node.name: node2						
#设置本机节点名称
path.data: /data/elk_data			
#指定数据存放路径
path.logs: /var/log/elasticsearch 
#指定日志存放路径
bootstrap.memory_lock: false     
#启动时不锁定内存
network.host: "0.0.0.0"				  
#监听地址所有
http.port: 9200								
#监听端口为9200ES的默认端口
discovery.zen.ping.unicast.hosts: ["node1", "node2"]  
#集群发现通过单播实现,指定要发现的节点名,保存退出
grep -v  "^#"  /etc/elasticsearch/elasticsearch.yml  
#过滤非#开头的行检查配置是否有问题
mkdir  -p /data/elk_data
chown   elasticsearch:elasticsearch  /data/elk_data
#创建数据存放路径并授权
systemctl start elasticsearch.service
#启动服务
systemctl status elasticsearch.service
#查看服务状态