ELK Stack

ELK Stack es un conjunto de herramientas de código abierto diseñado para la recolección, análisis y visualización de datos en tiempo real. Su nombre proviene de las iniciales de sus tres componentes principales: Elasticsearch, Logstash y Kibana. Este conjunto de herramientas es ampliamente utilizado en el monitoreo de sistemas, análisis de registros (logs) y seguridad informática.

Con la creciente cantidad de datos generados por sistemas modernos, la necesidad de soluciones eficientes para procesar, indexar y visualizar estos datos ha llevado a ELK Stack a convertirse en una de las alternativas preferidas frente a otras herramientas.

Componentes de ELK Stack

⌬ Elasticsearch: Es el motor de búsqueda y análisis que sirve como base del stack. Elasticsearch está diseñado para almacenar grandes volúmenes de datos y proporcionar búsquedas rápidas y eficientes. Utiliza un modelo de almacenamiento basado en documentos JSON y es altamente escalable gracias a su arquitectura distribuida.
⌬ Logstash: Es la herramienta encargada de la ingesta, transformación y carga de datos. Logstash permite recolectar datos desde diversas fuentes, como archivos de registros, bases de datos y colas de mensajes, y procesarlos para normalizarlos antes de enviarlos a Elasticsearch.
⌬ Kibana: Es la interfaz de visualización de datos. Permite crear dashboards interactivos, realizar búsquedas avanzadas y analizar tendencias a través de gráficos, mapas y otras herramientas visuales.

Adicionalmente, se puede integrar Beats, una colección de agentes ligeros diseñados para enviar datos desde los servidores a Logstash o directamente a Elasticsearch.

Funcionamiento de ELK Stack

El flujo de datos dentro de ELK Stack puede describirse en los siguientes pasos:

Recolecta de datos: Logstash (o Beats) recopila datos desde fuentes como archivos de logs, bases de datos, APIs o eventos de red.
Procesamiento y transformación: Logstash aplica filtros y transforma los datos para estructurarlos correctamente antes de enviarlos a Elasticsearch.
Indexación y almacenamiento: Elasticsearch recibe los datos procesados y los almacena en su índice distribuido, permitiendo consultas rápidas y eficientes.
Análisis y visualización: Kibana se conecta a Elasticsearch para proporcionar dashboards y herramientas de visualización interactivas.

Ventajas frente a otras alternativas

Open Source: A diferencia de otras soluciones comerciales como Splunk, ELK Stack es de código abierto, lo que significa que puede ser implementado sin costos de licencia y con acceso a una comunidad activa de desarrolladores.
Escalabilidad y Flexibilidad: Elasticsearch permite escalar horizontalmente agregando nuevos nodos al clúster, lo que facilita la gestión de grandes volúmenes de datos sin comprometer el rendimiento.
Integración: ELK Stack puede integrarse con plataformas cloud, bases de datos, herramientas de automatización y servicios de mensajería, lo que lo hace altamente adaptable a distintas necesidades empresariales.
Personalización y Análisis Avanzado: Kibana permite la creación de dashboards altamente personalizados con alertas, paneles de control interactivos y compatibilidad con Machine Learning para análisis predictivos.

Elasticsearch

Instalación

❏ Puedes instalar Elasticsearch desde los repositorios de Elastic.

Importar la clave GPG de Elastic:

Agregar el repositorio de Elasticsearch:

Actualizar los repositorios e instalar Elasticsearch:

❏ Configurar Elasticsearch para un único nodo.

ryuzak1@ubuntu: ~

ryuzak1@ubuntu:~$ sudo nano /etc/elasticsearch/elasticsearch.yml

GNU nano 8.1 /etc/elasticsearch/elasticsearch.yml * # ======================== Elasticsearch Configuration ========================= # # NOTE: Elasticsearch comes with reasonable defaults for most settings. # Before you set out to tweak and tune the configuration, make sure you # understand what are you trying to accomplish and the consequences. # # The primary way of configuring a node is via this file. This template lists # the most important settings you may want to configure for a production cluster. # # Please consult the documentation for further information on configuration options: # https://www.elastic.co/guide/en/elasticsearch/reference/index.html # # ---------------------------------- Cluster ----------------------------------- # # Use a descriptive name for your cluster: # cluster.name: my-application # # ------------------------------------ Node ------------------------------------ # # Use a descriptive name for the node: # node.name: node-1 # # ---------------------------------- Network ----------------------------------- # # By default Elasticsearch is only accessible on localhost. Set a different # address here to expose this node on the network: # network.host: 0.0.0.0 # # --------------------------------- Discovery ---------------------------------- # # Pass an initial list of hosts to perform discovery when this node is started: # The default list of hosts is ["127.0.0.1", "[::1]"] # # discovery.seed_hosts: ["127.0.0.1"] # # Bootstrap the cluster using an initial set of master-eligible nodes: # cluster.initial_master_nodes: ["node-1"] # #----------------------- BEGIN SECURITY AUTO CONFIGURATION ----------------------- # # The following settings, TLS certificates, and keys have been automatically # generated to configure Elasticsearch security features on 08-03-2025 01:13:55 # # -------------------------------------------------------------------------------- # Enable security features xpack.security.enabled: false xpack.security.enrollment.enabled: false # Enable encryption for HTTP API client connections, such as Kibana, Logstash, and Agents xpack.security.http.ssl: enabled: false keystore.path: certs/http.p12 # Enable encryption and mutual authentication between cluster nodes xpack.security.transport.ssl: enabled: false verification_mode: certificate keystore.path: certs/transport.p12 truststore.path: certs/transport.p12 # cluster.initial_master_nodes: ["Computer"]

Desactivar la seguridad en Elasticsearch puede ser útil en entornos de pruebas locales o aislados, pero no es recomendable en entornos de producción o accesibles desde Internet. Si decides desactivarla, asegúrate de restringir el acceso a Elasticsearch y de volver a habilitar la seguridad una vez que termines las pruebas.

Desactivar la seguridad en Elasticsearch tiene las siguientes implicaciones:

Cualquier persona con acceso a la red donde está corriendo Elasticsearch podrá acceder a los datos sin necesidad de autenticarse.
Las comunicaciones entre los nodos de Elasticsearch y entre Elasticsearch y los clientes no estarán cifradas.
No habrá restricciones basadas en roles o permisos. Todos los usuarios tendrán acceso completo a los índices y datos.

Elasticsearch, por defecto, utiliza el puerto 9200 para las conexiones HTTP. Verifica si el puerto está en uso con el siguiente comando:

Si necesitas cambiar el puerto predeterminado, debes editar el archivo de configuración de Elasticsearch.

Busca la línea "http.port: 9200" y reemplaza 9200 por el puerto que desees utilizar.

❏ Cambiar la cantidad de memoria utilizada.

Modifica los valores de -Xms y -Xmx según la RAM disponible.

❏ Habilitar y arrancar Elasticsearch.

Habilitar elasticsearch:

❏ Verificar que Elasticsearch está corriendo.

ryuzak1@ubuntu: ~

ryuzak1@ubuntu:~$ sudo systemctl status elasticsearch

● elasticsearch.service - Elasticsearch Loaded: loaded (/usr/lib/systemd/system/elasticsearch.service; enabled; preset: disabled) Active: active (running) since Fri 2025-03-07 19:41:11 CST; 24s ago Invocation: 7ae7fa01afea434859c56fdc2e715cab Docs: https://www.elastic.co Main PID: 9141 (java) Tasks: 105 (limit: 9393) Memory: 4.3G (peak: 4.3G swap: 67.3M swap peak: 75.2M) CPU: 34.105s CGroup: /system.slice/elasticsearch.service ├─9141 /usr/share/elasticsearch/jdk/bin/java -Xms4m -Xmx64m -XX:+UseSerialGC -Dcli.name=server -Dcli.script=/usr/share/elasticsearch/bin/elasticsearch -Dcl> ├─9200 /usr/share/elasticsearch/jdk/bin/java -Des.networkaddress.cache.ttl=60 -Des.networkaddress.cache.negative.ttl=10 -XX:+AlwaysPreTouch -Xss1m -Djava.a> └─9226 /usr/share/elasticsearch/modules/x-pack-ml/platform/linux-x86_64/bin/controller

Usa curl para verificar que el servicio está activo:

ryuzak1@ubuntu: ~

ryuzak1@ubuntu:~$ curl -X GET "http://localhost:9200/_cluster/health?pretty"

{ "name" : "node-1", "cluster_name" : "my-application", "cluster_uuid" : "mvXwIjRZS2qhbZ8tcy4uYA", "version" : { "number" : "8.17.3", "build_flavor" : "default", "build_type" : "deb", "build_hash" : "a091340de489bd4b127874f7e365b0cadf9b140d2", "build_date" : "2025-02-28T10:07:26.089129809Z", "build_snapshot" : false, "lucene_version" : "9.12.0", "minimum_wire_compatibility_version" : "7.17.0", "minimum_index_compatibility_version" : "7.0.0" }, "tagline" : "You Know, for Search" }

Uso Básico de Elasticsearch

Elasticsearch es un motor de búsqueda basado en documentos que almacena datos en formato JSON. Se organiza en índices, que contienen documentos, los cuales tienen campos con valores estructurados o no estructurados.

Antes de agregar documentos, debes definir un índice. Si no lo defines, Elasticsearch lo creará automáticamente cuando insertes el primer documento.

❏ Para crear un índice:

ryuzak1@ubuntu: ~

ryuzak1@ubuntu:~$ curl -X PUT "http://localhost:9200/test" -H "Content-Type: application/json" -d ' {"settings": {"number_of_shards": 1, "number_of_replicas": 1}}'

{"acknowledged":true,"shards_acknowledged":true,"index":"test"}

⌭ number_of_shards: Número de fragmentos en los que se divide el índice.
⌭ number_of_replicas: Número de copias de seguridad de los datos.

Los documentos se almacenan en JSON dentro de un índice. Puedes insertar un documento usando POST o PUT.

❏ Ejemplo de agregar un documento con POST:

ryuzak1@ubuntu: ~

ryuzak1@ubuntu:~$ curl -X POST "http://localhost:9200/test/_doc/" -H "Content-Type: application/json" -d '{"nombre": "Juan Pérez", "edad": 30, "ciudad": "Madrid", "profesion": "Ingeniero"}'

{"_index":"test","_id":"7m0KdJUBtLEq70R13ito","_version":1,"result":"created","_shards":{"total":2,"successful":1,"failed":0},"_seq_no":0,"_primary_term":1}

❏ Esto creará un documento con un ID autogenerado. Si quieres asignar un ID específico, usa PUT:

ryuzak1@ubuntu: ~

ryuzak1@ubuntu:~$ curl -X PUT "http://localhost:9200/test/_doc/1" -H "Content-Type: application/json" -d '{"nombre": "Ana López", "edad": 35, "ciudad": "Barcelona", "profesion": "Analista"}'

{"_index":"test","_id":"1","_version":1,"result":"created","_shards":{"total":2,"successful":1,"failed":0},"_seq_no":1,"_primary_term":1}

❏ Para recuperar un documento específico por su ID:

ryuzak1@ubuntu: ~

ryuzak1@ubuntu:~$ curl -X GET "http://localhost:9200/test/_doc/1?pretty"

{ "_index" : "test", "_id" : "1", "_version" : 3, "_seq_no" : 3, "_primary_term" : 1, "found" : true, "_source" : { "nombre" : "Ana López", "edad" : 35, "ciudad" : "Barcelona", "profesion" : "Analista" } }

❏ Cuando se necesita buscar un usuario por nombre sin conocer su ID, se puede usar una consulta como esta que filtra por el campo nombre, en este caso buscando todos los documentos que contengan el valor "Ana" dentro del índice test.

ryuzak1@ubuntu: ~

ryuzak1@ubuntu:~$ curl -X GET "http://localhost:9400/test/_search?q=nombre:Ana&pretty"

{ "took" : 4, "timed_out" : false, "_shards" : { "total" : 1, "successful" : 1, "skipped" : 0, "failed" : 0 }, "hits" : { "total" : { "value" : 1, "relation" : "eq" }, "max_score" : 1.2809337, "hits" : [ { "_index" : "test", "_id" : "1", "_score" : 1.2809337, "_source" : { "nombre" : "Ana López", "edad" : 26, "ciudad" : "Barcelona", "profesion" : "Analista" } } ] } }

❏ Puedes buscar documentos que cumplan ciertos criterios usando _search:

ryuzak1@ubuntu: ~

ryuzak1@ubuntu:~$ curl -X GET "http://localhost:9200/test/_search" -H "Content-Type: application/json" -d '{"query": {"match": {"ciudad": "Madrid"}}}'

{"took":3,"timed_out":false,"_shards":{"total":1,"successful":1,"skipped":0,"failed":0},"hits":{"total":{"value":4,"relation":"eq"},"max_score":0.5753642,"hits":[{"_index":"test","_id":"7m0KdJUBtLEq70R13ito","_score":0.5753642,"_source":{"nombre": "Juan Pérez", "edad": 30, "ciudad": "Madrid", "profesion": "Ingeniero"}},{"_index":"test","_id":"3","_score":0.5753642,"_source":{"nombre": "Marco Hernánez", "edad": 31, "ciudad": "Madrid", "profesion": "Ingeniero"}},{"_index":"test","_id":"4","_score":0.5753642,"_source":{"nombre": "Francisco Pérez", "edad": 26, "ciudad": "Madrid", "profesion": "Diseñador Gráfico"}},{"_index":"test","_id":"6","_score":0.5753642,"_source":{"nombre": "Brenda García", "edad": 29, "ciudad": "Madrid", "profesion": "Ingeniero"}}]}}

❏ Para actualizar un campo de un documento sin reemplazarlo por completo, usa _update:

ryuzak1@ubuntu: ~

ryuzak1@ubuntu:~$ curl -X POST "http://localhost:9200/test/_update/1" -H "Content-Type: application/json" -d '{"doc": {"edad": 26}}'

{"_index":"test","_id":"1","_version":4,"result":"updated","_shards":{"total":2,"successful":1,"failed":0},"_seq_no":9,"_primary_term":1}

❏ Si quieres borrar un documento por su ID:

ryuzak1@ubuntu: ~

ryuzak1@ubuntu:~$ curl -X DELETE "http://localhost:9200/test/_doc/6"

{"_index":"test","_id":"6","_version":2,"result":"deleted","_shards":{"total":2,"successful":1,"failed":0},"_seq_no":10,"_primary_term":1}

Esto elimina el documento con ID 1 del índice test.

❏ Puedes obtener solo una parte de los resultados con size y from:

ryuzak1@ubuntu: ~

ryuzak1@ubuntu:~$ curl -X GET "http://localhost:9200/test/_search" -H "Content-Type: application/json" -d '{"query": {"match_all": {}}, "size": 3, "from": 2}'

{"took":1,"timed_out":false,"_shards":{"total":1,"successful":1,"skipped":0,"failed":0},"hits":{"total":{"value":7,"relation":"eq"},"max_score":1.0,"hits":[{"_index":"test","_id":"3","_score":1.0,"_source":{"nombre": "Marco Hernánez", "edad": 31, "ciudad": "Madrid", "profesion": "Ingeniero"}},{"_index":"test","_id":"4","_score":1.0,"_source":{"nombre": "Francisco Pérez", "edad": 26, "ciudad": "Madrid", "profesion": "Diseñador Gráfico"}},{"_index":"test","_id":"5","_score":1.0,"_source":{"nombre": "Arturo Vázquez", "edad": 33, "ciudad": "Barcelona", "profesion": "Psicólogo"}}]}}

Esto devuelve 3 documentos empezando desde el número 2.

❏ Para ordenar los resultados por la edad de menor a mayor:

ryuzak1@ubuntu: ~

ryuzak1@ubuntu:~$ curl -X GET "http://localhost:9200/test/_search" -H "Content-Type: application/json" -d '{"query": {"match_all": {}}, "sort": [{ "edad": "asc" }]}'

{"took":1,"timed_out":false,"_shards":{"total":1,"successful":1,"skipped":0,"failed":0},"hits":{"total":{"value":7,"relation":"eq"},"max_score":null,"hits":[{"_index":"test","_id":"4","_score":null,"_source":{"nombre": "Francisco Pérez", "edad": 26, "ciudad": "Madrid", "profesion": "Diseñador Gráfico"},"sort":[26]},{"_index":"test","_id":"1","_score":null,"_source":{"nombre":"Ana López","edad":26,"ciudad":"Barcelona","profesion":"Analista"},"sort":[26]},{"_index":"test","_id":"2","_score":null,"_source":{"nombre": "Pedro Alba", "edad": 27, "ciudad": "Barcelona", "profesion": "Analista"},"sort":[27]},{"_index":"test","_id":"6","_score":null,"_source":{"nombre": "Brenda García", "edad": 29, "ciudad": "Madrid", "profesion": "Ingeniero"},"sort":[29]},{"_index":"test","_id":"7m0KdJUBtLEq70R13ito","_score":null,"_source":{"nombre": "Juan Pérez", "edad": 30, "ciudad": "Madrid", "profesion": "Ingeniero"},"sort":[30]},{"_index":"test","_id":"3","_score":null,"_source":{"nombre": "Marco Hernánez", "edad": 31, "ciudad": "Madrid", "profesion": "Ingeniero"},"sort":[31]},{"_index":"test","_id":"5","_score":null,"_source":{"nombre": "Arturo Vázquez", "edad": 33, "ciudad": "Barcelona", "profesion": "Psicólogo"},"sort":[33]}]}}

❏ Para buscar documentos donde "edad" esté entre 25 y 28 años:

ryuzak1@ubuntu: ~

ryuzak1@ubuntu:~$ curl -X -s GET "http://localhost:9200/test/_search" -H "Content-Type: application/json" -d '{"query": {"range": {"edad": {"gte": 25, "lte": 28 }}}}' | jq

{ "took": 1, "timed_out": false, "_shards": { "total": 1, "successful": 1, "skipped": 0, "failed": 0 }, "hits": { "total": { "value": 3, "relation": "eq" }, "max_score": 1.0, "hits": [ { "_index": "test", "_id": "2", "_score": 1.0, "_source": { "nombre": "Pedro Alba", "edad": 27, "ciudad": "Barcelona", "profesion": "Analista" } }, { "_index": "test", "_id": "4", "_score": 1.0, "_source": { "nombre": "Francisco Pérez", "edad": 26, "ciudad": "Madrid", "profesion": "Diseñador Gráfico" } }, { "_index": "test", "_id": "1", "_score": 1.0, "_source": { "nombre": "Ana López", "edad": 26, "ciudad": "Barcelona", "profesion": "Analista" } } ] } }

Formatos de Datos en Elasticsearch

Elasticsearch acepta documentos en JSON, y dentro de cada documento puedes usar los siguientes tipos de datos:

Texto (text, keyword): Para almacenar cadenas de caracteres.
Números (integer, float, double, long, short): Para datos numéricos.
Booleanos (boolean): Para true o false.
Fechas (date):Formatos como YYYY-MM-DD.
Objetos (object): Datos anidados dentro de un documento.
Geo (geo_point, geo_shape): Para almacenar ubicaciones geográficas.

Ejemplo de un documento con varios tipos de datos:

{ "nombre": "Pedro Gómez", "edad": 35, "activo": true, "fecha_registro": "2024-03-07", "ubicacion": { "lat": 40.416775, "lon": -3.703790 } }

Logstash

Logstash es un motor de procesamiento de datos en tiempo real que puede ingerir, enriquecer, transformar y transportar datos desde una variedad de fuentes a diversos destinos. En su esencia, Logstash actúa como un pipeline de datos flexible y extensible.

Logstash destaca en la ingesta de datos de fuentes dispares, como archivos de registro, bases de datos, colas de mensajes y servicios web. Una vez ingeridos, los datos pueden ser enriquecidos con información adicional, como geolocalización de direcciones IP o resolución de nombres de dominio. Logstash también ofrece capacidades de filtrado condicional y de control de flujo, lo que permite enrutar los datos a diferentes destinos o realizar acciones específicas según su contenido.

Logstash usa archivos de configuración .conf con tres secciones principales:

▱ input: Define la fuente de los datos (archivos, bases de datos, syslog, Kafka, etc.).
▱ filter: Aplica transformaciones a los datos (parseo, eliminación, enriquecimiento, etc.).
▱ output: Define el destino de los datos (Elasticsearch, bases de datos, archivos, etc.).

Logstash ofrece una amplia gama de filtros que permiten transformar y enriquecer tus datos antes de enviarlos a tu destino (generalmente Elasticsearch). Aquí te presento los tipos de filtros más comunes y útiles:

Filtros de Análisis y Extracción de Datos:

⌭ grok: Este es uno de los filtros más poderosos. Permite analizar y extraer campos específicos de cadenas de texto no estructuradas utilizando patrones predefinidos o personalizados.

Es ideal para procesar registros de logs con formatos variados.

⌭ dissect: Similar a Grok, pero más rápido para datos estructurados con delimitadores consistentes.

Útil para procesar registros CSV o datos con patrones predecibles.

⌭ csv: Analiza datos en formato CSV y los convierte en campos individuales.
⌭ json: Analiza datos en formato JSON y los convierte en campos estructurados.
⌭ xml: Analiza datos en formato XML y los convierte en campos estructurados.
⌭ kv: Analiza pares clave-valor en cadenas de texto y los convierte en campos individuales.

Filtros de Transformación y Enriquecimiento de Datos:

⌭ mutate: Permite realizar diversas transformaciones en los campos, como renombrar campos, eliminar campos, reemplazar valores, dividir cadenas y convertir tipos de datos.
⌭ date: Analiza cadenas de texto que representan fechas y las convierte en objetos de fecha y hora.

Esencial para trabajar con datos basados en tiempo.

⌭ geoip: Enriquece los eventos con información geográfica basada en direcciones IP.

Permite obtener la ubicación, el país y otros detalles geográficos.

⌭ dns: Realiza búsquedas de DNS inversas para obtener nombres de host a partir de direcciones IP.
⌭ ruby: Permite ejecutar código Ruby para realizar transformaciones personalizadas complejas.

Filtros Condicionales y de Control de Flujo:

⌭ if/else: Permite aplicar filtros condicionalmente según ciertas condiciones.

Esencial para crear pipelines de procesamiento de datos flexibles.

⌭ drop: Descarta eventos que no cumplen con ciertos criterios.

Útil para filtrar datos no deseados.

⌭ clone: Duplica eventos para procesarlos de diferentes maneras.
⌭ aggregate: Combina múltiples eventos en un solo evento.

Filtros de Codificación y Decodificación:

⌭ urldecode: Decodifica cadenas de texto codificadas en formato URL.
⌭ base64: Codifica o decodifica datos en formato Base64.

Instalación

❏ Puedes descargar Logstash para Windows desde la web oficial de Elastic.

En Linux (Debian/Ubuntu):

Instalar syslog-ng en tu sistema Linux :

Reiniciar el Servicio Syslog-ng:

Para iniciar Logstash:

Para probar que Logstash esté en funcionamiento, se puede crear un archivo con el siguiente contenido. Esto permitirá verificar la entrada estándar de la terminal de Linux y reportar todo por la salida estándar, utilizando nano test.conf.

input { stdin{} } filter { mutate { uppercase => ["message"] } } output { stdout { codec => rubydebug } }

Para ejecutar Logstash:

Uso Básico de Logstash

❏ Generar Tráfico de Registro:

⌭ Autenticación (auth.log): Intenta iniciar sesión con un nombre de usuario incorrecto: sudo su - usuario_incorrecto (esto generará un intento de autenticación fallido).

O intenta usar sudo para ejecutar cualquier comando.

⌭ Cron (cron.log): Añade una tarea cron sencilla que se ejecute en el próximo minuto: (crontab -l ; echo "* * * * * echo 'Prueba Cron' >> /tmp/cron_test.log") | crontab - (esto generará una entrada en cron.log cuando la tarea se ejecute).

Si deseas que la tarea deje de ejecutarse, debes eliminarla del crontab. Para hacerlo, sigue estos pasos: primero, abre el crontab en modo edición ejecutando crontab -e, luego busca la línea que añadiste (* * * * * echo 'Prueba Cron' >> /tmp/cron_test.log), elimínala y guarda el archivo. Finalmente, verifica que la tarea se haya eliminado listando las tareas cron nuevamente con crontab -l. Este proceso asegura que la tarea programada, que originalmente se ejecutaba cada minuto, ya no esté activa y no continúe escribiendo en el archivo /tmp/cron_test.log.

⌭ Kernel (kern.log): Conecta o desconecta un dispositivo USB.

Puedes intentar cargar o descargar un módulo del kernel (con precaución): sudo modprobe usb-storage o sudo modprobe -r usb-storage.

⌭ Syslog (syslog): Usa el comando logger para enviar mensajes directamente a syslog: logger "Mensaje de prueba syslog".
⌭ Mail (mail.log): Si tienes un servidor de correo configurado, envía o recibe un correo electrónico.

❏ Crear un Archivo de Configuración Básico.

Si quieres leer datos de un archivo y enviarlos a Elasticsearch, crea un archivo llamado logstash.conf con el siguiente contenido:

Y agrega lo siguiente:

input { file { path => "/var/log/syslog" start_position => "beginning" sincedb_path => "/var/lib/logstash/sincedb" # Usa un archivo de sincedb para mantener un seguimiento de los logs ya procesados } } filter { grok { match => { "message" => "%{SYSLOGTIMESTAMP:timestamp} %{SYSLOGHOST:host} %{DATA:process}(?:\[%{POSINT:pid}\])?: %{GREEDYDATA:syslog_message}" } } } output { elasticsearch { hosts => ["http://localhost:9200"] index => "logs-syslog" } stdout { codec => rubydebug } }

input: Se define como fuente el archivo /var/log/syslog.
filter: Usa grok para extraer campos estructurados del log.
output: Envía los datos a un índice en Elasticsearch llamado logs-syslog y los muestra en la terminal (stdout).

Para ciertos registros, también se pueden visualizar en rutas como /var/log/auth.log o /var/log/messages, dependiendo de los errores o eventos que se estén tratando de alertar.

Puedes verlos con:

❏ Ejecutar Logstash con el Archivo de Configuración.

O si prefieres correrlo manualmente desde el archivo de configuración:

Usa la API de Elasticsearch para listar los índices:

Usa la API de Elasticsearch para listar los documentos en el índice:

Puedes verificar el mapeo (estructura de campos) del índice para entender cómo están definidos los campos:

Si deseas eliminar todos los datos asociados con un data stream específico, puedes eliminar el data stream completo, usando:

Para borrar todos los índices en Elasticsearch, puedes usar el siguiente comando:

❏ Ejecutar Logstash para Data Streams.

Logstash puede crear un índice para Data Streams en Elasticsearch, lo cual es común si has habilitado ILM (Index Lifecycle Management) o Data Streams en tu configuración.

Un Data Stream es una abstracción en Elasticsearch que permite manejar índices basados en el tiempo (time-series) de manera más eficiente.

Para configurar un data stream en Logstash, necesitarás configurar un pipeline de Logstash que pueda consumir datos desde una fuente (como un archivo, un servidor de base de datos o un servicio) y luego enviarlos a un destino (como Elasticsearch).

Para esto es necesario específicarlo en el output del archivo de configuración de Logstash:

output { elasticsearch { hosts => ["http://localhost:9200"] data_stream => true } stdout { codec => rubydebug } }

Verifica si estás utilizando un Data Stream:

Usa la API de Elasticsearch para listar los documentos en el índice:

Puedes acceder directamente al índice usando curl:

Si necesitas mover los datos a otro índice, puedes usar la API de reindexación.

Filtrado de datos con Logstash

Logstash permite filtrar y transformar datos de diversas maneras. Aquí te muestro un ejemplo:

❏ Configuración de un Pipeline de Logstash.

Para crear un pipeline de Logstash que filtre y transforme datos, puedes usar la siguiente configuración:

input { file { path => "/var/log/auth.log" start_position => "beginning" sincedb_path => "/var/lib/logstash/test2.sincedb" } } filter { if [message] =~ /USER=root/ { mutate { add_field => { "run_as_sudo" => "yes" } } } else { drop {} } } output { elasticsearch { hosts => ["http://localhost:9200"] index => "sudo_command" } stdout { codec => rubydebug } }

Luego ejecutarlo manualmente desde el archivo de configuración:

Después puedes probar que esté capturando correctamente los registros ejecutando comandos como superusuario, como podrían ser sudo id o sudo whoami.

Lista los documentos del índice:

Ejemplos de Configuración de Logstash

❏ Leer Datos desde Diferentes Fuentes.

Leer desde un Archivo

Si tienes un archivo de logs llamado log.txt, usa la siguiente configuración:

input { file { path => "/home/usuario/log.txt" start_position => "beginning" sincedb_path => "/dev/null" } } output { stdout { codec => rubydebug } }

sincedb_path => "/dev/null" hace que siempre lea el archivo desde el inicio.

Leer desde Syslog en Tiempo Real

Si quieres procesar logs del sistema:

input { syslog { port => 5514 } } output { elasticsearch { hosts => ["http://localhost:9200"] index => "logs-syslog" } }

Esto captura logs enviados a través de syslog en el puerto 5514.

Recibir Datos desde HTTP (API REST)

Si una aplicación quiere enviar datos a Logstash mediante HTTP POST:

input { http { port => 8080 } } output { elasticsearch { hosts => ["http://localhost:9200"] index => "api-logs" } }

Puedes enviar datos así:

❏ Procesamiento Avanzado con Filtros

Uso de GROK para Extraer Datos

Si tienes logs en texto sin formato y necesitas estructurarlos:

filter { grok { match => { "message" => "%{COMBINEDAPACHELOG}" } } }

Esto estructura logs de Apache automáticamente.

Convertir Formato de Fechas

Si un campo llamado timestamp tiene un formato incorrecto:

filter { date { match => ["timestamp", "dd/MMM/yyyy:HH:mm:ss Z"] target => "@timestamp" } }

Ajusta fechas al formato estándar de Elasticsearch.

Convertir Datos a Minúsculas o Mayúsculas

filter { mutate { lowercase => ["usuario"] } }

Esto convierte Usuario a usuario.

❏ Enviar Datos a Múltiples Destinos.

Puedes enviar los datos a Elasticsearch, un archivo y stdout al mismo tiempo:

output { elasticsearch { hosts => ["http://localhost:9200"] index => "multi-output" } file { path => "/var/log/logstash_output.log" } stdout { codec => rubydebug } }

Esto almacena los logs en Elasticsearch, los guarda en un archivo y los imprime en la consola.

❏ Verificar Errores en Logstash.

Si Logstash no está funcionando como esperas, revisa los logs:

Kibana

Instalación

❏ Puedes descargar Kibana para Windows desde la web oficial de Elastic.

En Linux (Debian/Ubuntu):

❏ Configurar Kibana.

ryuzak1@ubuntu: ~

ryuzak1@ubuntu:~$ sudo nano /etc/kibana/kibana.yml

GNU nano 8.1 /etc/kibana/kibana.yml * # Specifies the address to which the Kibana server will bind. IP addresses and host names are both valid values. # The default is 'localhost', which usually means remote machines will not be able to connect. # To allow connections from remote users, set this parameter to a non-loopback address. server.host: "0.0.0.0" # =================== System: Kibana Server (Optional) =================== # Enables SSL and paths to the PEM-format SSL certificate and SSL key files, respectively. # These settings enable SSL for outgoing requests from the Kibana server to the browser. #server.ssl.enabled: false #server.ssl.certificate: /path/to/your/server.crt #server.ssl.key: /path/to/your/server.key # =================== System: Elasticsearch =================== # The URLs of the Elasticsearch instances to use for all your queries. elasticsearch.hosts: ["http://localhost:9200"] xpack.encryptedSavedObjects.encryptionKey: "una_clave_de_32_números_aleatorios"

Iniciar Kibana con:

Accede en un navegador a: http://localhost:5601 y luego haz clic en el botón "Explore on my own" para acceder a la interfaz principal de Kibana y empezar a explorar.

Importar Datos en Kibana.

Desde Elasticsearch:

Ve a Stack Management → Data Views → Create data view.
Escribes el nombre del índice que cargaste (ej: logs-*, ventas, etc).
Y ¡listo! Ya puedes visualizarlo desde Discover.

Alertas y Monitorización en Kibana.

Si quieres recibir alertas cuando los datos cumplan ciertas condiciones:

Para definir una "Regla" (Rule) que evalúe condiciones y dispare alertas en Kibana, navega a Alerts → Manage Rules, que es la sección designada para esta configuración, y luego haz clic en el botón "Create rule" para comenzar el proceso de creación.
Para monitorear datos directamente desde Elasticsearch, como los documentos que visualizas en Discover, debes elegir la opción "Elasticsearch Query".
En esta sección, debes escribir la query en KQL (Kibana Query Language). Si lo que te interesa es detectar cuando aparece host.name: "Ubuntu"
También puedes definir una nueva alerta con condiciones específicas (por ejemplo, si un servidor está caído).
Configura las acciones: Enviar un email, webhook o Slack notification.

Uso Básico de Kibana

❏ Buscar y Filtrar Datos en Kibana.

Puedes buscar datos en tiempo real usando KQL (Kibana Query Language).

Ejemplo:

Buscar errores en logs: message: "error"
Filtrar registros de usuarios de México: country: "Mexico"

❏ Conectar Kibana con Logstash y Elasticsearch.

Si Logstash envía datos a Elasticsearch, Kibana puede visualizarlos.

Ejemplo de configuración en logstash.conf:

output { elasticsearch { hosts => ["http://localhost:9200"] index => "logs-ubuntu" } }

Luego, en Kibana:

Ve a Stack Management → Data Views → Create data view.
Crea un patrón de índice para logs*.
Visualiza los datos en "Discover".