Apache Spark 2 : Conceptos básicos


Apache Spark es un cluster dedicado al procesamiento de información de forma muy rápida, provee soporte para el desarrollo de aplicaciones con Java, Scala, Python y R. Su engine cuenta con soporte para SQL, Machine Learning, Streaming, GraphX, etc. Características Cuando se procesan grandes datasets uno de los […]

Kafka Streams : Introducción


Kafka Streams es una biblioteca utilizada para el procesamiento y transformación de datos utilizando Apache Kafka. Es posible utilizarlo para múltiples casos, veamos algunos ejemplos: Transformación de datos Detección de patrones Detección de fraudes Monitoreo y alertas Migración de datos Para utilizar Kafka streams solo programaremos una aplicación común […]