Author Archives

raidentrance

Soy @raidentrance en Twitter y en Github, soy egresado de la Facultad de Ingeniería de la UNAM, cuento con 8 certificaciones en diferentes áreas del desarrollo de software, me gustan las cervezas y soy Geek.

Apache Spark 2 : Conceptos básicos


Apache Spark es un cluster dedicado al procesamiento de información de forma muy rápida, provee soporte para el desarrollo de aplicaciones con Java, Scala, Python y R. Su engine cuenta con soporte para SQL, Machine Learning, Streaming, GraphX, etc. Características Cuando se procesan grandes datasets uno de los […]

Kafka Streams : Introducción


Kafka Streams es una biblioteca utilizada para el procesamiento y transformación de datos utilizando Apache Kafka. Es posible utilizarlo para múltiples casos, veamos algunos ejemplos: Transformación de datos Detección de patrones Detección de fraudes Monitoreo y alertas Migración de datos Para utilizar Kafka streams solo programaremos una aplicación común […]