El documento describe la arquitectura de Big Data de Socialmetrix, una compañía que monitorea actividad en redes sociales. Explica que usan una arquitectura Lambda escalable con Kafka, Spark y Cassandra para procesar grandes volúmenes de datos provenientes de redes sociales. También discute lecciones aprendidas como la importancia de automatizar procesos desde el inicio y dividir roles entre especialistas en crawling, procesamiento de lenguaje natural, Big Data y visualización.
Related topics: