Roles y Proyectos
Big Data
Daniel Tardón
dtardon@keedio.com
@danikeedio
ROLES EN BIG DATA
PRINCIPALES NUEVOS ACTORES EN LOS
PROYECTOS BIG DATA
Solving Big Data Issues
ROLES EN BIG DATA
Data Engineer Data Scientist Architect
DevOps Project/Data Science Manager CDO
Solving Big Data Issues
Principalmente se dedican a la construcción de diferentes elementos como las BBDD, algunos servicios/servidores, los
algoritmos que acaban corriendo en producción y se encargan de proporcionar datos para el posterior análisis.
Hacen menos de la analítica real – Hecha por el Data Scientist
INGENIERO DE DATOS: PERFIL Y TAREAS
DATA ENGINEER
<trabaja con/mantiene>
Arquitectura
Big Data
Infraestructura Datos
HW/SW
Solving Big Data Issues
Analiza, visualiza y comunica los resultados a los Data Managers
y otros roles en la organización.
DATA SCIENTIST: PERFIL Y TAREAS
DATA SCIENTIST
Limpieza de Datos Prototipado de
Algoritmos
Comunicación de
los hallazgos
Análisis de Datos
Solving Big Data Issues
DATA SCIENTIST: EN BÚSQUEDA DE UNICORNIOS
Solving Big Data Issues
Diseñar basándose en el objetivo final de una infraestructura que está destinada a, garantizar la interoperabilidad sin
fisuras entre todos los componentes, coordinar la configuración de los cambios.
Conocimiento de administración de sistemas y desarrollo software.
ARQUITECTO BIG DATA: PERFIL Y TAREAS
ARCHITECT
<perspectiva abajo-arriba>
GRAN FOTO
Diseño de los pipelines de
datos:
Seleccionar los módulos y
herramientas apropiados.
ATENCIÓN A LOS DETALLES
Consciente de los desafios
de integración y los posibles
problemas de ajuste en los
rendimientos
Solving Big Data Issues
Su nombre viene a raíz de una metodología.
Puede jugar un papel de ingeniero de operaciones o como un desarrollador con perspectiva global de sistemas y
software juntos.
DEVOPS: PERFIL Y TAREAS
DevOps
Ciclo de vida de la
ingeniería del SW
OPERACIONES
Administración y
Sysconfig
Integración y QA
<Desarrollo Agile>
Solving Big Data Issues
MANAGER: PERFIL Y TAREAS
Foto técnica: infraestructura, SW, matemáticas, estadística y ML.
Gestión: Objetivos y prioridades, control del proceso global, interfaz con otros departamentos, grupos y
clientes.
PROJECT/DATA SCIENCE MANAGER
<perspectiva global>
Gran foto técnica Gestión
Solving Big Data Issues
Gobierno: Calidad del dato, normativa y regulaciones.
Estrategia: Convertir la información en ingresos o activos.
Es el profesional de más alto rango en la compañía (a nivel de gestión de datos)
Normalmente reporta directamente al CEO (Chief Executive Officer)
CDO (CHIEF DATA OFFICER): PERFIL Y TAREAS
Gobierno del Dato Estrategia alrededor
de los datos
CDO – CHIEF DATA OFFICER
Solving Big Data Issues 11Solving Big Data Issues
¿QUÉ PASA EN
1 MINUTO
EN INTERNET?
Actividad
Mundial en
Internet en
2016
60SEGUNDOS
69.444
horas
visionadas
701.389
logins en
Facebook
527.760
fotos compartidas
en Snapchat
51.000
descargas desde
App Store
2,78
millones
de vídeos vistos
972.222
swipes en Tinder
2,4 millones
de búsquedas
+120
cuentas nuevas
de Linkedin
203.596$
en ventas
38.052
horas de música
en Spotify
347.222
nuevos tuits
38.194
posts
1.389
carreras
150
millones
emails
enviados
+20,8
millones
de mensajes
en Whatsapp
1,04
millones
de loops en Vine
Solving Big Data Issues 12
Todo lo que se pueda digitalizar
se digitalizará
Todo lo que se pueda conectar
se conectará
Todo lo que se pueda analizar
se analizará
Solving Big Data Issues
Solving Big Data Issues 13
IT Y NEGOCIO DEBEN ESTAR ALINEADOS
NO PUEDE SER QUE IT SOSTENGA EL NEGOCIO SIN LAS HERRAMIENTAS ADECUADAS
IT
CICLO DEL DATO
FASES E INTERACCIÓN ENTRE LOS
ROLES
14
Solving Big Data Issues
CICLO DEL DATO
001 101
01 0
1
1
11
1
01 10
i
1. ANALYSIS AND DESIGN 2. PLATAFORM DEPLOYMENT
5. DATA PROCESSING 4. SECURITY DATA GOVERNANCE 3. DATA INGESTION
6. ANALYTICS 7. DATA VISUALIZATION/EXPLOITATION
Casos de Uso
Estado del Arte
Arquitectura
Architect
Data Scientist
DS Manager
KEEDIO Data Stack
Proveedores Cloud
On-Premise
Architect
Data Engineer
DevOps
Real Time
Batch
OpStore (NoSQL)
DevOps
Data Engineer
BI Analytics
Machine Learning
Analítica
Exploratoria
Data Scientist
Data Engineer
BI Tools
OLAP
Sistemas Externos
UI/DevOps
Data Scientist
Legacy BI
Autenticación
Trazabilidad
Linaje
CDO
DS Manager
Data Engineer
DevOps
Identificación
Recolección
Enriquecimiento
Data Engineer
DevOps
Data Scientist
METODOLOGÍA
DIFERENTES APROXIMACIONES PERO
SIEMPRE UNA CLAVE: AGILE!
16
Solving Big Data Issues 17
FASES DE PROYECTO – MODELO CLÁSICO – HITOS BIG DATA
¿METODOLOGÍAS ÁGILES?
Solving Big Data Issues 19
CLAVES DE SCRUM
Solving Big Data Issues 20
SENTIDO COMÚN Y FLEXIBILIDAD
SCRUM
XTREME PROGRAMMING
KANBAN
SCRUMBAN
MANY MORE…
METODOLOGÍAS
ÁGILES
RESUMEN
Lo que es Big Data y su futuro
La cadena de valor de Big Data
Casos de uso – Con éxitos y fracasos
Roles de Big Data y el cambio en las organizaciones
Cómo lo hacemos: Con una plataforma y metodología
We’re hiring!
¡Gracias!
¿Tenéis
Preguntas?
Tenemos
Respuestas
Calle Virgilio 25
Edificio Ayessa I, Bajo D
Pozuelo de Alarcón
28223 Madrid
@keedioinfo@keedio.comwww.keedio.com keedio

Más contenido relacionado

PDF
2016 ULL Cabildo KEEDIO - Arquitecturas Big Data
PDF
2016 ULL Cabildo KEEDIO - KEEDIO DATA STACK
PDF
2016 ULL Cabildo KEEDIO - BigData
PDF
Big Data Architecture con Pentaho
PPTX
Big Data en el entorno Bancario
PPTX
Obtención de Datos en #BigData
PDF
2016 ULL Cabildo KEEDIO - Como se empieza
PPTX
Big Data: conceptos generales e impacto en los negocios
2016 ULL Cabildo KEEDIO - Arquitecturas Big Data
2016 ULL Cabildo KEEDIO - KEEDIO DATA STACK
2016 ULL Cabildo KEEDIO - BigData
Big Data Architecture con Pentaho
Big Data en el entorno Bancario
Obtención de Datos en #BigData
2016 ULL Cabildo KEEDIO - Como se empieza
Big Data: conceptos generales e impacto en los negocios

La actualidad más candente (20)

PDF
Big Data, Big Customer Value, Big Results
PDF
Business Analytics 101
PPTX
Anatomía de un proyecto de Big Data
PPTX
Desmitificando el Big Data
PDF
Cómo empezar a implementar proyectos Big Data en tu organización
PDF
Data Science - Analítica Predictiva y Evolución de BI
PDF
Tecnologías exponenciales
PPTX
Big data, Big Objects
PPTX
El impacto de las tecnologías BIGDATA en los procesos de analítica y segurida...
PPTX
Presentación semana académica unam big data abril 2015
PPTX
Exploradata - A new BigData Company
PPTX
Cómo implementar una solución Big Data
PPTX
Desmitificando un proyecto de Big Data
PPTX
Big Data para analizar las redes sociales
PDF
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
PPT
Open Source Business Intelligence 2013 (spanish)
PPTX
Introducción a Big Data. HDInsight - Webcast Technet SolidQ
PPT
Overview sap bo girona nib efimatica
PDF
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
PDF
¿Cómo afianzar la transformación digital con APIs de datos en tiempo real?
Big Data, Big Customer Value, Big Results
Business Analytics 101
Anatomía de un proyecto de Big Data
Desmitificando el Big Data
Cómo empezar a implementar proyectos Big Data en tu organización
Data Science - Analítica Predictiva y Evolución de BI
Tecnologías exponenciales
Big data, Big Objects
El impacto de las tecnologías BIGDATA en los procesos de analítica y segurida...
Presentación semana académica unam big data abril 2015
Exploradata - A new BigData Company
Cómo implementar una solución Big Data
Desmitificando un proyecto de Big Data
Big Data para analizar las redes sociales
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
Open Source Business Intelligence 2013 (spanish)
Introducción a Big Data. HDInsight - Webcast Technet SolidQ
Overview sap bo girona nib efimatica
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
¿Cómo afianzar la transformación digital con APIs de datos en tiempo real?
Publicidad

Destacado (20)

PPTX
Culturas del peru
PDF
Presentacion maysac COMPLETA 2016
PDF
Can Bonastre - Wellness
PDF
Iam muslim ger
DOC
D Leech CFA
PDF
Programación Festival Quindiano de Cine y Video en la Universidad del Quindío
PDF
La presión arterial y su salud
PPTX
Programa Diana
PPTX
Gender issues
PDF
Zwischenbilanz
PPTX
Die Flugblattaktion der Geschwister Scholl
DOC
Nuestra familia apostólica alemán
PPTX
Cátedra upc grupo 13 contaduría publica
PDF
Cont-Ex Consulting Leistungsprofil - Controlling Excellence Beratung & Interi...
PDF
Der ultimative leitfaden für mehr sicherheit auf facebook
PPTX
Systemische Demenz
PPT
PDF
TFM PDF - Kaylee
PDF
La vida en el hogar 2015; Estudio IKEA, La vida en el hogar
PPTX
Demandas contra el estado y la republica
Culturas del peru
Presentacion maysac COMPLETA 2016
Can Bonastre - Wellness
Iam muslim ger
D Leech CFA
Programación Festival Quindiano de Cine y Video en la Universidad del Quindío
La presión arterial y su salud
Programa Diana
Gender issues
Zwischenbilanz
Die Flugblattaktion der Geschwister Scholl
Nuestra familia apostólica alemán
Cátedra upc grupo 13 contaduría publica
Cont-Ex Consulting Leistungsprofil - Controlling Excellence Beratung & Interi...
Der ultimative leitfaden für mehr sicherheit auf facebook
Systemische Demenz
TFM PDF - Kaylee
La vida en el hogar 2015; Estudio IKEA, La vida en el hogar
Demandas contra el estado y la republica
Publicidad

Similar a 2016 ULL Cabildo KEEDIO - Proyecto y Roles Big Data (20)

PDF
Diseño de base de datos clase de mongo db
PDF
Electiva
PDF
Clase No.2 - Generalidades y Tecnologias .pdf
PDF
Operations & Data Graph
PPTX
Tercera Jornada de BI y analítica aplicada a tu negocio.pptx
PDF
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
PDF
Cloud Native Galicia: DataOps y MLOps: ¿Qué y para qué?
PPTX
Data lake y virtualización. Ejes para una arquitectura abierta en big data v6
PPT
Universidad de Concepción - EDUTIC 2011
PDF
Departamento IT (Metodologías predictivas vs ágiles)
PDF
Cbs big data-fundamentals-1
PDF
Operational Data Graph: Un enfoque innovador para optimizar las operaciones d...
PDF
Aplicaciones de BI con Pentaho
PPTX
Curso : Inteligencia de Negocios - Dia1
PDF
Charla Pentaho - UTN
PPTX
Claves para entender el actual big data
PPTX
Inteligencia de negocio en la nube, una realidad palpable!!!
PPTX
Big Data - Desarrollando soluciones efectivas
PPTX
Microsoft Business Analytics 2013
Diseño de base de datos clase de mongo db
Electiva
Clase No.2 - Generalidades y Tecnologias .pdf
Operations & Data Graph
Tercera Jornada de BI y analítica aplicada a tu negocio.pptx
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
Cloud Native Galicia: DataOps y MLOps: ¿Qué y para qué?
Data lake y virtualización. Ejes para una arquitectura abierta en big data v6
Universidad de Concepción - EDUTIC 2011
Departamento IT (Metodologías predictivas vs ágiles)
Cbs big data-fundamentals-1
Operational Data Graph: Un enfoque innovador para optimizar las operaciones d...
Aplicaciones de BI con Pentaho
Curso : Inteligencia de Negocios - Dia1
Charla Pentaho - UTN
Claves para entender el actual big data
Inteligencia de negocio en la nube, una realidad palpable!!!
Big Data - Desarrollando soluciones efectivas
Microsoft Business Analytics 2013

Último (20)

PDF
Más Allá de la Autenticación: Gestión Moderna de Identidad en el sector Finan...
PPTX
seguridad digital ,paloma bernabe alvarez.
PDF
Ciberataques, Normativas y Protección: Ayudando a las Entidades Financieras a...
DOCX
Conceptos básicos de programación PseInt laura.docx
PPTX
VariablesExpresiones.pptx conceptos que puedes usar en c++
PDF
Herramientas-de-Recuperacion-de-Datos.pdf
PDF
EL RESPETO mejororado para aprender .pdf
PDF
004-CC2014-Irrigacion Mbb equinos del mundo
PDF
PLAN DE ASEGURAMIENTO CURSOS CORTOS 2024.pdf
PPTX
Redes neuronales artificiales y como entrenarlas
PDF
Sociedad y ética digital en inteligencia artificial
PDF
Conceptos básicos de programación PseInt laura.pdf
PPTX
LEGALIZACIÓN Y VERIFICACIÓN DE UN APARATO TAXÍMETRO
PDF
Control total para proteger tus activos en base al riesgo
PDF
conceptosbsicosdeprogramacinpseintlaura.pdf
PDF
Gtd Infraestructura Digital de Misión Critica
PDF
Introducción a REALITY (agosto de 2024).pdf
PDF
¿Qué hace un Data Warehouse Engineer blog.victorsantiz.com.pdf
PPTX
en este libro encontrarás la lectura inicial para tus niños
PPTX
Del SIEM Tradicional al SOC del Futuro: La Evolución Inteligente
Más Allá de la Autenticación: Gestión Moderna de Identidad en el sector Finan...
seguridad digital ,paloma bernabe alvarez.
Ciberataques, Normativas y Protección: Ayudando a las Entidades Financieras a...
Conceptos básicos de programación PseInt laura.docx
VariablesExpresiones.pptx conceptos que puedes usar en c++
Herramientas-de-Recuperacion-de-Datos.pdf
EL RESPETO mejororado para aprender .pdf
004-CC2014-Irrigacion Mbb equinos del mundo
PLAN DE ASEGURAMIENTO CURSOS CORTOS 2024.pdf
Redes neuronales artificiales y como entrenarlas
Sociedad y ética digital en inteligencia artificial
Conceptos básicos de programación PseInt laura.pdf
LEGALIZACIÓN Y VERIFICACIÓN DE UN APARATO TAXÍMETRO
Control total para proteger tus activos en base al riesgo
conceptosbsicosdeprogramacinpseintlaura.pdf
Gtd Infraestructura Digital de Misión Critica
Introducción a REALITY (agosto de 2024).pdf
¿Qué hace un Data Warehouse Engineer blog.victorsantiz.com.pdf
en este libro encontrarás la lectura inicial para tus niños
Del SIEM Tradicional al SOC del Futuro: La Evolución Inteligente

2016 ULL Cabildo KEEDIO - Proyecto y Roles Big Data

  • 1. Roles y Proyectos Big Data Daniel Tardón [email protected] @danikeedio
  • 2. ROLES EN BIG DATA PRINCIPALES NUEVOS ACTORES EN LOS PROYECTOS BIG DATA
  • 3. Solving Big Data Issues ROLES EN BIG DATA Data Engineer Data Scientist Architect DevOps Project/Data Science Manager CDO
  • 4. Solving Big Data Issues Principalmente se dedican a la construcción de diferentes elementos como las BBDD, algunos servicios/servidores, los algoritmos que acaban corriendo en producción y se encargan de proporcionar datos para el posterior análisis. Hacen menos de la analítica real – Hecha por el Data Scientist INGENIERO DE DATOS: PERFIL Y TAREAS DATA ENGINEER <trabaja con/mantiene> Arquitectura Big Data Infraestructura Datos HW/SW
  • 5. Solving Big Data Issues Analiza, visualiza y comunica los resultados a los Data Managers y otros roles en la organización. DATA SCIENTIST: PERFIL Y TAREAS DATA SCIENTIST Limpieza de Datos Prototipado de Algoritmos Comunicación de los hallazgos Análisis de Datos
  • 6. Solving Big Data Issues DATA SCIENTIST: EN BÚSQUEDA DE UNICORNIOS
  • 7. Solving Big Data Issues Diseñar basándose en el objetivo final de una infraestructura que está destinada a, garantizar la interoperabilidad sin fisuras entre todos los componentes, coordinar la configuración de los cambios. Conocimiento de administración de sistemas y desarrollo software. ARQUITECTO BIG DATA: PERFIL Y TAREAS ARCHITECT <perspectiva abajo-arriba> GRAN FOTO Diseño de los pipelines de datos: Seleccionar los módulos y herramientas apropiados. ATENCIÓN A LOS DETALLES Consciente de los desafios de integración y los posibles problemas de ajuste en los rendimientos
  • 8. Solving Big Data Issues Su nombre viene a raíz de una metodología. Puede jugar un papel de ingeniero de operaciones o como un desarrollador con perspectiva global de sistemas y software juntos. DEVOPS: PERFIL Y TAREAS DevOps Ciclo de vida de la ingeniería del SW OPERACIONES Administración y Sysconfig Integración y QA <Desarrollo Agile>
  • 9. Solving Big Data Issues MANAGER: PERFIL Y TAREAS Foto técnica: infraestructura, SW, matemáticas, estadística y ML. Gestión: Objetivos y prioridades, control del proceso global, interfaz con otros departamentos, grupos y clientes. PROJECT/DATA SCIENCE MANAGER <perspectiva global> Gran foto técnica Gestión
  • 10. Solving Big Data Issues Gobierno: Calidad del dato, normativa y regulaciones. Estrategia: Convertir la información en ingresos o activos. Es el profesional de más alto rango en la compañía (a nivel de gestión de datos) Normalmente reporta directamente al CEO (Chief Executive Officer) CDO (CHIEF DATA OFFICER): PERFIL Y TAREAS Gobierno del Dato Estrategia alrededor de los datos CDO – CHIEF DATA OFFICER
  • 11. Solving Big Data Issues 11Solving Big Data Issues ¿QUÉ PASA EN 1 MINUTO EN INTERNET? Actividad Mundial en Internet en 2016 60SEGUNDOS 69.444 horas visionadas 701.389 logins en Facebook 527.760 fotos compartidas en Snapchat 51.000 descargas desde App Store 2,78 millones de vídeos vistos 972.222 swipes en Tinder 2,4 millones de búsquedas +120 cuentas nuevas de Linkedin 203.596$ en ventas 38.052 horas de música en Spotify 347.222 nuevos tuits 38.194 posts 1.389 carreras 150 millones emails enviados +20,8 millones de mensajes en Whatsapp 1,04 millones de loops en Vine
  • 12. Solving Big Data Issues 12 Todo lo que se pueda digitalizar se digitalizará Todo lo que se pueda conectar se conectará Todo lo que se pueda analizar se analizará Solving Big Data Issues
  • 13. Solving Big Data Issues 13 IT Y NEGOCIO DEBEN ESTAR ALINEADOS NO PUEDE SER QUE IT SOSTENGA EL NEGOCIO SIN LAS HERRAMIENTAS ADECUADAS IT
  • 14. CICLO DEL DATO FASES E INTERACCIÓN ENTRE LOS ROLES 14
  • 15. Solving Big Data Issues CICLO DEL DATO 001 101 01 0 1 1 11 1 01 10 i 1. ANALYSIS AND DESIGN 2. PLATAFORM DEPLOYMENT 5. DATA PROCESSING 4. SECURITY DATA GOVERNANCE 3. DATA INGESTION 6. ANALYTICS 7. DATA VISUALIZATION/EXPLOITATION Casos de Uso Estado del Arte Arquitectura Architect Data Scientist DS Manager KEEDIO Data Stack Proveedores Cloud On-Premise Architect Data Engineer DevOps Real Time Batch OpStore (NoSQL) DevOps Data Engineer BI Analytics Machine Learning Analítica Exploratoria Data Scientist Data Engineer BI Tools OLAP Sistemas Externos UI/DevOps Data Scientist Legacy BI Autenticación Trazabilidad Linaje CDO DS Manager Data Engineer DevOps Identificación Recolección Enriquecimiento Data Engineer DevOps Data Scientist
  • 17. Solving Big Data Issues 17 FASES DE PROYECTO – MODELO CLÁSICO – HITOS BIG DATA
  • 19. Solving Big Data Issues 19 CLAVES DE SCRUM
  • 20. Solving Big Data Issues 20 SENTIDO COMÚN Y FLEXIBILIDAD SCRUM XTREME PROGRAMMING KANBAN SCRUMBAN MANY MORE… METODOLOGÍAS ÁGILES
  • 21. RESUMEN Lo que es Big Data y su futuro La cadena de valor de Big Data Casos de uso – Con éxitos y fracasos Roles de Big Data y el cambio en las organizaciones Cómo lo hacemos: Con una plataforma y metodología
  • 24. Calle Virgilio 25 Edificio Ayessa I, Bajo D Pozuelo de Alarcón 28223 Madrid @[email protected] keedio