Inteligencia Artificial ( )
en la atención sanitaria del
futuro
dr. florentino fdez-riverola
riverola@uvigo.es
http://sing-group.org/
Agenda
 Informática Médica
 Definición, ámbitos
 Conocimiento + Capacidad de procesamiento (inteligente)
 Inteligencia Artificial
 Definición de IA
 strong (sustituir) VS weak IA (facilitar)
 Técnicas y métodos comúnmente empleados
 De la teoría a la práctica (IA en medicina)
 Informática clínica: InNoCBR, PolyDeep
 Informática para investigación clínica: PathJam, WhichGenes
 Bioinformática traslacional: Genómica (ALTER), Proteómica (DPD, BI, BS,
Mlibrary, Mass-Up) e integración de datos ÓMICOS (PunDrugs)
 Informática en salud pública: CURMIS4th
 Futuro
 IA interpretable y Human-In-The-Loop
 Conclusiones 2
Informática Médica
3
As defined by the U.S. National Library of Medicine,
health informatics is
the interdisciplinary study of the design,
development, adoption, and application of IT-based
innovations in healthcare services delivery,
management, and planning.
Informática médica
ámbitos
4
INFORMÁTICA APLICADA A LA SALUD DE LOS CONSUMIDORES INFORMÁTICA EN SALUD PÚBLICA
INFORMÁTICA CLÍNICA / OPERACIONAL
INFORMÁTICA APLICADA A INVESTIGACIÓN CLÍNICA BIOINFORMÁTICA TRASLACIONAL
5
http://techtub.in/when-healthcare-and-computer-science-come-together-infographic/
Informática médica
elementos constituyentes
INFORMÁTICA
CLÍNICA
INFORMÁTICA APLICADA
A INVESTIGACIÓN
CLÍNICA
BIOINFORMÁTICA
TRASLACIONAL
Conocimiento
bases de datos públicas
6
Genómicas Proteómicas
Secuencias
Genomas completos
Redes de interacción
Centradas en genes
Datos experimentales
Ontologías
Proteína-Proteína
Rutas metabólicas
Bibliográficas (biblioma)
Proteínas
Estructura de proteínas
Dominios de proteínas
As of 8 February 2015, PubMed has over 24.6 million records going back to 1966, selectively to the year 1865, and very
selectively to 1809; about 500,000 new records are added each year. Today over 30 million citations from biomedical literature
Conocimiento
Historia Clínica Electrónica
7
https://www.visualcapitalist.com/big-data-healthcare/
Conocimiento
retos
8
https://www.visualcapitalist.com/big-data-healthcare/
Inteligencia Artificial
9
strong | weak
“AI is whatever hasn't been done yet.”
Tesler's Theorem
http://www.nomodes.com/Larry_Tesler_Consulting/Adages_and_Coinages.html
10
"The automation of activities
that we associate with human
thinking, activities such as
decision making, problem
solving, learning.“
Bellman, 1978
"The study of mental facilities
through the use of computational
models.“
Charniak and McDermott, 1985
"The study of how to make computers do
things at which, at the moment, people
are better.“
Rick and Knight, 1991
"The branch of computer
science that is concerned with
the automation of intelligent
behaviour.“
Luger and Stubblefield, 1993
PROCESAMIENTO INTELIGENTE DE CONOCIMIENTO
IA
definición
strong IA: aprendizaje y adaptación
trata de dar respuesta a …
11
Turing, A.M. (1950). Computing machinery and intelligence. Mind, 59, 433-460.
 ¿Puede una máquina actuar de forma inteligente?, ¿puede
abordar/resolver cualquier problema que una persona
resolvería pensando?
 ¿Son la inteligencia humana y computacional lo mismo?, ¿el
cerebro humano se comporta esencialmente como un
computador?
 ¿Puede una máquina tener … mente, estados mentales y
consciencia del mismo modo que los humanos?, ¿puede
sentir cómo son las cosas?
weak IA: simulación de
comportamiento inteligente se basa en…
12
 Representación del conocimiento + Búsqueda
 problema real → problema tratable computacionalmente
 de la mejor solución posible (desconocida)
IA
técnicas y métodos
13
 ANN: Artificial Neural Networks – DL: Deep Learning
 Problemas de predicción, clasificación y agrupamiento
 CBR: Case-Based Reasoning
 Sistemas de apoyo al diagnóstico clínico y toma de decisiones
 MAS: MultiAgent Systems
 Inteligencia ambiental y simulación de entornos sociales
 FL: Fuzzy Logic - BN: Bayesian Networks - RS: Rough Sets
 Manejo de incertidumbre. Información incompleta y/o imprecisa
 DW: Data Warehousing - DM: Data Mining
 Almacenamiento y análisis de grandes cantidades de datos
(genómicos, proteómicos, etc.)
 IR: Information Retrieval - TM: Text Mining
 Procesamiento automático de grandes corpus de documentos
14
Casos de estudio
de la teoría a la práctica
15
INFORMÁTICA
CLÍNICA
INFORMÁTICA APLICADA
A INVESTIGACIÓN
CLÍNICA
BIOINFORMÁTICA
TRASLACIONAL
“By better integrating big data analytics into
healthcare, the industry could save $300bn a
year – that’s the equivalent of reducing the
healthcare costs of every man, woman and child
by $1,000 a year.”
Wikibon Blog
INFORMÁTICA EN
SALUD PÚBLICA
Informática clínica
16
InNoCBR
introducción
17
 Sistema inteligente de búsqueda y clasificación de casos de
Infección Nosocomial (IRAS)
 Proyecto coordinado UVigo-CHUO financiado por la Xunta
de Galicia [2010-2013] con 143.602,25 €
 Después de 4 años de desarrollo y 6 de implantación y
mejora, InNoCBR es marca comercial (2017) y forma parte
de la cartera de aplicaciones corporativas del SERGAS
 CHUO - alto impacto económico, sanitario y social:
 Capacidad media de 800 pacientes
 1122 análisis de microbiología / día (2.5 millones en total)
 181 prescripciones de antibioticos /día (3.5 millones en total)
 3000 comentarios de enfermería /día (12.5 millones en total)
 Validación 2016: Gold Standard de 938 posibles casos de IRAS
 Automático: 70.83% Sen. - 97.76% Esp. - 77.24% VPP - 0.67 Kappa
 Semi-automatico: 81.73% Sen. / 99.47% Esp. - 94.33% VPP
InNoCBR
funcionamiento del Sistema Inteligente
18
Datos de co-Leucocitos
Datos de t-Leucocitos
Datos de co-Flora bacteriana
MICROBIOLOGÍA
FARMACIA
Eliminación
de ruido
ENFERMERÍA
CLÍNICA
RADIOLOGÍA
LABORATORIO
Comentarios de enfermería
Valores de fiebre
Datos de vías centrales
Datos de vías periféricas
Datos de sondas vesicales
Datos del paciente
Datos del episodio actual y episodios cercanos
Datos de cirugías en un mes
Datos de prótesis en un año
Datos de pruebas médicas
Datos de traslados durante el episodio
Datos de todo tipo de radiologías
TAREA
PROGRAMADA
EXTRACCIÓN
DE
EVIDENCIAS
DIAGNÓSTICO INTELIGENTE
CAPTACIÓN DE CASOS
BASE DE CONOCIMIENTO
WHEN
EV1 AND NOT EV2
THEN
INFECTION-A
WHEN
EV1 AND NOT EV2
THEN
INFECTION-A
WHEN
EV1 AND NOT EV2
THEN
INFECTION-A
Reglas de
clasificación
CASOS
Modelos NLP
entrenados
usan
Diccionario
de términos
usan
M B V S C E I
M B V S C E I
M B V S C E I
Recuperación
Reutilización
Revisión
Aprendizaje
LISTADO DE
IRAS
CANDIDATAS
IDENTIFICACIÓN
Y
CLASIFICACIÓN
DE IRAS
InNoCBR
características
19
 Sistema CBR (razonamiento basado en casos) que combina
 motor de reglas (casos donde el experto proporciona conocimiento)
 extractor automático de reglas (obtiene conocimiento de casos
previos)
 Utiliza NLP (procesamiento de lenguaje natural)
 análisis automático de comentarios de enfermería para valorar si
contienen indicios de infección
 Algoritmos de clasificación
 Naïve Bayes, J48, k-NN
 Capacidad de aprendizaje
 a partir de los diagnósticos del personal especializado
 Automatización total de captación de casos y evidencias
 Unificar en todos los hospitales intensidad de búsqueda y
criterios
 comparación de indicadores de forma fiable
InNoCBR
20
.org
[sistema inteligente de detección y clasificación en tiempo
real de lesiones colorrectales mediante deep learning]
21
Proyecto Tareas
Implantación
Equipo
22
BANCO DE
IMÁGENES
.org
[sistema inteligente de detección y clasificación en tiempo
real de lesiones colorrectales mediante deep learning]
23
.org
[sistema inteligente de detección y clasificación en tiempo
real de lesiones colorrectales mediante deep learning]
Informática aplicada a
investigación clínica
24
PathJam
[www.pathjam.org]
25
 Análisis de listas de genes de interés en pathways de
múltiples fuentes
• Colaboración con el CNIO
• Reconocimiento de varios espacios de nombres
para genes (ensembl, entrez, swiss-prot,
probesets)
• Data-warehousing de los pathways de KEGG,
Reactome, NCI-PID y Biocarta
• Grafos interactivos y exportables
• Análisis estadístico funcional (estilo DAVID o
FatiGO+)
WhichGenes
[www.whichgenes.org]
26
 Extracción/construcción de listas de genes a partir
de múltiples fuentes
• Colaboración con el CNIO
• Unificación de identificadores
• Soporta operadores sobre conjuntos
• Posibilidad de exportar los conjuntos generados
en múltiples formatos
• Enlace directo con
• Extracción directa de la fuente en el momento
de la solicitud
27
Bioinformática
traslacional
ALTER
[sing-group.org/ALTER]
28
 Estudio de árboles filogenéticos
• Conversión de ficheros de alineamiento multiple
de secuencias (MSA) e identificación de
haplotipos
• Flujo de trabajo en 4 pasos guiado por asistente
• Multiplataforma: Internet Explorer 7, Firefox 3,
Opera 9.62, Google Crome 3.0.195.38 y Safari 3
bajo Windows XP/Vista, Ubuntu Linux 8.04
version and Mac OSX 10.6
Herramientas de soporte
en proteómica
29
 DPD: Decision Peptide-Driven
Herramienta para la identificación rápida de proteinas y
cuantificación utilizando O16 y O18
 BI: Bacterial Identification
Herramienta para identification rápida de casos de
tuberculosis mediante mapeo de masas de péptidos
 BS: Biomarker Search
Herramienta para el descubrimiento de biomarcadores
mediante cuantificación de proteinas
 Mlibrary: Mass Library
Herramienta y base de datos para la identificación rápida
de esteroides anabolicoandrogénicos
 Mass-Up
Aplicación “todo en uno” para el descubrimiento de
nuevo conocimiento a partir de espectrometría de masas
utilizando MALDI-TOF
30
PanDrugs
[www.pandrugs.org]
 Mediante Microarrays o NGS se obtienen listas de
alteraciones moleculares:
• Cuáles dirigen el tumor? y, de ellas...
• Cuáles son accionables? y, de ellas...
• Cómo priorizar la lista de posibles fármacos?
Informática
en salud pública
31
[Machine learning-based models to detect and curb Health
misinformation on social media]
32
Proyecto Propuesta
Equipo
 Dra. Beatriz Villamarín Bello
médica atención primaria – Área sanitaria de
A Coruña y Cee
 Dra. Noelia Estévez Rionegro
doctora en lingüística
EPOs
33
IA interpretable
“The future of AI lies in enabling people to
collaborate with machines to solve complex
problems. Like any efficient collaboration, this
requires good communication, trust and
understanding.”
Explainable AI Research Lead
Accenture Labs
https://www.accenture.com/gb-en/insights/technology/explainable-ai-human-machine
34
A. Barredo Arrieta, N. Díaz-Rodríguez, J. Del Ser, A. Bennetot, S. Tabik, A. Barbado, S. Garcia, S. Gil-Lopez, D. Molina, R. Benjamins, R. Chatila, F. Herrera
Explainable Artificial Intelligence (XAI): Concepts, taxonomies, opportunities and challenges toward responsible AI.
Information Fusion (June 2020) 58:82-115. ISSN 1566-2535. DOI: 10.1016/j.inffus.2019.12.012
IA interpretable
introducción
 En decisiones de sistemas basados en IA que
afectan a vidas humanas se necesita
transparencia
 medicina, defensa, justicia, etc.
 Compromiso entre rendimiento y
transparencia
 black-box (opaco) VS inteligible
 El considerar la interpretabilidad como un
objetivo de diseño aporta ventajas:
 garantiza imparcialidad en la toma de
decisiones (correct from bias)
 incrementa robustez detectando
inconsistencias
 posibilita que sólo se tengan en cuenta
variables relevantes (truthful causality)
35
A. Barredo Arrieta, N. Díaz-Rodríguez, J. Del Ser, A. Bennetot, S. Tabik, A. Barbado, S. Garcia, S. Gil-Lopez, D. Molina, R. Benjamins, R. Chatila, F. Herrera
Explainable Artificial Intelligence (XAI): Concepts, taxonomies, opportunities and challenges toward responsible AI.
Information Fusion (June 2020) 58:82-115. ISSN 1566-2535. DOI: 10.1016/j.inffus.2019.12.012
IA interpretable
evolución y objetivo
 Generar avances en las técnicas de ML para conseguir…
 producir modelos fácilmente interpretables manteniendo un alto nivel de rendimiento en
su aprendizaje (high prediction accuracy).
 garantizar que los humanos puedan entender fácilmente, confiar de forma segura y
manejar de forma efectiva la nueva generación de partners inteligentes
36
A. Barredo Arrieta, N. Díaz-Rodríguez, J. Del Ser, A. Bennetot, S. Tabik, A. Barbado, S. Garcia, S. Gil-Lopez, D. Molina, R. Benjamins, R. Chatila, F. Herrera
Explainable Artificial Intelligence (XAI): Concepts, taxonomies, opportunities and challenges toward responsible AI.
Information Fusion (June 2020) 58:82-115. ISSN 1566-2535. DOI: 10.1016/j.inffus.2019.12.012
IA interpretable
¿hacia dónde se evoluciona?: áreas de mejora de los modelos de ML existentes
37
Human in the loop
“Computers are incredibly fast, accurate, and stupid;
humans are incredibly slow, inaccurate, and brilliant;
together they are powerful beyond imagination.”
Albert Einstein
“…The future of AI lies in enabling people to
collaborate with machines to solve complex
problems…
38
https://hackernoon.com/what-is-human-in-the-loop-for-machine-learning-2c2152b6dfbb
Humanistic Intelligence
definición, marco conceptual
Human In The Loop
=
SML + AL
 Se basa en la creación de inteligencia como resultado de un ciclo iterativo de
reatroalimentación (feedback) entre un proceso computacional y un humano
Supervised Machile Learning
Active Learning
39
Conclusiones
40
“Computers are incredibly fast, accurate, and stupid;
humans are incredibly slow, inaccurate, and brilliant;
together they are powerful beyond imagination.”
Albert Einstein
Lecciones aprendidas…
después de 16 años de desarrollo [2006-2021]
strong IA
weak IA
 Informática (tecnología) + IA (ciencia) tienen mucho
potencial en el ámbito de la salud
 proactividad: búsqueda de problemas y nuevos retos
41
 Fundamental la creación de equipos de trabajo de carácter
multidisciplinar
 todo el mundo tiene algo valioso que aportar y se necesita personal
formado y motivado, como vosotros …
 SNS y la Universidad son un muy buen lugar para iniciarse en
investigación
 No todo son casos de éxito, ni siempre existe recompensa
 pero es parte de nuestro compromiso con la sociedad y merece la
pena intentarlo
¡gracias por
vuestra
curiosidad!
Informática clínica
43
geneCBR
[www.genecbr.org]
44
 Sistema de apoyo al diagnóstico de cáncer basado
en microarrays de ADN
• Colaboración con el CHUS y CIC
• 3 Modos de funcionamiento:
– Modo diagnóstico. Para el oncólogo
– Modo experto. Ajuste de técnicas de IA
– Modo programación. Prueba de prototipos nuevos
• Técnicas de IA empleadas
– DFP para selección de genes discriminantes
– GCS para clasificación
geneCBR
[www.genecbr.org]
45
 Muestras de médula osea pertenecientes a 43 pacientes
adultos con Leucemia Mieloide Aguda + 6 individuos sanos
 10 patients with Acute Promyelocytic Leukemia [APL]
 4 patients with Acute Myeloid Leukemia with inv(16) [AML-inv(16)]
 7 patients with Acute Monocytic Leukemia [AML-mono]
 22 patients with Acute non-Monocytic Leukemia [AML-other]
 6 samples belonging to sane individuals [control samples]
 Volumen de la información manejada
 Cada microarray contiene 22.283 ESTs (≡ genes)
 49 microarrays = 1.091.867 valores de expresión genética
 Datos disponibles en la actualidad
 150 microarrays (Human Genome 133A) + 210 microarrays (Human Genome -
plus)
BioAnnote
[sing-group.org/bioannote]
46
 Aplicación capaz de anotar textos biomédicos
utilizando diferentes recursos on-line como
Medlineplus y Freebase
• Colaboración con UEM (Grado de Medicina) para
el análisis de casos clínicos por parte de los
estudiantes
• El usuario introduce documentos y obtiene
anotación de términos relevantes
(enfermedades, síntomas, tratamientos)
• Recuperación automática de información
detallada sobre cada entidad reconocida (topics
relacionados, enlaces externos, bibliografía de
relevancia, resúmenes de artículos, etc.)
Informática aplicada a
investigación clínica
47
WhichModel
[www.whichmodel.org]
48
 Estudio del poder discriminante en problemas de
clasificación de hipótesis establecidas utilizando
conjuntos de genes relevantes biológicamente
• Integrado con
• Soporta Naïve Bayes, Decision trees, k-NN y
SVM
• Asistente para la creación de experimentos en
2 sencillos pasos
• Ejecución paralela en el servidor de cálculo
• Notificación por e-mail con enlaces directos a
los resultados en el servidor
GeneCommittee
[sing-group.org/GC]
49
 Mezcla de clasificadores ‘especialistas’ en el
manejo de distintos conjuntos de genes relevantes
biológicamente
• Colaboración con Univ. Aveiro (Portugal)
• Integrado con (enriquecimiento)
• Soporta datos de DNA microarray y RNA-Seq
Antimicrobial Combination
Network[sing-group.org/antimicrobialCombination/]
50
 Red semántica de combinaciones antimicrobianas
testeadas experimentalmente contra infecciones de
Pseudomonas aeruginosa
• Colaboración con Univ. do Minho (Portugal)
• Incluye 239 combinaciones de AMPs y distintos
agentes antimicrobianos
• Reconstrucción sistemática combina minería
de textos, curación manual y análisis de grafos
BEW[Biofilms Experiment Workbench]
[sing-group.org/bew]
51
 Gestión de datos y experimentos de biofilms entre
distintos laboratorios
• Colaboración con Univ. do Minho (Portugal)
• Permite importar/exportar datos en .xls
• Ejecución de tests estadísticos y generación de
gráficas
• Generación de informes HTML sobre los datos
• Comparación de experimentos entre
laboratorios → Inter Laboratory Experiment
• Herramienta oficial de BiofOmics (banco de
datos de biofilms pertenecientes a Salmonella,
Escherichia, Candida, etc.)
@Note Marky
[sysbio.di.uminho.pt/anote/wiki] [sing-group.org/marky]
52
53
Bioinformática
traslacional
PileLine
[sing-group.org/pileline]
54
 Manejo de datos procedentes de análisis de
Ultra-Secuenciación
• Colaboración con CNIO
• Procesado rápido de nuevos ficheros de posición
genómica
– Búsqueda ultra-rápida
– Comparación de dos muestras para
encontrar mutaciones somáticas
• Incorpora un visor genómico de escritorio
ADOPS
[sing-group.org/ADOPS]
55
 Automatiza un flujo de trabajo para la detección
automática de sitios seleccionados positivamente
(detección de mutaciones)
• Colaboración con IBMC
• Integra T-Coffee, MrBayes y CodeML
• Utiliza ALTER para la conversion de formatos
entre distintos programas
• Proporciona múltiples resúmenes y vistas de los
resultados

Inteligencia Artificial en la atención sanitaria del futuro

  • 1.
    Inteligencia Artificial () en la atención sanitaria del futuro dr. florentino fdez-riverola [email protected] http://sing-group.org/
  • 2.
    Agenda  Informática Médica Definición, ámbitos  Conocimiento + Capacidad de procesamiento (inteligente)  Inteligencia Artificial  Definición de IA  strong (sustituir) VS weak IA (facilitar)  Técnicas y métodos comúnmente empleados  De la teoría a la práctica (IA en medicina)  Informática clínica: InNoCBR, PolyDeep  Informática para investigación clínica: PathJam, WhichGenes  Bioinformática traslacional: Genómica (ALTER), Proteómica (DPD, BI, BS, Mlibrary, Mass-Up) e integración de datos ÓMICOS (PunDrugs)  Informática en salud pública: CURMIS4th  Futuro  IA interpretable y Human-In-The-Loop  Conclusiones 2
  • 3.
    Informática Médica 3 As definedby the U.S. National Library of Medicine, health informatics is the interdisciplinary study of the design, development, adoption, and application of IT-based innovations in healthcare services delivery, management, and planning.
  • 4.
    Informática médica ámbitos 4 INFORMÁTICA APLICADAA LA SALUD DE LOS CONSUMIDORES INFORMÁTICA EN SALUD PÚBLICA INFORMÁTICA CLÍNICA / OPERACIONAL INFORMÁTICA APLICADA A INVESTIGACIÓN CLÍNICA BIOINFORMÁTICA TRASLACIONAL
  • 5.
  • 6.
    Conocimiento bases de datospúblicas 6 Genómicas Proteómicas Secuencias Genomas completos Redes de interacción Centradas en genes Datos experimentales Ontologías Proteína-Proteína Rutas metabólicas Bibliográficas (biblioma) Proteínas Estructura de proteínas Dominios de proteínas As of 8 February 2015, PubMed has over 24.6 million records going back to 1966, selectively to the year 1865, and very selectively to 1809; about 500,000 new records are added each year. Today over 30 million citations from biomedical literature
  • 7.
  • 8.
  • 9.
    Inteligencia Artificial 9 strong |weak “AI is whatever hasn't been done yet.” Tesler's Theorem http://www.nomodes.com/Larry_Tesler_Consulting/Adages_and_Coinages.html
  • 10.
    10 "The automation ofactivities that we associate with human thinking, activities such as decision making, problem solving, learning.“ Bellman, 1978 "The study of mental facilities through the use of computational models.“ Charniak and McDermott, 1985 "The study of how to make computers do things at which, at the moment, people are better.“ Rick and Knight, 1991 "The branch of computer science that is concerned with the automation of intelligent behaviour.“ Luger and Stubblefield, 1993 PROCESAMIENTO INTELIGENTE DE CONOCIMIENTO IA definición
  • 11.
    strong IA: aprendizajey adaptación trata de dar respuesta a … 11 Turing, A.M. (1950). Computing machinery and intelligence. Mind, 59, 433-460.  ¿Puede una máquina actuar de forma inteligente?, ¿puede abordar/resolver cualquier problema que una persona resolvería pensando?  ¿Son la inteligencia humana y computacional lo mismo?, ¿el cerebro humano se comporta esencialmente como un computador?  ¿Puede una máquina tener … mente, estados mentales y consciencia del mismo modo que los humanos?, ¿puede sentir cómo son las cosas?
  • 12.
    weak IA: simulaciónde comportamiento inteligente se basa en… 12  Representación del conocimiento + Búsqueda  problema real → problema tratable computacionalmente  de la mejor solución posible (desconocida)
  • 13.
    IA técnicas y métodos 13 ANN: Artificial Neural Networks – DL: Deep Learning  Problemas de predicción, clasificación y agrupamiento  CBR: Case-Based Reasoning  Sistemas de apoyo al diagnóstico clínico y toma de decisiones  MAS: MultiAgent Systems  Inteligencia ambiental y simulación de entornos sociales  FL: Fuzzy Logic - BN: Bayesian Networks - RS: Rough Sets  Manejo de incertidumbre. Información incompleta y/o imprecisa  DW: Data Warehousing - DM: Data Mining  Almacenamiento y análisis de grandes cantidades de datos (genómicos, proteómicos, etc.)  IR: Information Retrieval - TM: Text Mining  Procesamiento automático de grandes corpus de documentos
  • 14.
    14 Casos de estudio dela teoría a la práctica
  • 15.
    15 INFORMÁTICA CLÍNICA INFORMÁTICA APLICADA A INVESTIGACIÓN CLÍNICA BIOINFORMÁTICA TRASLACIONAL “Bybetter integrating big data analytics into healthcare, the industry could save $300bn a year – that’s the equivalent of reducing the healthcare costs of every man, woman and child by $1,000 a year.” Wikibon Blog INFORMÁTICA EN SALUD PÚBLICA
  • 16.
  • 17.
    InNoCBR introducción 17  Sistema inteligentede búsqueda y clasificación de casos de Infección Nosocomial (IRAS)  Proyecto coordinado UVigo-CHUO financiado por la Xunta de Galicia [2010-2013] con 143.602,25 €  Después de 4 años de desarrollo y 6 de implantación y mejora, InNoCBR es marca comercial (2017) y forma parte de la cartera de aplicaciones corporativas del SERGAS  CHUO - alto impacto económico, sanitario y social:  Capacidad media de 800 pacientes  1122 análisis de microbiología / día (2.5 millones en total)  181 prescripciones de antibioticos /día (3.5 millones en total)  3000 comentarios de enfermería /día (12.5 millones en total)  Validación 2016: Gold Standard de 938 posibles casos de IRAS  Automático: 70.83% Sen. - 97.76% Esp. - 77.24% VPP - 0.67 Kappa  Semi-automatico: 81.73% Sen. / 99.47% Esp. - 94.33% VPP
  • 18.
    InNoCBR funcionamiento del SistemaInteligente 18 Datos de co-Leucocitos Datos de t-Leucocitos Datos de co-Flora bacteriana MICROBIOLOGÍA FARMACIA Eliminación de ruido ENFERMERÍA CLÍNICA RADIOLOGÍA LABORATORIO Comentarios de enfermería Valores de fiebre Datos de vías centrales Datos de vías periféricas Datos de sondas vesicales Datos del paciente Datos del episodio actual y episodios cercanos Datos de cirugías en un mes Datos de prótesis en un año Datos de pruebas médicas Datos de traslados durante el episodio Datos de todo tipo de radiologías TAREA PROGRAMADA EXTRACCIÓN DE EVIDENCIAS DIAGNÓSTICO INTELIGENTE CAPTACIÓN DE CASOS BASE DE CONOCIMIENTO WHEN EV1 AND NOT EV2 THEN INFECTION-A WHEN EV1 AND NOT EV2 THEN INFECTION-A WHEN EV1 AND NOT EV2 THEN INFECTION-A Reglas de clasificación CASOS Modelos NLP entrenados usan Diccionario de términos usan M B V S C E I M B V S C E I M B V S C E I Recuperación Reutilización Revisión Aprendizaje LISTADO DE IRAS CANDIDATAS IDENTIFICACIÓN Y CLASIFICACIÓN DE IRAS
  • 19.
    InNoCBR características 19  Sistema CBR(razonamiento basado en casos) que combina  motor de reglas (casos donde el experto proporciona conocimiento)  extractor automático de reglas (obtiene conocimiento de casos previos)  Utiliza NLP (procesamiento de lenguaje natural)  análisis automático de comentarios de enfermería para valorar si contienen indicios de infección  Algoritmos de clasificación  Naïve Bayes, J48, k-NN  Capacidad de aprendizaje  a partir de los diagnósticos del personal especializado  Automatización total de captación de casos y evidencias  Unificar en todos los hospitales intensidad de búsqueda y criterios  comparación de indicadores de forma fiable
  • 20.
  • 21.
    .org [sistema inteligente dedetección y clasificación en tiempo real de lesiones colorrectales mediante deep learning] 21 Proyecto Tareas Implantación Equipo
  • 22.
    22 BANCO DE IMÁGENES .org [sistema inteligentede detección y clasificación en tiempo real de lesiones colorrectales mediante deep learning]
  • 23.
    23 .org [sistema inteligente dedetección y clasificación en tiempo real de lesiones colorrectales mediante deep learning]
  • 24.
  • 25.
    PathJam [www.pathjam.org] 25  Análisis delistas de genes de interés en pathways de múltiples fuentes • Colaboración con el CNIO • Reconocimiento de varios espacios de nombres para genes (ensembl, entrez, swiss-prot, probesets) • Data-warehousing de los pathways de KEGG, Reactome, NCI-PID y Biocarta • Grafos interactivos y exportables • Análisis estadístico funcional (estilo DAVID o FatiGO+)
  • 26.
    WhichGenes [www.whichgenes.org] 26  Extracción/construcción delistas de genes a partir de múltiples fuentes • Colaboración con el CNIO • Unificación de identificadores • Soporta operadores sobre conjuntos • Posibilidad de exportar los conjuntos generados en múltiples formatos • Enlace directo con • Extracción directa de la fuente en el momento de la solicitud
  • 27.
  • 28.
    ALTER [sing-group.org/ALTER] 28  Estudio deárboles filogenéticos • Conversión de ficheros de alineamiento multiple de secuencias (MSA) e identificación de haplotipos • Flujo de trabajo en 4 pasos guiado por asistente • Multiplataforma: Internet Explorer 7, Firefox 3, Opera 9.62, Google Crome 3.0.195.38 y Safari 3 bajo Windows XP/Vista, Ubuntu Linux 8.04 version and Mac OSX 10.6
  • 29.
    Herramientas de soporte enproteómica 29  DPD: Decision Peptide-Driven Herramienta para la identificación rápida de proteinas y cuantificación utilizando O16 y O18  BI: Bacterial Identification Herramienta para identification rápida de casos de tuberculosis mediante mapeo de masas de péptidos  BS: Biomarker Search Herramienta para el descubrimiento de biomarcadores mediante cuantificación de proteinas  Mlibrary: Mass Library Herramienta y base de datos para la identificación rápida de esteroides anabolicoandrogénicos  Mass-Up Aplicación “todo en uno” para el descubrimiento de nuevo conocimiento a partir de espectrometría de masas utilizando MALDI-TOF
  • 30.
    30 PanDrugs [www.pandrugs.org]  Mediante Microarrayso NGS se obtienen listas de alteraciones moleculares: • Cuáles dirigen el tumor? y, de ellas... • Cuáles son accionables? y, de ellas... • Cómo priorizar la lista de posibles fármacos?
  • 31.
  • 32.
    [Machine learning-based modelsto detect and curb Health misinformation on social media] 32 Proyecto Propuesta Equipo  Dra. Beatriz Villamarín Bello médica atención primaria – Área sanitaria de A Coruña y Cee  Dra. Noelia Estévez Rionegro doctora en lingüística EPOs
  • 33.
    33 IA interpretable “The futureof AI lies in enabling people to collaborate with machines to solve complex problems. Like any efficient collaboration, this requires good communication, trust and understanding.” Explainable AI Research Lead Accenture Labs https://www.accenture.com/gb-en/insights/technology/explainable-ai-human-machine
  • 34.
    34 A. Barredo Arrieta,N. Díaz-Rodríguez, J. Del Ser, A. Bennetot, S. Tabik, A. Barbado, S. Garcia, S. Gil-Lopez, D. Molina, R. Benjamins, R. Chatila, F. Herrera Explainable Artificial Intelligence (XAI): Concepts, taxonomies, opportunities and challenges toward responsible AI. Information Fusion (June 2020) 58:82-115. ISSN 1566-2535. DOI: 10.1016/j.inffus.2019.12.012 IA interpretable introducción  En decisiones de sistemas basados en IA que afectan a vidas humanas se necesita transparencia  medicina, defensa, justicia, etc.  Compromiso entre rendimiento y transparencia  black-box (opaco) VS inteligible  El considerar la interpretabilidad como un objetivo de diseño aporta ventajas:  garantiza imparcialidad en la toma de decisiones (correct from bias)  incrementa robustez detectando inconsistencias  posibilita que sólo se tengan en cuenta variables relevantes (truthful causality)
  • 35.
    35 A. Barredo Arrieta,N. Díaz-Rodríguez, J. Del Ser, A. Bennetot, S. Tabik, A. Barbado, S. Garcia, S. Gil-Lopez, D. Molina, R. Benjamins, R. Chatila, F. Herrera Explainable Artificial Intelligence (XAI): Concepts, taxonomies, opportunities and challenges toward responsible AI. Information Fusion (June 2020) 58:82-115. ISSN 1566-2535. DOI: 10.1016/j.inffus.2019.12.012 IA interpretable evolución y objetivo  Generar avances en las técnicas de ML para conseguir…  producir modelos fácilmente interpretables manteniendo un alto nivel de rendimiento en su aprendizaje (high prediction accuracy).  garantizar que los humanos puedan entender fácilmente, confiar de forma segura y manejar de forma efectiva la nueva generación de partners inteligentes
  • 36.
    36 A. Barredo Arrieta,N. Díaz-Rodríguez, J. Del Ser, A. Bennetot, S. Tabik, A. Barbado, S. Garcia, S. Gil-Lopez, D. Molina, R. Benjamins, R. Chatila, F. Herrera Explainable Artificial Intelligence (XAI): Concepts, taxonomies, opportunities and challenges toward responsible AI. Information Fusion (June 2020) 58:82-115. ISSN 1566-2535. DOI: 10.1016/j.inffus.2019.12.012 IA interpretable ¿hacia dónde se evoluciona?: áreas de mejora de los modelos de ML existentes
  • 37.
    37 Human in theloop “Computers are incredibly fast, accurate, and stupid; humans are incredibly slow, inaccurate, and brilliant; together they are powerful beyond imagination.” Albert Einstein “…The future of AI lies in enabling people to collaborate with machines to solve complex problems…
  • 38.
    38 https://hackernoon.com/what-is-human-in-the-loop-for-machine-learning-2c2152b6dfbb Humanistic Intelligence definición, marcoconceptual Human In The Loop = SML + AL  Se basa en la creación de inteligencia como resultado de un ciclo iterativo de reatroalimentación (feedback) entre un proceso computacional y un humano Supervised Machile Learning Active Learning
  • 39.
  • 40.
    Conclusiones 40 “Computers are incrediblyfast, accurate, and stupid; humans are incredibly slow, inaccurate, and brilliant; together they are powerful beyond imagination.” Albert Einstein
  • 41.
    Lecciones aprendidas… después de16 años de desarrollo [2006-2021] strong IA weak IA  Informática (tecnología) + IA (ciencia) tienen mucho potencial en el ámbito de la salud  proactividad: búsqueda de problemas y nuevos retos 41  Fundamental la creación de equipos de trabajo de carácter multidisciplinar  todo el mundo tiene algo valioso que aportar y se necesita personal formado y motivado, como vosotros …  SNS y la Universidad son un muy buen lugar para iniciarse en investigación  No todo son casos de éxito, ni siempre existe recompensa  pero es parte de nuestro compromiso con la sociedad y merece la pena intentarlo
  • 42.
  • 43.
  • 44.
    geneCBR [www.genecbr.org] 44  Sistema deapoyo al diagnóstico de cáncer basado en microarrays de ADN • Colaboración con el CHUS y CIC • 3 Modos de funcionamiento: – Modo diagnóstico. Para el oncólogo – Modo experto. Ajuste de técnicas de IA – Modo programación. Prueba de prototipos nuevos • Técnicas de IA empleadas – DFP para selección de genes discriminantes – GCS para clasificación
  • 45.
    geneCBR [www.genecbr.org] 45  Muestras demédula osea pertenecientes a 43 pacientes adultos con Leucemia Mieloide Aguda + 6 individuos sanos  10 patients with Acute Promyelocytic Leukemia [APL]  4 patients with Acute Myeloid Leukemia with inv(16) [AML-inv(16)]  7 patients with Acute Monocytic Leukemia [AML-mono]  22 patients with Acute non-Monocytic Leukemia [AML-other]  6 samples belonging to sane individuals [control samples]  Volumen de la información manejada  Cada microarray contiene 22.283 ESTs (≡ genes)  49 microarrays = 1.091.867 valores de expresión genética  Datos disponibles en la actualidad  150 microarrays (Human Genome 133A) + 210 microarrays (Human Genome - plus)
  • 46.
    BioAnnote [sing-group.org/bioannote] 46  Aplicación capazde anotar textos biomédicos utilizando diferentes recursos on-line como Medlineplus y Freebase • Colaboración con UEM (Grado de Medicina) para el análisis de casos clínicos por parte de los estudiantes • El usuario introduce documentos y obtiene anotación de términos relevantes (enfermedades, síntomas, tratamientos) • Recuperación automática de información detallada sobre cada entidad reconocida (topics relacionados, enlaces externos, bibliografía de relevancia, resúmenes de artículos, etc.)
  • 47.
  • 48.
    WhichModel [www.whichmodel.org] 48  Estudio delpoder discriminante en problemas de clasificación de hipótesis establecidas utilizando conjuntos de genes relevantes biológicamente • Integrado con • Soporta Naïve Bayes, Decision trees, k-NN y SVM • Asistente para la creación de experimentos en 2 sencillos pasos • Ejecución paralela en el servidor de cálculo • Notificación por e-mail con enlaces directos a los resultados en el servidor
  • 49.
    GeneCommittee [sing-group.org/GC] 49  Mezcla declasificadores ‘especialistas’ en el manejo de distintos conjuntos de genes relevantes biológicamente • Colaboración con Univ. Aveiro (Portugal) • Integrado con (enriquecimiento) • Soporta datos de DNA microarray y RNA-Seq
  • 50.
    Antimicrobial Combination Network[sing-group.org/antimicrobialCombination/] 50  Redsemántica de combinaciones antimicrobianas testeadas experimentalmente contra infecciones de Pseudomonas aeruginosa • Colaboración con Univ. do Minho (Portugal) • Incluye 239 combinaciones de AMPs y distintos agentes antimicrobianos • Reconstrucción sistemática combina minería de textos, curación manual y análisis de grafos
  • 51.
    BEW[Biofilms Experiment Workbench] [sing-group.org/bew] 51 Gestión de datos y experimentos de biofilms entre distintos laboratorios • Colaboración con Univ. do Minho (Portugal) • Permite importar/exportar datos en .xls • Ejecución de tests estadísticos y generación de gráficas • Generación de informes HTML sobre los datos • Comparación de experimentos entre laboratorios → Inter Laboratory Experiment • Herramienta oficial de BiofOmics (banco de datos de biofilms pertenecientes a Salmonella, Escherichia, Candida, etc.)
  • 52.
  • 53.
  • 54.
    PileLine [sing-group.org/pileline] 54  Manejo dedatos procedentes de análisis de Ultra-Secuenciación • Colaboración con CNIO • Procesado rápido de nuevos ficheros de posición genómica – Búsqueda ultra-rápida – Comparación de dos muestras para encontrar mutaciones somáticas • Incorpora un visor genómico de escritorio
  • 55.
    ADOPS [sing-group.org/ADOPS] 55  Automatiza unflujo de trabajo para la detección automática de sitios seleccionados positivamente (detección de mutaciones) • Colaboración con IBMC • Integra T-Coffee, MrBayes y CodeML • Utiliza ALTER para la conversion de formatos entre distintos programas • Proporciona múltiples resúmenes y vistas de los resultados