Presentació del Projecte Know2, explicant la tendència a usar la Wikipedia en l'extracció i generació d'informació, i la seva aplicació a tecnologia educativa.
3. KNOW2 Coordinat pel grup IXA (UPV) Finançat pel Ministerio de Ciencia e Innovación (TIN2009-14715-c04-03) Grups: GRIAL: I. Castelló (UB), E. Comellas (UB), M. Lloberas (UB), J.Aparicio (UB), S. Climent (UOC), A. Oliver (UOC), M. Coll-Florit (UOC), J. Moré (UOC) UPV: E. Aguirre, G.Rigau, M. Maritxalar UPC: H. Rodríguez, Ll. Márquez, Ll. Padró, J. Turmo, G.Boleda, M. Cuadros Partners: Elhuyar Inici: 1-01-2010 Final: 31-12-2012
4. Objectius KNOW2 Extracció d’informació a partir del WWW Interpretació semàntica i entailment Detecció automàtica d’entitats típiques d’un domini i les relacions que s’estableixen entre elles Formalització del sentit comú Tractament documents mal escrits Adquisició multilingüe de la informació Traducció automàtica (juntament amb projecte OpenMT) Sistemes de Question/Answering Adquisició de corpus per a ser processat Corpus paral·lels bilingües Detecció automàtica d’idioma Detecció automàtica de tema Detecció de duplicats Integració i aplicació de tot plegat en dominis concrets i diferents dels dominis de recerca
6. Fòrmules lògiques sentit comú Introduïu els dits al nas Domini general Per tot x , si x té un nas y i uns dits z , llavors introduir(x,y,z,x) Domini primers auxilis Per tot x i tot w , si x és un socorrista i w és una víctima, i x té uns dits y i w té un nas z , i x ≠ z , llavors introduir(x,y,z,w)
7. Relacions Wikipedia La professora assisteix al seminari ‘Computers, Privacy & Data Protection. An element of choice’, que es celebra a la capital belga fins al 30 de gener P: On es celebra el seminari? R: A Brusel·les
8. Relacions Wikipedia i EWN Sentit comú vs coneixement enciclopèdic I found it no longer physically possible to combine scientific research with [...] Lolita (for she was on her way- a painful birth , a difficult baby ). V. Nabokov Speak, Memory Sentit comú + coneixement enciclopèdic (Generació automàtica d’exercicis) La mesura de la resistència elèctrica és Amper b) Ohm c) Coulomb (EWN i Wikipedia) a) Amper b) Ohm c) BLEU (EWN)
9. Trets lèxics i gramaticals L’ exèrcit espanyol ≠ ‘tots els soldats de l’exèrcit són espanyols’ El sindicat de soldats espanyols = ‘tots els membres del sindicat són espanyols’ Los antifaces que hay en la mesa = ‘hay más de un antifaz’ Las gafas que hay en la mesa ≠ ‘hay más de unas gafas’
11. Dominis KNOW2 Dominis d’aplicació Medi ambient Textos geogràfics Divulgació de ciència i tecnologia Generació d’infoboxes de la Wikipedia Tecnologia educativa!!!!!
12. Objectius interessants de KNOW2 per a projectes actuals de TE Cercador Detecció duplicats Detecció de tema Indexació de materials segons relacions semàntiques d’una entitat del domini La indexació de ‘Beethoven’ activa també la indexació automàtica de ‘Simfonia Coral’, ‘Bonn’, ‘Mozart’ segons les relacions semàntiques X va fer Y , X va néixer a Y i Y va influir X . Apertium Corpus paral·lels Detecció i extracció multilingüe d’entitats d’un domini
13. Objectius interessants de KNOW2 per a TE Doraemon Interpretació semàntica i entailment P: Les sonates de Beethoven són totes per a piano ? R1: Hi ha sonates de Beethoven que no són per a teclat . N’hi ha també per corda. R2: Hi ha sonates de Beethoven que són per a corda
15. Resultats OC Recurs Yago (A Core of Semantic Knowledge) del Max Planck Institute Informatik Fitxers txt tabulat de relacions Wikipedia i WN X Nascut/Mort a Y X va descobrir Y X va passar a Y X té una població d’ Y X té el successor/predecessor Y X va guanyar el premi Y X té influència sobre Y X està a Y X és una substància d’ Y X és una part d’ Y X va escriure Y X importa Y X es va escriure l’any Y X treballa a Y X té com a capital Y X va passar a Y X té com a idioma oficial Y X està interessat en Y X té el gènere (musical, literari) Y X toca Y X és una subclasse d’Y
17. Més enllà de KNOW-2 i possible participació TE Generació automàtica de Wikipedies Fiabilitat de les dades (experiència DicWiki) Domini d’aplicació en la generació de materials didàctics Implicacions en el plagi Encaix en el model d’aprenentatge sorprenent