IdentifiantMot de passe
Loading...
Mot de passe oubli� ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les r�ponses en temps r�el, voter pour les messages, poser vos propres questions et recevoir la newsletter

Web s�mantique Discussion :

Web s�mantique : introduction au RDFa [Tutoriel]


Sujet :

Web s�mantique

  1. #1
    Responsable Qt & Livres


    Avatar de dourouc05
    Homme Profil pro
    D�veloppeur informatique
    Inscrit en
    Ao�t 2008
    Messages
    26 772
    D�tails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Val de Marne (�le de France)

    Informations professionnelles :
    Activit� : D�veloppeur informatique
    Secteur : High Tech - Multim�dia et Internet

    Informations forums :
    Inscription : Ao�t 2008
    Messages : 26 772
    Par d�faut Web s�mantique : introduction au RDFa
    Aujourd'hui, le Web est pr�vu principalement par des humains pour des humains, ce qui laisse le travail de recherche, de compr�hension du contenu exclusivement � l'humain. Or, il serait int�ressant que les navigateurs puissent comprendre, au moins partiellement, les pages visit�es, ceci afin d'assister le visiteur. Le webmaster va donc laisser des indices que le navigateur pourra comprendre. Ces indices peuvent �tre le RDFa.

    Web s�mantique : introduction au RDFa
    Vous souhaitez participer aux rubriques Qt (tutoriels, FAQ, traductions) ou HPC ? Contactez-moi par MP.

    Cr�er des applications graphiques en Python avec PyQt5
    Cr�er des applications avec Qt 5.

    Pas de question d'ordre technique par MP !

  2. #2
    Mod�rateur
    Avatar de Flaburgan
    Homme Profil pro
    D�veloppeur Web
    Inscrit en
    Avril 2010
    Messages
    1 229
    D�tails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Is�re (Rh�ne Alpes)

    Informations professionnelles :
    Activit� : D�veloppeur Web
    Secteur : High Tech - �lectronique et micro-�lectronique

    Informations forums :
    Inscription : Avril 2010
    Messages : 1 229
    Par d�faut
    Je suis plut�t perplexe pour l'instant.
    D�j�, ce genre de code :
    Code html : S�lectionner tout - Visualiser dans une fen�tre � part
    1
    2
    3
    4
    <div about="http://www.developpez.com/template/images/logo.gif">
    	<img src="http://www.developpez.com/template/images/logo.gif"/>
    	<span property="dc:title">Logo Developpez.com</span>s
    </div>
    n'a clairement aucun int�r�t, ce qu'il y a dans about n'est rien de plus ni de moins que src. Ce serait plut�t au navigateur de comprendre seul src, je ne vois pas du tout ce que lui apporte about.

    En dehors de �a, je trouve que cela surcharge �norm�ment la syntaxe d'une page. En fait, je pense que cela aurait un sens si on modifiait notre dtd pour d�finir de nouvelles balises du type <menu>, <person>, etc... Et � la limite, faire que ces balises aient les attributs RFDa. En fait, j'ai un peu l'impression que je parle d'HTML objet l� haha.

    Enfin, admettons que le webmaster fasse tout �a, � quoi cela sert-il ? Je veux dire, si on dit r�ellement que le lien que l'on a mis pointe vers le site d'une amie, qu'est ce que cela va apporter ? Comment le navigateur pourrait-il s'en servir ? Car s'il ne fait rien, tout cela est inutile...

    J'ai l'impression qu'on a cr�� l'outil avant d'avoir le besoin l�...

  3. #3
    Membre confirm�
    Avatar de onjanirina
    Homme Profil pro
    Business analyst, D�veloppeur Prestashop
    Inscrit en
    D�cembre 2009
    Messages
    110
    D�tails du profil
    Informations personnelles :
    Sexe : Homme
    �ge : 46
    Localisation : Madagascar

    Informations professionnelles :
    Activit� : Business analyst, D�veloppeur Prestashop
    Secteur : High Tech - �diteur de logiciels

    Informations forums :
    Inscription : D�cembre 2009
    Messages : 110
    Par d�faut Reconstituer une vache � partir de steacks
    Comme je disais � notre ami dourouc05, RDFa est un peu comme "num�roter des steacks pour essayer de reconstruire une vache".
    RDFa, c'est r�cup�rer des pages initialement d�tach�s de toute s�mantisation, afin d'y attacher des particules de sens au moyen d'un raccourci hybride XML attribute/namespace.
    Le web s�mantique va justement au-del� des pages pour se concentrer sur les "sens", les pages n'�tant que l'aspect ext�rieur accessible par les humains.

    "N'a clairement aucun int�r�t, tout cela est inutile, etc." Ce sont justement les remarques et questions auxquels il faut essayer de trouver les premi�res r�ponses avant de s'attaquer � des discussions purement techniques et syntaxiques : RDFa, OWL, etc.

    Sans une compr�hension de la nature de la connaissance, des ontologies ou encore de la s�mantique, toute approche technique se soldera t�t ou tard dans des essais et tentatives aussi inutiles qu'improductives.
    Bienvenues donc � des discussions plus philosophiques et strat�giques sur les aspects, les utilisations ou les fondements conceptuels de la s�mantique !

  4. #4
    Expert confirm�

    Avatar de snake264
    Homme Profil pro
    Datascientist chez Leboncoin
    Inscrit en
    Novembre 2006
    Messages
    2 914
    D�tails du profil
    Informations personnelles :
    Sexe : Homme
    �ge : 38
    Localisation : France, Alpes Maritimes (Provence Alpes C�te d'Azur)

    Informations professionnelles :
    Activit� : Datascientist chez Leboncoin
    Secteur : High Tech - Multim�dia et Internet

    Informations forums :
    Inscription : Novembre 2006
    Messages : 2 914
    Par d�faut
    Citation Envoy� par Flaburgan Voir le message
    J'ai l'impression qu'on a cr�� l'outil avant d'avoir le besoin l�...
    Visiblement, � tes questions, tu ne connais pas du tout ce que peut �tre le Web s�mantique, pour r�pondre � tes questions je te conseil d'abord de lire cet article qui fait une introduction � ce que c'est :

    http://jplu.developpez.com/tutoriels.../introduction/

    Tu verra qu'apr�s tu pourra mieux y voir tout l'int�r�t du RDFa

  5. #5
    Membre confirm�
    Avatar de onjanirina
    Homme Profil pro
    Business analyst, D�veloppeur Prestashop
    Inscrit en
    D�cembre 2009
    Messages
    110
    D�tails du profil
    Informations personnelles :
    Sexe : Homme
    �ge : 46
    Localisation : Madagascar

    Informations professionnelles :
    Activit� : Business analyst, D�veloppeur Prestashop
    Secteur : High Tech - �diteur de logiciels

    Informations forums :
    Inscription : D�cembre 2009
    Messages : 110
    Par d�faut S�mantique et Moteur de recherche
    Avec cet article de snake264, ainsi que les pr�occupations de Flaburgan, il est peut-�tre temps d'en venir � la bonne question, notamment � propos des (moteur de) recherches et du web s�mantique.

    Le web s�mantique se propose de r�pondre � des questions qui se rapportent � des concepts r�els (est-ce que Lisa est la s�ur de Bart ?, Est-ce que Homer est un parent de Lisa et Bart ? etc.) alors que les moteurs de recherche permettent de trouver des ressources (pages, images, vid�os, etc.) correspondant � la requ�te.
    Le web s�mantique organise les donn�es par rapport au monde r�el (ontologies), mais o� trouvera-t-il des donn�es : d'une part, � partir de bases de connaissances (ontologies) publi�es, qui est encore en nombre r�duit, et d'autre part, en essayant d'extraire une base de connaissance � partir des donn�es d�j� disponible sur le web, c'est-�-dire, � partir des pages, d'o� le besoin d'un syst�me d'adaptation hybrique : RDFa.
    Dans ce cas particulier, il suffit de se poser la question : Si l'ontologie de la Famille Simpson �tait disponible et interrogeable gr�ce � SPARQL, pourquoi devrait-on encore analyser des pages HTML avec des attributs RDFa ?

    Ce qui nous am�ne, normalement, � la conclusion sur la vraie nature du web s�mantique : la Connaissance.
    La connaissance
    , qui peut-�tre extraite des pages web, peut aussi se pr�senter (repr�senter) sous une autre forme, les ontologies. Une simple affirmation comme "Lisa est la s�ur de Bart" peut faire l'objet de milliers de page alors que le web s�mantique n'en proposera qu'une forme unique.

    Le web s�mantique est ce que le web aurait d� �tre depuis le d�but : une base de connaissance. Le fait est que l'histoire a fait que les pages ont �t� mis en avant, il est maintenant temps de refaire l'histoire : reconstruire la connaissance � partir des pages par l'utilisation de RDFa, ou reconstruire la connaissance � partir de nouvelles bases (RDF, OWL).

  6. #6
    Expert confirm�

    Avatar de snake264
    Homme Profil pro
    Datascientist chez Leboncoin
    Inscrit en
    Novembre 2006
    Messages
    2 914
    D�tails du profil
    Informations personnelles :
    Sexe : Homme
    �ge : 38
    Localisation : France, Alpes Maritimes (Provence Alpes C�te d'Azur)

    Informations professionnelles :
    Activit� : Datascientist chez Leboncoin
    Secteur : High Tech - Multim�dia et Internet

    Informations forums :
    Inscription : Novembre 2006
    Messages : 2 914
    Par d�faut
    Ce que je dit Onjanirina est tr�s pertinent.

    Mais par contre, une petite pr�cision dans son discours, le Web s�mantique ce n'est pas soit "des ontologies" soit "du RDFa", car si l'on fait du RDFa on a forc�ment besoin d'une (ou plusieurs) ontologies.

    Ensuite ce qui alimente le Web s�mantique en donn�es, ce n'est pas les ontologies elles m�mes, mais les donn�es contenus dans les pages XHTML (et non HTML attention), donn�es qui bien s�r sont indiqu�es avec RDFa.

    Car les pages XHTML sont construites soit � la main, et donc ces donn�es ce sont le d�veloppeur qui les �crits, soit par un script qui "traduit" le r�sultat d'une requ�te SPARQL sur un triplet store.

    Le triplet store �tant l'endroit o� chercher les informations.

    Maintenant que l'on conna�t le mode de fonctionnement, voici un petit exemple :

    Admettons que l'on veuille savoir si "Lisa est la soeur de Bart". Je vais dans un moteur de recherche et je tape "Est-ce que Lisa est la soeur de Bart ?".

    Le moteur de recherche lui, va analyser la requ�te de cette mani�re :

    Je (le moteur de recherche) passe mon temps � analyser tout un tas de pages XHTML � la recherche de donn�es RDFa, et lorsque je rencontre une donn�e qui dit (par exemple) "sujet = Lisa pr�dicat = famille:sisterOf objet = Bart" (bien s�r la donn�e ne sera pas �cris tel quel dans le XHTML mais c'est ce que le moteur de recherche comprendra grossi�rement) je me dit tiens il y a ici une information qui me dit que "Lisa est la soeur de Bart" je stocke donc ce triplet dans mon triplet store.

    Plus tard je re�ois la requ�te "Est-ce que Lisa est la soeur de Bart ?", j'interroge donc mon triplet store avec une requ�te SPARQL pour savoir si j'ai des donn�es qui correspondent. Oui j'en ai (voir plus haut) et la requ�te me r�pond que oui, donc je renvoi "oui" � l'utilisateur.


    Voila un exemple grossier de ce qui se passe avec un moteur de recherche qui "comprend" le RDFa et qui sait interroger un triplet store. Bien s�r tu peux aussi alimenter ton triplet store avec tes propres donn�es. Il faut aussi garder en t�te que les ontologies ne sont l� QUE pour cr�er une relation entre les donn�es

    Est-ce que tout ceci r�pond mieux � tes questions ?

  7. #7
    Membre confirm�
    Avatar de onjanirina
    Homme Profil pro
    Business analyst, D�veloppeur Prestashop
    Inscrit en
    D�cembre 2009
    Messages
    110
    D�tails du profil
    Informations personnelles :
    Sexe : Homme
    �ge : 46
    Localisation : Madagascar

    Informations professionnelles :
    Activit� : Business analyst, D�veloppeur Prestashop
    Secteur : High Tech - �diteur de logiciels

    Informations forums :
    Inscription : D�cembre 2009
    Messages : 110
    Par d�faut Moteur de connaissance, Moteur de recherche
    L'exemple mentionn� par snake264 d�montre effectivement les utilisations possibles et avantages d'un syst�me s�mantique mais quelques pr�cisions s'av�rent n�cessaires et utiles afin de ne pas induire les lecteurs dans des interpr�tations erron�es :

    - Le moteur de recherche tel que d�crit, c'est-�-dire capable de r�pondre par Oui/Non � une question, n'est pas LE moteur de recherche traditionnel tel qu'on connait (Google, Bing, etc.) mais consisterait plut�t � un moteur de connaissance ou moteur s�mantique, dont on esp�re voir un jour l'apparition.

    - L'approche utilis�e (Parcourir des tas de pages, analyser et indexer) est par contre celle d'un moteur traditionnel et ne tient pas compte de tout l'apport du web s�mantique (ontologies) et plus particuli�rement, du principe de Web de confiance pr�n�e par la w3C.

    Dans un web s�mantique, le producteur (ou auteur) des Simpsons aurait publi� une ontologie dont l'exactitude et le niveau de confiance est compl�te. La disponibilit� d'une telle ontologie permettrait, � partir d'une seule et unique base de connaissance:
    1) de cr�er des pages tenant compte des moyens de visualisation utilis�es (mobile, navigateur, etc.), des caract�ristiques des lecteurs (enfants, adultes, etc.), avec �ventuellement des attributs RDFa;
    2) de r�pondre directement aux questions d'ordres conceptuelles (comme dans l'exemple), avec une certitude maximale et une rapidit� quasi-imm�diate;
    3 ) de fournir une base de connaissance extensible et r�utilisable � d'autres services web (Exemple : une entreprise de location de film peut importer cette ontologie pour enrichir sa propre base de connaissance ou de donn�es).

    Les efforts du w3C dans la promotion de cette notion de web s�mantique ont justement pour objet d'inciter les organisations, groupements professionnels, gouvernements, etc. � publier des ontologies (de confiance) afin d'�viter tout ce travail de collecte/analyse/indexation qui constituent une d�pense d'�nergie immense, � la fois mat�rielle et intellectuelle.

  8. #8
    Expert confirm�

    Avatar de snake264
    Homme Profil pro
    Datascientist chez Leboncoin
    Inscrit en
    Novembre 2006
    Messages
    2 914
    D�tails du profil
    Informations personnelles :
    Sexe : Homme
    �ge : 38
    Localisation : France, Alpes Maritimes (Provence Alpes C�te d'Azur)

    Informations professionnelles :
    Activit� : Datascientist chez Leboncoin
    Secteur : High Tech - Multim�dia et Internet

    Informations forums :
    Inscription : Novembre 2006
    Messages : 2 914
    Par d�faut
    Citation Envoy� par onjanirina Voir le message
    Le moteur de recherche tel que d�crit, c'est-�-dire capable de r�pondre par Oui/Non � une question, n'est pas LE moteur de recherche traditionnel tel qu'on connait (Google, Bing, etc.) mais consisterait plut�t � un moteur de connaissance ou moteur s�mantique, dont on esp�re voir un jour l'apparition.
    Le moteur de recherche de Google (US) et Orange savent r�pondrent � des questions mais cibl�s sur certains domaines seulement. Mais c'est en cours d'�volution, il y a des projets en cours pour am�liorer ces syst�mes chez chacun d'eux.

    Citation Envoy� par onjanirina Voir le message
    - L'approche utilis�e (Parcourir des tas de pages, analyser et indexer) est par contre celle d'un moteur traditionnel et ne tient pas compte de tout l'apport du web s�mantique (ontologies) et plus particuli�rement, du principe de Web de confiance pr�n�e par la w3C.
    Erreur, Google tient compte des donn�es RDFa et Microformat dans son "pagerank" et dans la pertinence de ses r�sultats. Mais c'est tellement peut utilis� qu'il est vrai que cela ne se voit quasiment pas malheureusement

    Citation Envoy� par onjanirina Voir le message
    Dans un web s�mantique, le producteur (ou auteur) des Simpsons aurait publi� une ontologie dont l'exactitude et le niveau de confiance est compl�te. La disponibilit� d'une telle ontologie permettrait, � partir d'une seule et unique base de connaissance:
    1) de cr�er des pages tenant compte des moyens de visualisation utilis�es (mobile, navigateur, etc.), des caract�ristiques des lecteurs (enfants, adultes, etc.), avec �ventuellement des attributs RDFa;
    2) de r�pondre directement aux questions d'ordres conceptuelles (comme dans l'exemple), avec une certitude maximale et une rapidit� quasi-imm�diate;
    3 ) de fournir une base de connaissance extensible et r�utilisable � d'autres services web (Exemple : une entreprise de location de film peut importer cette ontologie pour enrichir sa propre base de connaissance ou de donn�es).

    Les efforts du w3C dans la promotion de cette notion de web s�mantique ont justement pour objet d'inciter les organisations, groupements professionnels, gouvernements, etc. � publier des ontologies (de confiance) afin d'�viter tout ce travail de collecte/analyse/indexation qui constituent une d�pense d'�nergie immense, � la fois mat�rielle et intellectuelle.
    Enti�rement d'accord avec toi

  9. #9
    Mod�rateur
    Avatar de Flaburgan
    Homme Profil pro
    D�veloppeur Web
    Inscrit en
    Avril 2010
    Messages
    1 229
    D�tails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Is�re (Rh�ne Alpes)

    Informations professionnelles :
    Activit� : D�veloppeur Web
    Secteur : High Tech - �lectronique et micro-�lectronique

    Informations forums :
    Inscription : Avril 2010
    Messages : 1 229
    Par d�faut
    Apr�s avoir eu le temps de lire l'article global sur le web s�mantique, je reviens me m�ler au d�bat, car le sujet est tr�s int�ressant.

    Tout d'abord, je ne trouve pas, m�me maintenant avec plus de connaissance, que mon premier message est un non sens. Je continue de me demander ce que cela apporte au webmaster. Cela permet-il une meilleure navigation dans les pages de son site ? Que s'il a une sorte de "triplet store" interne � son site.

    Ensuite, je pense que cette notion de triplet store, qui si j'ai bien compris est une base de connaissance, me para�t bien �trange.

    De ce que j'ai compris, les robots du moteur de recherche des connaissances parcourraient les pages pour alimenter ce triplet store. Et quand on leur poserait une question, le moteur se baladerait dans cette immense base pour trouver la r�ponse.

    Cela signifie que quelqu'un doit �tre capable d'indexer toutes les relations pr�sentes sur le web. J'y vois la plusieurs probl�mes que je qualifierai de critique.
    Le premier : mat�riel : cela repr�sente un co�t immense et une grosse responsabilit�, notamment en cas de panne.
    Le second : malgr� une grande puissance de calcul, on ne peut pas imaginer r�ussir � indexer TOUS les sites web. C'est l� la puissance du web actuellement, m�me si Google ne conna�t pas un site, je peux moi le trouver si je connais son adresse o� en jonglant avec des liens de sites en sites.
    Le troisi�me : Cela signifie qu'une unique entit� poss�de toute la connaissance. Et peut donc la modifier � sa guise. La centralisation du web serait une catastrophe
    La quatri�me : Que se passe-t-il si deux sites affirment quelque chose de diff�rent ? Lisa est la soeur de Bart et la fille d'Homer, et Llisa est la soeur d'Homer dans un autre site web ? Comment synth�tiser l'information dans le triplet store ? Peut-on consid�rer que puisqu'il y a plus de site qui affirme que Lisa est la fille alors c'est r�ellement le cas ? Ce qui adviendrait � affirmer que la majorit� a toujours raison ?

    La solution que je vois, c'est qu'il ne faut pas un triplet store par moteur de recherche, mais un triplet store par site, et le moteur de recherche serait capable de fouiller dans les sites pour ressortir les infos qu'ils jugeraient pertinente, et ainsi nous afficher "d'apr�s le site Homer fan's, Homer est le p�re de Lisa, d'apr�s le site FAKEFAKE, il est son fr�re."

    La d�centralisation, comme d'habitude

  10. #10
    Expert confirm�

    Avatar de snake264
    Homme Profil pro
    Datascientist chez Leboncoin
    Inscrit en
    Novembre 2006
    Messages
    2 914
    D�tails du profil
    Informations personnelles :
    Sexe : Homme
    �ge : 38
    Localisation : France, Alpes Maritimes (Provence Alpes C�te d'Azur)

    Informations professionnelles :
    Activit� : Datascientist chez Leboncoin
    Secteur : High Tech - Multim�dia et Internet

    Informations forums :
    Inscription : Novembre 2006
    Messages : 2 914
    Par d�faut
    Alors il te manque encore quelques petites notions qui sont un peu plus "pointu" mais c'est rien.

    Citation Envoy� par Flaburgan Voir le message
    Cela permet-il une meilleure navigation dans les pages de son site ? Que s'il a une sorte de "triplet store" interne � son site.
    Cela n'a jamais eu pour objectif d'am�liorer l'exp�rience utilisateur sur son site. Son seul int�r�t pour lui sera que les autres pourront tirer parti de toutes les informations qui sont dans son site pour am�liorer leur base de connaissances. En tr�s gros.

    Citation Envoy� par Flaburgan Voir le message
    Ensuite, je pense que cette notion de triplet store, qui si j'ai bien compris est une base de connaissance, me para�t bien �trange.

    De ce que j'ai compris, les robots du moteur de recherche des connaissances parcourraient les pages pour alimenter ce triplet store. Et quand on leur poserait une question, le moteur se baladerait dans cette immense base pour trouver la r�ponse.
    A peut pr�s c'est �a oui. Mais faut que tu sache que c'est plus rapide que du simple relationnel.

    Citation Envoy� par Flaburgan Voir le message
    Cela signifie que quelqu'un doit �tre capable d'indexer toutes les relations pr�sentes sur le web
    Il y a des robots pour �a, �a s'appelle des crowler et �a existait bien avant le Web s�mantique.

    Citation Envoy� par Flaburgan Voir le message
    Le premier : mat�riel : cela repr�sente un co�t immense et une grosse responsabilit�, notamment en cas de panne.
    Pas plus qu'une simple BDD normale que l'on trouve dans n'importe quel moteur de recherche. Il n'y a aucune diff�rence entre les deux pour �a.

    Citation Envoy� par Flaburgan Voir le message
    Le second : malgr� une grande puissance de calcul, on ne peut pas imaginer r�ussir � indexer TOUS les sites web. C'est l� la puissance du web actuellement, m�me si Google ne conna�t pas un site, je peux moi le trouver si je connais son adresse o� en jonglant avec des liens de sites en sites.
    Et bien l� les relations seront plus forte et tu n'auras plus besoin d'aller de site en site pour trouver celui que tu veux. Pour une puissance de calcul moins forte que sur un simple syst�me relationnel. Aussi l'indexation ce fait plus rapidement.

    Citation Envoy� par Flaburgan Voir le message
    Le troisi�me : Cela signifie qu'une unique entit� poss�de toute la connaissance. Et peut donc la modifier � sa guise. La centralisation du web serait une catastrophe
    Ou tu vois �a toi ? n'importe qui peut faire un petit moteur de recherche et avoir �a propre base. Pourquoi voudrais-tu que tous soit r�unis dans un unique endroit ? Et puis il n'y a pas qu'un moteur de recherche � ce que je sache

    Citation Envoy� par Flaburgan Voir le message
    La quatri�me : Que se passe-t-il si deux sites affirment quelque chose de diff�rent ? Lisa est la soeur de Bart et la fille d'Homer, et Llisa est la soeur d'Homer dans un autre site web ? Comment synth�tiser l'information dans le triplet store ? Peut-on consid�rer que puisqu'il y a plus de site qui affirme que Lisa est la fille alors c'est r�ellement le cas ? Ce qui adviendrait � affirmer que la majorit� a toujours raison ?
    Pour cela je te renvoi aux probl�mes de r�seaux s�mantique que l'on trouve en TALN. Actuellement il y a des poids pour chaque informations en fonction de leur provenance (attention je ne parle pas ici de Web s�mantique) et en fonction du nombre d'une m�me r�ponse.

    Citation Envoy� par Flaburgan Voir le message
    La solution que je vois, c'est qu'il ne faut pas un triplet store par moteur de recherche, mais un triplet store par site, et le moteur de recherche serait capable de fouiller dans les sites pour ressortir les infos qu'ils jugeraient pertinente, et ainsi nous afficher "d'apr�s le site Homer fan's, Homer est le p�re de Lisa, d'apr�s le site FAKEFAKE, il est son fr�re."
    Rien ne t'emp�che de faire �a, c'est tout � fait possible mais ralentirai beaucoup l'efficacit� du moteur de recherche. Car au lieu de faire une demande dans sa base il faut qu'il se connecte � la tienne attende la r�ponse qu'il la re�oive et qu'il la traite. En gros c'est comme ci actuellement un moteur de recherche interroge la BDD de chaque site pour avoir ses infos. Et puis comment ferais ceux qui ne peuvent pas installer de triplets store sur leur site ? Comme chez les h�bergeur gratuit, comment feront-ils pour partager les infos contenus sur leur site ? LE moyen pour �a est RDFa

    Citation Envoy� par Flaburgan Voir le message
    La d�centralisation, comme d'habitude
    Oui mais attention � ne pas tomber dans l'extr�me ce qui serait tout aussi grave et dangereux que la centralisation

  11. #11
    Membre confirm�
    Avatar de onjanirina
    Homme Profil pro
    Business analyst, D�veloppeur Prestashop
    Inscrit en
    D�cembre 2009
    Messages
    110
    D�tails du profil
    Informations personnelles :
    Sexe : Homme
    �ge : 46
    Localisation : Madagascar

    Informations professionnelles :
    Activit� : Business analyst, D�veloppeur Prestashop
    Secteur : High Tech - �diteur de logiciels

    Informations forums :
    Inscription : D�cembre 2009
    Messages : 110
    Par d�faut
    Merci � Flaburgan pour cette relance, qui nous remet bien au centre des d�bats sur le web s�mantique, plut�t que de s'�parpiller � des affirmations et autres hypoth�ses technologiques et syntaxiques qui sont purement et simplement contre-�ducatifs et ne satisfont que leurs auteurs (ou traducteurs).

    Qu'est-ce que cela apporte au webmaster ?
    Le web s�mantique apporte une vision nouvelle du m�tier de webmaster. au lieu d'�tre le responsable d'un assemblage de pages, le webmaster (ou le nom qu'on donnera � ce nouveau m�tier) aura pour mission la cr�ation, mise � jour et la publication d'une base de connaissance. Pour utiliser l'expression de Flaburgan, le futur webmaster sera responsable de la cr�ation, mise � jour et publication d'un Triplet Store par Site. Dans le cas o� des sources s�rs ont d�ja publi� des ontologies, il (le webmaster) s'en servira (importation, r�utilisation) pour construire le sien. La connaissance (Ontologies) sera "distribu�e" par diff�rentes voies : pages, serveurs, ontologies (owl, sparql).

    Le Triplet store, le crawling-s�mantique, etc.
    La notion de Triplet est li�e � la syntaxe RDF, et OWL par la suite, dont la mission principale est de fournir une syntaxe permettant l'�change et la communication des donn�es s�mantiques sur le web. Les recommandations de la W3C ne comportent aucunement des invitations ou incitations � la cr�ation de Triplet store.
    Ce qui est encore plus ridicule est ce Triplet store construit sur la base d'un parcours (exhaustif) des pages web. En effet, le principe de "Confiance" , ainsi que de la "R�utilisabilit�", est une des composantes de base du web s�mantique. Ce qui signifie en pratique : Une source sure publie une ontologie, que d'autres pourront r�-utiliser et �tendre afin de construire et publier leurs propres connaissances. Pour le cas d'exemple cit�, c'est l'auteur ou le producteur des Simpsons qui devra publi� l'ontologie de base (Famille Simpsons) que d'autres pourront r�-utiliser, notamment pour cr�er des pages web avec des �l�ments RDFa.
    Cet exemple de Moteur de recherche (ou de connaissance puisqu'il va essayer de r�pondre � une question) qui va parcourir "un tas de pages web" pour construire sa base de connaissance est simplement irr�aliste puisque sa validit� est conditionn� par des hypoth�ses irr�alisables : exhaustivit�, authenticit� des donn�es (Tout le monde est cens� �tre juste et correct). J'esp�re que snake264 partagera avec nous des exemples ou travaux sur des moteur de recherche construits sur ce mod�le.

    Dans les r�ponses pr�c�dentes, je me posais la question "Si l'ontologie de la Famille Simpson �tait disponible et interrogeable gr�ce � SPARQL, pourquoi devrait-on encore analyser des pages HTML avec des attributs RDFa ?"
    La r�ponse � cette question permet r�sumer les apports du web s�mantique : Mettre � la disponibilit� des utilisateurs des ontologies s�res, qui pourront �tre (r�)utilis�es pour la construction de nouvelles ontologies ou l'enrichissement s�mantique de pages web (RDFa).
    La construction d'ontologies ne peut �tre que le fruit d'une d�marche personnelle initi�e par une entit� d�tentrice de la connaissance sur un domaine. La r�cup�ration des unit�s s�mantiques dans les page web (RDFa) ne permettrait que la construction d'une ontologie � faible niveau de certitude et incompatibles � l�ex�cution d'inf�rences (owl full).

  12. #12
    Expert confirm�

    Avatar de snake264
    Homme Profil pro
    Datascientist chez Leboncoin
    Inscrit en
    Novembre 2006
    Messages
    2 914
    D�tails du profil
    Informations personnelles :
    Sexe : Homme
    �ge : 38
    Localisation : France, Alpes Maritimes (Provence Alpes C�te d'Azur)

    Informations professionnelles :
    Activit� : Datascientist chez Leboncoin
    Secteur : High Tech - Multim�dia et Internet

    Informations forums :
    Inscription : Novembre 2006
    Messages : 2 914
    Par d�faut
    Citation Envoy� par onjanirina Voir le message
    Qu'est-ce que cela apporte au webmaster ?
    Le web s�mantique apporte une vision nouvelle du m�tier de webmaster. au lieu d'�tre le responsable d'un assemblage de pages, le webmaster (ou le nom qu'on donnera � ce nouveau m�tier) aura pour mission la cr�ation, mise � jour et la publication d'une base de connaissance. Pour utiliser l'expression de Flaburgan, le futur webmaster sera responsable de la cr�ation, mise � jour et publication d'un Triplet Store par Site. Dans le cas o� des sources s�rs ont d�ja publi� des ontologies, il (le webmaster) s'en servira (importation, r�utilisation) pour construire le sien. La connaissance (Ontologies) sera "distribu�e" par diff�rentes voies : pages, serveurs, ontologies (owl, sparql).
    Oui et non, tout le monde n'a pas la possibilit�e d'installer un triplets store sur le serveur o� il h�berge son site. Cela peut �tre � la fois la meilleure solution comme la pire, �a d�pend du contexte. On ne va pas installer un triplets store si notre site contient qu'une dizaine de pages il vaut mieux utiliser la publication de ses triplets dans le code de la page. Par contre si notre site contient plusieurs centaines de Mo de donn�es l� oui il serait plus utile de cr�er un triplets store et ce qu'il y a de mieux est de faire les deux mais c'est vrai que �a demande pas mal de boulot.

    Citation Envoy� par onjanirina Voir le message
    Le Triplet store, le crawling-s�mantique, etc.
    La notion de Triplet est li�e � la syntaxe RDF, et OWL par la suite, dont la mission principale est de fournir une syntaxe permettant l'�change et la communication des donn�es s�mantiques sur le web. Les recommandations de la W3C ne comportent aucunement des invitations ou incitations � la cr�ation de Triplet store.
    C'est vrai nul n'est oblig� de stocker ses donn�es dans un triplets store on peut tr�s bien les publier via un agr�gateur d'ontologie qui affiche simplement toutes nos donn�es en format RDF dans une simple page Web et l'on y acc�de via un SPARQL endpoint. Il faut garder � l'esprit que le plus important est la publication de donn�es et l'interconnexion dans le Web s�mantique.

    Citation Envoy� par onjanirina Voir le message
    Pour le cas d'exemple cit�, c'est l'auteur ou le producteur des Simpsons qui devra publi� l'ontologie de base (Famille Simpsons) que d'autres pourront r�-utiliser, notamment pour cr�er des pages web avec des �l�ments RDFa.
    Se serait tr�s contre productif de faire cela. Il existe de bien meilleurs moyens.

    Citation Envoy� par onjanirina Voir le message
    Cet exemple de Moteur de recherche (ou de connaissance puisqu'il va essayer de r�pondre � une question) qui va parcourir "un tas de pages web" pour construire sa base de connaissance est simplement irr�aliste puisque sa validit� est conditionn� par des hypoth�ses irr�alisables : exhaustivit�, authenticit� des donn�es (Tout le monde est cens� �tre juste et correct).
    Faux, cela existe d�j�, m�me chez google. Je t'invite aussi � aller voir ceci http://www.lirmm.fr/jeuxdemots/jdm-accueil.php (pas avec IE par contre). En gros c'est un site qui montre en jouant comment cr�er un r�seau s�mantique de confiance, et c'est prouver. Par contre ce n'est pour l'instant qu'un sujet de recherche de mon labo. Aussi ce n'est pas pour le Web s�mantique (c'est du TALN) mais cela montre comment l'on peut publier des donn�es de confiancesi l'on s'en sert pour le Web s�mantique.
    Citation Envoy� par onjanirina Voir le message
    Dans les r�ponses pr�c�dentes, je me posais la question "Si l'ontologie de la Famille Simpson �tait disponible et interrogeable gr�ce � SPARQL, pourquoi devrait-on encore analyser des pages HTML avec des attributs RDFa ?"
    Tout simplement pour avoir d'autres infos. Il faut savoir que dans le Web s�mantique plus on a de m�ta donn�es (donn�es sur les donn�es) mieux c'est. L'interconnexion est la chose la plus importante en Web s�mantique.

    Citation Envoy� par onjanirina Voir le message
    La r�ponse � cette question permet r�sumer les apports du web s�mantique : Mettre � la disponibilit� des utilisateurs des ontologies s�res, qui pourront �tre (r�)utilis�es pour la construction de nouvelles ontologies ou l'enrichissement s�mantique de pages web (RDFa).
    La construction d'ontologies ne peut �tre que le fruit d'une d�marche personnelle initi�e par une entit� d�tentrice de la connaissance sur un domaine.
    Faux, tout le monde peut cr�er une ontologie dans le domaine qu'il conna�t ou bien m�me dans un domaine qu'il ne ma�trise pas en approfondissant ses propres connaissances. Et il faut savoir qu'une ontologie est r�utilisable. C'est-�-dire que si quelqu'un a oubi� une propri�t� par exemple et bien il cr�� la sienne en rajoutant cette propri�t�. Par exemple l'ontologie FOAF n'a pas de propri�t� "m�tier" donc pour conna�tre le m�tier d'une personne il faut cr�er une ontologie qui reprend FOAF en rajoutant la propri�t� m�tier.

    Les ontologies ne seront jamais � 100% fiables. Il manquera toujours des choses et c'est � chaque utilisateurs qu'il revient de faire la sienne pour publier ses donn�es � condition de mettre � disposition la documentation de son ontologie pour permettre de l'utiliser.

  13. #13
    Membre confirm�
    Avatar de onjanirina
    Homme Profil pro
    Business analyst, D�veloppeur Prestashop
    Inscrit en
    D�cembre 2009
    Messages
    110
    D�tails du profil
    Informations personnelles :
    Sexe : Homme
    �ge : 46
    Localisation : Madagascar

    Informations professionnelles :
    Activit� : Business analyst, D�veloppeur Prestashop
    Secteur : High Tech - �diteur de logiciels

    Informations forums :
    Inscription : D�cembre 2009
    Messages : 110
    Par d�faut Google et le web s�mantique
    Google, exploitant la base de donn�es qu'il s'est constitu� pour la recherche (textuelle), a effectivement introduit des notions de s�mantiques dans ses algorithmes mais les r�sultats eux-m�mes confirment l'impossibilit� d'exploitation s�mantique des pages web. L'approche s�mantique de Google consiste en l'analyse du contenu des pages ainsi que l'extraction d'�ventuelles meta-donn�es fournies (RDFa) mais souffre de deux grandes lacunes :

    • L'incertitude, donc l'impossibilit� d'effectuer des inf�rences. Google se r�serve bien de s'attribuer cette capacit� (certitude) en pr�cisant dans ses r�ponses : "L'hypoth�se la plus probable pour (question) est (r�ponse)." avec mention du nombre et des noms des sites sources.


    • La non-exhaustivit�, certaines requ�tes n'ont tout simplement pas de r�ponses "s�mantiques" et renvoient des listes traditionnelles. Par ailleurs, cette fonction n'est pas encore disponible pour toutes les langues.




    Le web s�mantique a pourtant pour ambition de faire du web une source d'informations sure et de confiance. Ce qui m'am�ne � l'affirmation de snake264 : "Tout le monde peut cr�er des ontologies" : Techniquement, tout le monde est capable d'�crire des fichiers owl, rdf et xml. Mais est-ce que cela va faire de "tout le monde" une source s�re et de confiance ? Bref, il ne faudrait pas se limiter � cette approche technique mais surtout d�couvrir (ou faire d�couvrir) les autres composants du web s�mantique, � savoir la confiance, la r�utilisabilit�.

  14. #14
    Expert confirm�

    Avatar de snake264
    Homme Profil pro
    Datascientist chez Leboncoin
    Inscrit en
    Novembre 2006
    Messages
    2 914
    D�tails du profil
    Informations personnelles :
    Sexe : Homme
    �ge : 38
    Localisation : France, Alpes Maritimes (Provence Alpes C�te d'Azur)

    Informations professionnelles :
    Activit� : Datascientist chez Leboncoin
    Secteur : High Tech - Multim�dia et Internet

    Informations forums :
    Inscription : Novembre 2006
    Messages : 2 914
    Par d�faut
    C'est pour le moment tout � fait normal vu le pauvre contenu existant pour le Web s�mantique. Il y a aussi la m�me chose mais en plus performant chez orange.

    Et libre � tout le monde d'utiliser ou de cr�er l'ontologie qu'il veut. Il faut qu'� l'avenir n'importe qui puisse (d�j�) cr�er une ontologie, c'est pour cela qu'il y a certains labo qui travaillent sur des outils que tout le monde peut utiliser pour faire son ontologie sans vraiment comprendre ce qu'il y a derri�re. Un peu comme photoshop tout le monde sait l'utiliser mais 1/10�me des utilisateurs ne connaissent pas les th�orie de physique et de math�matiques qui sont derri�re.

    Pour le moment la plus grosse lacune du Web s�mantique est le manque flagrant d'ontologies.

  15. #15
    Membre �prouv�
    Avatar de geforce
    Homme Profil pro
    Ing�nieur d�veloppement logiciels
    Inscrit en
    Janvier 2010
    Messages
    1 055
    D�tails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activit� : Ing�nieur d�veloppement logiciels
    Secteur : High Tech - �diteur de logiciels

    Informations forums :
    Inscription : Janvier 2010
    Messages : 1 055
    Par d�faut
    Bonjour � tous,

    1- Comment peut-on trouver la description des balises de toutes les ontologies (Mot cl�s, signification, namespace en relation, pr�fixe ....) pour pouvoir les utiliser dans d'autres contextes de connaissance.

    2- Juste une pr�cision les moteurs d'inf�rence qui utilisent ces balises ou propri�t�s RDFa pr�sentement c'est juste Google ? Comment peut on savoir qu'elles sont utilis�es (autre que dans un contexte de r�f�rencement)?

    Merci

  16. #16
    Expert confirm�

    Avatar de snake264
    Homme Profil pro
    Datascientist chez Leboncoin
    Inscrit en
    Novembre 2006
    Messages
    2 914
    D�tails du profil
    Informations personnelles :
    Sexe : Homme
    �ge : 38
    Localisation : France, Alpes Maritimes (Provence Alpes C�te d'Azur)

    Informations professionnelles :
    Activit� : Datascientist chez Leboncoin
    Secteur : High Tech - Multim�dia et Internet

    Informations forums :
    Inscription : Novembre 2006
    Messages : 2 914
    Par d�faut
    Citation Envoy� par geforce Voir le message
    Bonjour � tous,

    1- Comment peut-on trouver la description des balises de toutes les ontologies (Mot cl�s, signification, namespace en relation, pr�fixe ....) pour pouvoir les utiliser dans d'autres contextes de connaissance.
    Tu peux utiliser ce site http://lov.okfn.org/dataset/lov/

    Citation Envoy� par geforce Voir le message
    2- Juste une pr�cision les moteurs d'inf�rence qui utilisent ces balises ou propri�t�s RDFa pr�sentement c'est juste Google ? Comment peut on savoir qu'elles sont utilis�es (autre que dans un contexte de r�f�rencement)?

    Merci
    Voir Google knowledge graph, Bing knowledge graph, etc... Tout les moteurs de recherche maintenant les utilisent.

Discussions similaires

  1. Introduction au Web s�mantique
    Par snake264 dans le forum Web s�mantique
    R�ponses: 19
    Dernier message: 25/11/2016, 12h00

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo