IdentifiantMot de passe
Loading...
Mot de passe oubli� ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les r�ponses en temps r�el, voter pour les messages, poser vos propres questions et recevoir la newsletter

Format d'�change (XML, JSON...) Java Discussion :

Recherche un parser XML (tr�s) "permissif"


Sujet :

Format d'�change (XML, JSON...) Java

  1. #1
    Nouveau candidat au Club
    Profil pro
    D�veloppeur Java
    Inscrit en
    Janvier 2008
    Messages
    2
    D�tails du profil
    Informations personnelles :
    Localisation : France, Haute Garonne (Midi Pyr�n�es)

    Informations professionnelles :
    Activit� : D�veloppeur Java

    Informations forums :
    Inscription : Janvier 2008
    Messages : 2
    Par d�faut Recherche un parser XML (tr�s) "permissif"
    Comme tout le monde ne respecte pas les standards (), j'aurai besoin d'une impl�mentation de parser XML Java (jdk 1.5) relativement permissive... et performante

    Pour faire simple, j'ai besoin de parser un grand nombre de flux RSS de mani�re tr�s r�guli�re et il se trouve que ces flux ne sont pas n�cessairement valides d'un point de vue XML (caract�res accentu�s, mal encod�s, non respect du sch�ma...). Cependant, comme je dois qd m�me extraire de l'info de ces flux, et afin de ne pas g�rer les probl�mes au niveau de mon appli ou d�velopper mon propre parser, j'aimerais trouver un parser qui puisse �tre assez souple pour ne pas refuser d'analyser le pseudo XML que je lui donne.

    Des propositions?

  2. #2
    R�dacteur
    Avatar de CyberChouan
    Homme Profil pro
    Directeur technique
    Inscrit en
    Janvier 2007
    Messages
    2 752
    D�tails du profil
    Informations personnelles :
    Sexe : Homme
    �ge : 42
    Localisation : France, Paris (�le de France)

    Informations professionnelles :
    Activit� : Directeur technique
    Secteur : Communication - M�dias

    Informations forums :
    Inscription : Janvier 2007
    Messages : 2 752
    Par d�faut
    Pour ce qui est de trouver un parseur qui accepte les caract�res accentu�s, je pense que tu trouveras �a sans probl�me. pour le non respect du sch�ma, tu peux d�sactiver la v�rification �galement sur grand nombre de parseurs.

    Typiquement, je pense que JDom doit pouvoir r�pondre � ton besoin sur ces deux points.

    Par contre, je ne connais pas de parseur qui sera permissif au point d'accepter un xml mal form� (balises ouvertes qui ne sont pas ferm�es, etc.)
    Avant de poster, pensez � regarder la FAQ, les tutoriaux, la Javadoc (de la JRE que vous utilisez) et � faire une recherche
    Je ne r�ponds pas aux questions techniques par MP: les forums sont faits pour �a
    Mes articles et tutoriaux & Mon blog informatique

  3. #3
    Expert confirm�
    Avatar de GrandFather
    Inscrit en
    Mai 2004
    Messages
    4 587
    D�tails du profil
    Informations personnelles :
    �ge : 55

    Informations forums :
    Inscription : Mai 2004
    Messages : 4 587
    Par d�faut
    Il n'existe pas de parseur XML "permissif" � l'instar des parseurs HTML impl�ment�s dans les navigateurs actuels, la rigueur lexicale �tant impos�e par la sp�cification XML. D'un point de vue technique, pour un parseur XML, du XML mal form� n'est pas du XML. En cons�quence, il sera incapable de le traiter et de le restituer sous forme �v�nementielle (SAX) ou structur�e (DOM).

    La seule solution pour traiter tes flux RSS "pourris" avec des performances acceptables et sans monter une usine � gaz est d'utiliser les expressions r�guli�res.
    FAQ XML
    ------------
    � Le moyen le plus s�r de cacher aux autres les limites de son savoir est de ne jamais les d�passer �
    Giacomo Leopardi

  4. #4
    Nouveau candidat au Club
    Profil pro
    D�veloppeur Java
    Inscrit en
    Janvier 2008
    Messages
    2
    D�tails du profil
    Informations personnelles :
    Localisation : France, Haute Garonne (Midi Pyr�n�es)

    Informations professionnelles :
    Activit� : D�veloppeur Java

    Informations forums :
    Inscription : Janvier 2008
    Messages : 2
    Par d�faut
    Je comprends bien qu'un vrai parser XML ne g�re pas du XML mal-form�, mais j'avais imagin� que certains parsers auraient pu proposer du parsing "at-all-costs"...

    Sinon, quelqu'un conna�trait-il une API ou un framework me permettant de parser au mieux mes flux RSS non-conformes sans perdre trop de temps � r�inventer la roue?

Discussions similaires

  1. Recherche d'un parser XML
    Par ludovic tambour dans le forum Composants VCL
    R�ponses: 3
    Dernier message: 07/12/2005, 12h05
  2. [XML] recherche un parser cross platform : libXML2 ou Xerces ???
    Par baert dans le forum Autres �diteurs
    R�ponses: 2
    Dernier message: 13/09/2005, 14h49

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo