Discussion: parser un page HTML
Afficher un message
Vieux 31/07/2007, 16h52   #6
xav
Aucun Avatar
 
Messages: n/a
Hébergeur:
Par défaut Re: parser un page HTML

Etienne SOBOLE a écrit :

> bien c'est assez simple!
> je cherche a isoler une partie d'une page en fonction de son id.
>
> en gros on suppose qu'a un endroit dans ma page web j'ai
> <xx id='toto'>
> ...
> ...
> </xx>
>
> je souhaite récupérer le contenu de l'arborescence a partir de cette balise
> !


Salut,
pour être sur de la validité syntaxique du html à analyser, il faut
passer par un outil comme Tidy , tu peut éventuellement passer le html
source par un outil genre HTMLPurifier ( http://htmlpurifier.org/ ) ,
une fois cela effectué, tu auras du xhtml propre, tu peut ensuite
utiliser du xpath dessus pour récupérer le morceau d'arbo que tu veux.


my 2 cents

Xavier
  Réponse avec citation
 
Page generated in 0,05200 seconds with 9 queries