Etienne SOBOLE a écrit :
> bien c'est assez simple!
> je cherche a isoler une partie d'une page en fonction de son id.
>
> en gros on suppose qu'a un endroit dans ma page web j'ai
> <xx id='toto'>
> ...
> ...
> </xx>
>
> je souhaite récupérer le contenu de l'arborescence a partir de cette balise
> !
Salut,
pour être sur de la validité syntaxique du html à analyser, il faut
passer par un outil comme Tidy , tu peut éventuellement passer le html
source par un outil genre HTMLPurifier (
http://htmlpurifier.org/ ) ,
une fois cela effectué, tu auras du xhtml propre, tu peut ensuite
utiliser du xpath dessus pour récupérer le morceau d'arbo que tu veux.
my 2 cents
Xavier