Discussion: parser un page HTML
Afficher un message
Vieux 30/07/2007, 21h32   #3
Denis Beauregard
Aucun Avatar
 
Messages: n/a
Hébergeur:
Par défaut Re: parser un page HTML

Le 30 Jul 2007 16:44:10 GMT, "Etienne SOBOLE" <etienne@trash.com>
écrivait dans fr.comp.lang.php:

>Salut j'ai besoin de récuperer l'arborescence du page HTML.
>donc il faudrait que je la transforme en un XML valide.
>etes-ce que quelqu'un a une idée de comment faire ca???


Parlez-vous de l'arborescence des balises ou des pages ?

Dans le 1er cas, on a 2 situations : HTML valide ou non.

Si on prend pour acquis que le HTML est valide, il suffit
de regarder les balises au fur et à mesure et d'avancer ou
reculer d'un pas dans la hiérarchie en notant dans un tableau
ce qui est ouvert.

Par exemple : <head> on monte de 1 et on note que le niveau
courant est un <head>. </head> on vérifie si le niveau courant
est bien un <head> et on descend de 1.

Comme sortie, cela dépend de ce que vous voulez. Par exemple,
un tableau en 2 colonnes, la 1re étant la pile au complet et
la 2e, ce qui suit la balise courante.

Ceci dit, quel est le but ? Il doit bien y avoir des outils qui
font déjà ce que vous voulez. Par exemple, il suffit de trouver
le source de n'importe quel navigateur, mais là, on n'est plus en
PHP du tout. Au fait, pourquoi poser la question dans un forum
dédié au PHP ?

Si vous disiez ce que vous voulez faire, peut-être que quelqu'un
pourrait suggérer un outil existant.


Denis
  Réponse avec citation
 
Page generated in 0,07514 seconds with 9 queries