PHWinfo banniere

Titres
PORTAIL ANNUAIRE ARTICLES COMPARATEUR HÉBERGEURS DEVIS FORUMS RÉDUCTEUR D'URL
Précédent   PHWinfo > Autres forums > Forum Programmation & Conception > comp.lang.php > Scan web pages and compose summary
S'inscrire FAQ Membres Recherche Messages du jour Marquer les forums comme lus
Scan web pages and compose summary

Réponse
 
LinkBack Outils de la discussion
Vieux 17/01/2008, 20h48   #1
solk
Aucun Avatar
 
Messages: n/a
Hébergeur:
Par défaut Scan web pages and compose summary

Hello.

I am looking for a way to read html file and create
a short summary (like that shows in google results for example)
which ought to be the first few lines of welcome text or so.

Does any got any idea on how to do this? (I searched allot,
but all I found was simply extracting meta tags).

Thanks
  Réponse avec citation
Vieux 17/01/2008, 22h11   #2
adwatson
Aucun Avatar
 
Messages: n/a
Hébergeur:
Par défaut Re: Scan web pages and compose summary

Well, the tricky part is that you'll need to decide what text to grab
and show from the file - which is why there's a meta description tag
for the purpose. I believe google grabs the text surrounding a search
term and displays that if there's no meta description tag to use - so
if you're actually searching for a term you could do something like
that.

---
www.NEXCESS.NET - Shared/Reseller Hosting
www.EliteRax.com - Dedicated Servers, Server Clusters
www.MaxVPS.com - Virtual Private Servers
- Great prices, Great service - check us out!

On Jan 17, 3:48 pm, solk <rikibl...@gmail.com> wrote:
> Hello.
>
> I am looking for a way to read html file and create
> a short summary (like that shows in google results for example)
> which ought to be the first few lines of welcome text or so.
>
> Does any got any idea on how to do this? (I searched allot,
> but all I found was simply extracting meta tags).
>
> Thanks


  Réponse avec citation
Vieux 18/01/2008, 10h51   #3
Jensen Somers
Aucun Avatar
 
Messages: n/a
Hébergeur:
Par défaut Re: Scan web pages and compose summary

Hello,

solk wrote:
> Hello.
>
> I am looking for a way to read html file and create
> a short summary (like that shows in google results for example)
> which ought to be the first few lines of welcome text or so.
>
> Does any got any idea on how to do this? (I searched allot,
> but all I found was simply extracting meta tags).
>
> Thanks


I can recommend Snoopy (http://snoopy.sourceforge.net/). It is able to
retrieve an entire web page, follow links and so on. The result will be
the HTML source output you can see if you do a view source in your web
browser. From there you can strip HTML tags, use substr() to jump to
certain sections in the source (eg: jump to right after the body tag,
remove all HTML tags and save the text output).

- Jensen
  Réponse avec citation
Réponse


Outils de la discussion

Règles de messages
Vous ne pouvez pas créer de nouvelles discussions
Vous ne pouvez pas envoyer des réponses
Vous ne pouvez pas envoyer des pièces jointes
Vous ne pouvez pas modifier vos messages

Les balises BB sont activées : oui
Les smileys sont activés : oui
La balise [IMG] est activée : oui
Le code HTML peut être employé : non
Trackbacks are oui
Pingbacks are oui
Refbacks are oui


Fuseau horaire GMT +1. Il est actuellement 19h21.


Édité par : vBulletin® version 3.7.3
Copyright ©2000 - 2008, Jelsoft Enterprises Ltd.
Search Engine Friendly URLs by vBSEO 3.2.0 RC5 Tous droits réservés.
Version française #16 par l'association vBulletin francophone
PHWinfo est un site Éducation Sans Frontières ©2000-2008
Ad Management by RedTyger
©Tous droits réservés par les parties respectives
Page generated in 0,09135 seconds with 11 queries