PHWinfo banniere

Titres
PORTAIL ANNUAIRE ARTICLES COMPARATEUR HÉBERGEURS DEVIS FORUMS RÉDUCTEUR D'URL
Précédent   PHWinfo > Autres forums > Forum Programmation & Conception > comp.lang.ruby > Hpricot Html Parsing
S'inscrire FAQ Membres Recherche Messages du jour Marquer les forums comme lus
Hpricot Html Parsing

Réponse
 
LinkBack Outils de la discussion
Vieux 14/09/2007, 09h34   #1
Suja Suchu
Aucun Avatar
 
Messages: n/a
Hébergeur:
Par défaut Hpricot Html Parsing

Hi,
I'm getting funky characters, when parsing html using Hpricot.
How to remove this funky character?

Anyone have a fix / workaround for this?

thanks in advance,
Suja
--
Posted via http://www.ruby-forum.com/.

  Réponse avec citation
Vieux 14/09/2007, 11h53   #2
Thibaut Barrère
Aucun Avatar
 
Messages: n/a
Hébergeur:
Par défaut Re: Hpricot Html Parsing

Hi Suja,

two suggestions:
- check the encoding used by the page you're hashpricoting (doh -
think I just invented a verb, or what).
- puts $KCODE to see if you're running in unicode or not. If you are
hashpricoting a page encoded in UTF-8, but KCODE is set to none (or if
the page is in latin1, but KCODE is set to U), then you'll have to
change the encoding using iconv for instance.

cheers

Thibaut

  Réponse avec citation
Vieux 15/09/2007, 10h17   #3
Lee Jarvis
Aucun Avatar
 
Messages: n/a
Hébergeur:
Par défaut Re: Hpricot Html Parsing

Suja JS wrote:
> Hi,
> I'm getting funky characters, when parsing html using Hpricot.
> How to remove this funky character?
>
> Anyone have a fix / workaround for this?
>
> thanks in advance,
> Suja


Could you describe these 'funky characters'?
--
Posted via http://www.ruby-forum.com/.

  Réponse avec citation
Vieux 15/09/2007, 10h22   #4
Suja JS
Aucun Avatar
 
Messages: n/a
Hébergeur:
Par défaut Re: Hpricot Html Parsing

Lee Jarvis wrote:
> Suja JS wrote:
>> Hi,
>> I'm getting funky characters, when parsing html using Hpricot.
>> How to remove this funky character?
>>
>> Anyone have a fix / workaround for this?
>>
>> thanks in advance,
>> Suja

>
> Could you describe these 'funky characters'?


Like '�' in this text.
"By Mike Monson CHAMPAIGN � Effective today the city of Champaign is
closing three bridges and posting load limits on three others."
--
Posted via http://www.ruby-forum.com/.

  Réponse avec citation
Vieux 15/09/2007, 11h14   #5
Thibaut Barrère
Aucun Avatar
 
Messages: n/a
Hébergeur:
Par défaut Re: Hpricot Html Parsing

> "By Mike Monson CHAMPAIGN ? Effective today the city of Champaign is
> closing three bridges and posting load limits on three others."


hint hint : http://www.news-gazette.com/news/loc...s_limits_loads

The minus character you see after CHAMPAIGN is not a regular "-".

  Réponse avec citation
Réponse


Outils de la discussion

Règles de messages
Vous ne pouvez pas créer de nouvelles discussions
Vous ne pouvez pas envoyer des réponses
Vous ne pouvez pas envoyer des pièces jointes
Vous ne pouvez pas modifier vos messages

Les balises BB sont activées : oui
Les smileys sont activés : oui
La balise [IMG] est activée : oui
Le code HTML peut être employé : non
Trackbacks are oui
Pingbacks are oui
Refbacks are oui


Fuseau horaire GMT +1. Il est actuellement 07h51.


Édité par : vBulletin® version 3.7.3
Copyright ©2000 - 2008, Jelsoft Enterprises Ltd.
Search Engine Friendly URLs by vBSEO 3.2.0 RC5 Tous droits réservés.
Version française #16 par l'association vBulletin francophone
PHWinfo est un site Éducation Sans Frontières ©2000-2008
Ad Management by RedTyger
©Tous droits réservés par les parties respectives
Page generated in 0,10656 seconds with 13 queries