Přejděte na >> nový blog <<
Z důvodů těžké spravovatelnosti tento blog zavírám a bude sloužit již jen jako archiv článků.
Weblog   Foto galerie   Odkazy   Implementace katedrálního portálu   ZČU-FAV

Vyhledávače a UTF-8

Vyhledávače a UTF-8

2004-12-26 22:57 | 1642 x   Programování

Publikační systém Xaraya, do kterého jsem převedl celý web, podporuje standardně kódování znaků v UTF-8. Jedná se o bytově variabilní formát. Více se můžete dočíst třeba na intervalu. Myslel jsem si, že si s ním vyhledávače poradí bez problémů. Tedy až do té doby než jsem pustil Poodle Predirector. Ten by měl na požádání ukázat stránku, tak jak ji vidí google.com. Podle všeho by si měl s tímto kódováním poradit. To samé Jyxo. Bohužel Poodle ukázál změť znaků, která rozhodně nevypovídá o jeho schopnosti číst korektně UTF-8. Jal jsem se tedy problém vyřešit, bohužel nepřišel jsem na jedinou věc, která by byla v hlavičče špatně. Kódování je zadáno korektně: <meta http-equiv="Content-Type" content="text/html; charset=utf-8" />. Problém by mohl být buď neudaný jazyk, který by na to vliv mít neměl, nebo spíše, to že si s UTF-8 Poodle neporadí. Alespo? s českými znaky. Uvidíme při prvním indexování.

Dodatek: Po hledání podobných problémů jsem zjistil, že chyba je asi na straně Poodle Predirector. V diskuzi na jakpsatweb.cz si autorka webu tucnak.cz stěžuje, že jí google stránky špatně indexuje. Po zadání slova punčocháče měla problém s češtinou. Nakonec byla chyba ve špatně zadané hlavičce, která je již v současné verzi v pořádku. Nechal jsem tyto stránky projít predirectorem a výsledek je stále špatně. V google.com, ale vše již běží bez problémů. Jsem zvědav, jak stránky dopadnou při první indexaci. Zatím k ní, ani na google ani na jyxo nedošlo.


Jméno
Email
http://
Zpráva
  Příkazy Textile