Vyřazení PDF z indexace Google a Yahoo
Sobota, 25 Červenec 2009 09:01
Jak jistě víte někdy tak trochu omylem Google nebo Yahoo indexují místo html stránek jejich vygenerované PDF a ty se poté objevují na vyších místech vyhledávání než samotná html stránka. Bohužel pokud uživatel otevře pouze vygenerované PDF nemá jinou momžnost než po přečtení dokumentu stránky opustit, jelikož nikde nemá navigační menu, kromě odkazů uvedených v článku. Proto je vždy lepší indexovat samotnou html stránku než PDF dokument.
Řešení problému je poměrně jednoduché. Stačí do souboru robots.txt vložit stránky, které Googlebot nebo Slurp (procházecí bot Yahoo). Soubor robots.txt najdete přímo v kořenovém adresáři Joomly.
Ukažme si řešení pro Joomla 1.0 i pro Joomla 1.5. Nejpreve začneme i starší verze
Joomla 1.0 (s i bez SEF)
User-agent: Googlebot
Disallow: /index2.php?option=com_content&do_pdf=1*User-agent: Slurp
Disallow: /index2.php?option=com_content&do_pdf=1*
Toto řešení funguje jak se zapnutým SEF tak bez něho
Joomla 1.5 bez zapnutých SEF třetí strany
User-agent: GooglebotPokud používáte některou ze SEF komponent je nutno identifikovat tu část URL adresy, která patří ke generovanému PDF dokumentu například takto:
Disallow: /index.php?view=article*&format=pdf
Disallow: /index.php?view=article*&print=1*
Disallow: /index.php?option=com_mailto*
Disallow: /component/mailto/*User-agent: Slurp
Disallow: /index.php?view=article*&format=pdf
Disallow: /index.php?view=article*&print=1*
Disallow: /index.php?option=com_mailto*
Disallow: /component/mailto/*
Disallow: /*/pdf_stri
Pokud si budete chtít otestovat zda-li řešení funguje, lze si otestovat uvedené řešení pomocí Google Webmasterl Tool v sekci Konfigurace Stránek>Přístupy prohledávačů
To je pro dnešek vše tento článek byl přeložen ze stránek teachmejoomla.net
Přidej Váš komentář
Další odkazy
Spřátelené weby
Anketa
Uživatelé na chatu
- No users online
