Pentru ca inca reprezinta una din dilemele webmasterilor Matt Cutts revine cu un scurt tutorial video despre cum se sterg paginile din Google.
El analizeaza 6 metode dintre care unele sunt de stergere din index iar altele sunt folosite pentru a preveni indexarea unor pagini/situri:
Don't link to page - Chiar daca esti absolut sigur ca nu ai link catre o anumita pagina nu poti fi niciodata sigur ca altcineva nu a pus un link catre acea pagina. Nici daca sa presupunem ca esti absolut sigur ca nu este link catre pagina pe care vrei sa o feresti de motoarele de cautare tot nu este o idee buna ca sa impedici Google-ul sa indexeze astfel o pagina. Pentru ca in momentul in care intri pe o pagina iar apoi navighezi catre o alta, atunci pagina pe care erai inainte apare pe serverul celei de-a doua pagini de unde poate fi preluata de Google. Fenomenul poate fi observat si in contul de Analytics de exemplu cand vezi ca "referring sites" situri care in mod cat se poate de clar nu sunt referers pentru situl tau.
.htacces - Una din excelente metode de prevenire. Spre exemplu se pot pune parole pe anumite directoare, parole de care nici un crawler nu poate trece
robots.txt - O metoda destul de buna dar care nu are eficienta maxima pentru ca desi motorul de cautare nu va indexa pagina respectiva este foarte posibil ca la anumite cautari sa fie returnat un rezultat care se numeste "uncrawled reference". De asemenea este indicat ca inainte sa pui pe un sit un fisier robots.txt sa il verifici cu acel tool care exista in webmaster tools.
noindex - Practic noindex spune crawlerului ca nu are voie sa indexeze acea pagina. Yahoo si MSN vor returna linkul acelei pagini desi nu o indexeaza. Uneori Google-ul se comporta la fel. Practic motoarele de cautare citesc paginile dar nu le pastreaza in index. De aceea linkurile de pe paginile care folosesc noindex transfera link juice.
nofollow - Pe linkuri individuale. Nu este de mare ajutor pentru ca desi nu linkezi catre o anumita pagina se poate gasi cineva care sa o faca.
Url Removal Tool - Foarte bun pentru a scoate din index. Poti jongla cum vrei cu el. Mai multe detalii cautand pe Google url removal tool
Numai bine