Vreau sa opresc indexarea tuturor paginilor dintr-un site ce reprezinta versiunile printabile ale paginilor de produs - toate url-urile care contin print.html (duplicate content). Ca sa fac asta prin robots.txt care ar fi sintaxa corecta?
Eu ma gandeam la ceva de genul:
Noindex: /*print.html$
(e corecta sintaxa asta daca vreau sa afecteze doar paginile din site care contin print.html?)
As folosi Noindex pentru ca vreau sa fie si scoase din indexul Google automat (stiu ca Noindex e inteles doar de Google).
E mai bine sa folosesc Disallow? Ce s-ar intampla daca as folosi si Noindex si Disallow cu aceeasi sintaxa in robots.txt? Ar fi scoase cele deja indexate in Google si in acelasi timp s-ar interzice accesul la cele noi?
Noindex: /*print.html$
Disallow: /*print.html$
Multumesc anticipat pentru raspunsuri