-
Intrebare PDF
Am o nelamurire :shifty:
Sa zicem ca am un e-book PDF. Google indexeaza continutul PDF-urilor necriptate, right?
Na acum, daca eu vreau sa copiez continutul e-book-ului pe o pagina, pe acelasi site, va considera textul din PDF cu textul de pe pagina ca duplicat?
Daca da, cum pot face sa opresc sa indexeze PDF-ul (din PDF, nu din robots.txt). Bine am zis sau am fost prea confuz? :shifty:
-
Cred ca il poate considera continut duplicat din moment ce Google stie sa-l afiseze si in format HTML. Direct din PDF e posibil sa nu-l indexeze (corect) doar daca ii pui protectie impotriva copierii/modificarii, cam asta se intampla si cu atasamentele pdf securizate de pe Gmail, nu sunt afisate.
Concret nu cred ca stie nimeni sa-ti spuna, incearca sa faci singur niste teste.
-
Hmm mersi W!ll. Dar daca pun in robots.txt asa:
User-agent: *
Disallow: /wp-content/themes/bla/ebook/ghiddebla.pdf
In mod normal ar trebui sa il blocheze de la indexare nu?
-
Da. Daca ai mai multe pdf-uri am impresia ca poti sa blochezi tot ce se termina cu .pdf. Sau cel mai simplu excluzi folderul in care ai pdf-urile.
-
Eu in locul tau as ascunde PDF-urile de catre boti.
if (!$bot) echo '<a href="fisier.pd">download pdf</a>';
-
Tudi, eu as face un folder special in care sa pun fisiere pe care nu le vreau indexate, dupa care l-as trece in robots.txt cu disallow :)