Adevarata problema cu PDF-urile folosite in blackhat seo
Pentru cei care nu stiu despre ce este vorba aruncati mai intai o privire aici: https://blogs.sophos.com/2015/07/07/...rn-new-tricks/
Ca PDF-urile sunt calculate de Google dupa criterii diferite nu mai este un secret pentru nimeni. Ceea ce nu am vazut adus in discutie este faptul ca majoritatea PDF-urilor folosite in asemenea campanii nu contin doar cuvinte generate de diferite softuri ci si full text content preluat de pe site-urile care rankeaza in primele doua pagini ale Google pe cuvintele cheie targetate. Aici nu vorbim de content furat cu copy/paste, ci zilnic extras automat de scripturile spammerilor si adaugat in PDF-uri. Cum PDF-urile nu sufera inca de pe urma penalizarilor Google si sunt tratate cu indiferenta de algoritmii anti-spam, apare problema cu duplicate content.
Credeti ca Google stie sa faca diferenta intre site-ul care este sursa originala a unui text si PDF-urile folosite in campanii blackhat? Nope. Nu are nici cea mai mica idee. Asa ca daca va pomeniti cu o scadere a traficului de 20-30% si la o cautare pe Google gasiti fisiere PDF ce contin parti din textele scrise de voi, puteti sa injurati printre dinti concurenta si sa ridicati din umeri neputinciosi. Sa nu ramaneti uimiti daca vedeti ca acele PDF-uri au doar cateva zile vechime si contentul vostru este prezent de ani buni. Pentru ca se pare ca si aici exista o mica problema. Ce gaseste Google in PDF este de cele mai multe ori tratat ca si content original, chiar daca PDF-ul de-abia a aparut pe net. Asta nu inseamna ca acele PDF-uri vor fi neaparat intotdeauna inaintea voastra in rezultate. Insa site-ul vostru scade in SERP si concurenta va creste automat.
Nu cred ca am auzit pana acum de o metoda atat de simpla si rapida de a iti darama, in mod neloial, concurenta. Seamana foarte mult cu problema agregatoarelor, dar rezultatele negative pot fi mult mai dezastruoase si mai rapide.
Ca rezolvare nu va ramane decat sa raportati asemenea fisiere si sa sperati la minuni. Daca fisierele PDF sunt hostate pe site-uri sparte folositi https://www.google.com/safebrowsing/report_badware/. Asa exista sansa ca si site-ul celui care foloseste aceste metode sa fie blocat.
//Editez ca sa evit potentiale discutii la calitatea testelor pe care le-am facut.//
Testele mele nu sunt facute pe piata romaneasca. Am urmarit evolutia testului doar pe google.com/co.uk/de/pl/hu/lv
Am folosit trei site-uri personale aflate in primele 3 pozitii in Google cu anumite keywords pe care nu le prea monetizez si puteau fi sacrificate.
Toate cele 3 site-uri au hosting, ip si registrar info diferite. Contentul este diferit pe fiecare dintre ele.
Cele trei site-uri nu au mai suferit fluctuatii majore in SERP pe acele kw de aproape un an si beneficiaza de cateva backlinks cu autoritate pe nisa lor. Fiecare dintre cele 3 site-uri folosite in test are linkurile provenite din surse diferite.
Am luat bucati intregi de content de pe paginile mele care rankau pe acele kw si le-am adaugat in PDF-uri statice (fara cloaking redirect ca in exemplele date pe sophos).
PDF-urile au fost puse pe 8 domenii fara legatura cu nisa mea si cu o autoritate foarte mica.
Fiecare dintre cele 8 domenii aveau pe index link catre pdf-urile hostate pe acelasi server doar pentru a fi indexate. Domeniul A.COM avea link doar catre A.COM/fisier.pdf, B.com doar catre B.com/fisier.pdf
Testul a inceput pe data de 9 Iulie si am vazut primele schimbari negative in SERP dupa 4 zile (aproape imediat cum fost indexate PDF-urile). Ieri, domeniile mele au suferit o cadere foarte brusca, majoritatea ajungand pe paginile 2 si 3 pe cuvintele cheie folosite la test.