12 out of 12 members found this post helpful.
Adevarata problema cu PDF-urile folosite in blackhat seo
Pentru cei care nu stiu despre ce este vorba aruncati mai intai o privire aici: https://blogs.sophos.com/2015/07/07/...rn-new-tricks/
Ca PDF-urile sunt calculate de Google dupa criterii diferite nu mai este un secret pentru nimeni. Ceea ce nu am vazut adus in discutie este faptul ca majoritatea PDF-urilor folosite in asemenea campanii nu contin doar cuvinte generate de diferite softuri ci si full text content preluat de pe site-urile care rankeaza in primele doua pagini ale Google pe cuvintele cheie targetate. Aici nu vorbim de content furat cu copy/paste, ci zilnic extras automat de scripturile spammerilor si adaugat in PDF-uri. Cum PDF-urile nu sufera inca de pe urma penalizarilor Google si sunt tratate cu indiferenta de algoritmii anti-spam, apare problema cu duplicate content.
Credeti ca Google stie sa faca diferenta intre site-ul care este sursa originala a unui text si PDF-urile folosite in campanii blackhat? Nope. Nu are nici cea mai mica idee. Asa ca daca va pomeniti cu o scadere a traficului de 20-30% si la o cautare pe Google gasiti fisiere PDF ce contin parti din textele scrise de voi, puteti sa injurati printre dinti concurenta si sa ridicati din umeri neputinciosi. Sa nu ramaneti uimiti daca vedeti ca acele PDF-uri au doar cateva zile vechime si contentul vostru este prezent de ani buni. Pentru ca se pare ca si aici exista o mica problema. Ce gaseste Google in PDF este de cele mai multe ori tratat ca si content original, chiar daca PDF-ul de-abia a aparut pe net. Asta nu inseamna ca acele PDF-uri vor fi neaparat intotdeauna inaintea voastra in rezultate. Insa site-ul vostru scade in SERP si concurenta va creste automat.
Nu cred ca am auzit pana acum de o metoda atat de simpla si rapida de a iti darama, in mod neloial, concurenta. Seamana foarte mult cu problema agregatoarelor, dar rezultatele negative pot fi mult mai dezastruoase si mai rapide.
Ca rezolvare nu va ramane decat sa raportati asemenea fisiere si sa sperati la minuni. Daca fisierele PDF sunt hostate pe site-uri sparte folositi https://www.google.com/safebrowsing/report_badware/. Asa exista sansa ca si site-ul celui care foloseste aceste metode sa fie blocat.
//Editez ca sa evit potentiale discutii la calitatea testelor pe care le-am facut.//
Testele mele nu sunt facute pe piata romaneasca. Am urmarit evolutia testului doar pe google.com/co.uk/de/pl/hu/lv
Am folosit trei site-uri personale aflate in primele 3 pozitii in Google cu anumite keywords pe care nu le prea monetizez si puteau fi sacrificate.
Toate cele 3 site-uri au hosting, ip si registrar info diferite. Contentul este diferit pe fiecare dintre ele.
Cele trei site-uri nu au mai suferit fluctuatii majore in SERP pe acele kw de aproape un an si beneficiaza de cateva backlinks cu autoritate pe nisa lor. Fiecare dintre cele 3 site-uri folosite in test are linkurile provenite din surse diferite.
Am luat bucati intregi de content de pe paginile mele care rankau pe acele kw si le-am adaugat in PDF-uri statice (fara cloaking redirect ca in exemplele date pe sophos).
PDF-urile au fost puse pe 8 domenii fara legatura cu nisa mea si cu o autoritate foarte mica.
Fiecare dintre cele 8 domenii aveau pe index link catre pdf-urile hostate pe acelasi server doar pentru a fi indexate. Domeniul A.COM avea link doar catre A.COM/fisier.pdf, B.com doar catre B.com/fisier.pdf
Testul a inceput pe data de 9 Iulie si am vazut primele schimbari negative in SERP dupa 4 zile (aproape imediat cum fost indexate PDF-urile). Ieri, domeniile mele au suferit o cadere foarte brusca, majoritatea ajungand pe paginile 2 si 3 pe cuvintele cheie folosite la test.
Ultima modificare făcută de CDK; 18th July 2015 la 16:49.
1 out of 1 members found this post helpful.

Postat în original de
Hakuna Matata
In alta ordine de idei nu este tocmai ok ca astfel de teste sa apara pe un forum de white
seo, motivele fiind lesne de inteles. Tu ai avut o oarecare deontologie testand pe site-urile proprii insa e putin probabil ca si altii sa aplice aceiasi etica [e mai usor sa-ti bati joc de munca altora decat sa creezi singur ceva]. Ar fi fost ok ca acest test sa apara daca exista si antidotul, insa cand si altii confirma ca are efect, nu este in regula.
Daca eu m-am gandit sa fac un asemenea test cu siguranta si altii s-au gandit si l-au facut deja sau il vor face. Uneori, calea cea mai buna de a forta o companie sa ia masuri este sa faci full disclosure si sa lasi hienele sa abuzeze sistemul. Cand procentul abuzurilor creste de la o zi la alta apar si rezolvari rapide. In schimb, daca vorbim de cateva cazuri izolate, problema in sine va fi trecuta pe o lista TODO si va persista mult mai mult timp pana apare un patch. Uneori este de preferat sa exista pierderi majore intr-un timp foarte scurt si sa apara o rezolvare rapida, decat sa persiste problema timp indelungat si sa fie aplicata de cei din comunitatile underground. Pentru ca in underground nu exista reguli si poti fi oricand afectat mult mai grav de ceva de genul asta.
In cazul de fata ce am facut eu se poate numi cu greu full disclosure, dar este foarte important ca tot mai multi oameni sa fie constienti de anumite tactici blackhat si sa le raporteze la timp. In felul acesta rata incidentelor raportate catre Google va creste vertiginos si li se va acorda atentia potrivita. Implicatiile unei asemenea metode depasesc cu mult problema seo. Sa ne gandim cum ar fi, prin absurd, daca cineva ar reusi sa detroneze de pe primul loc printr-o asemenea metoda un site ce ofera un produs software la download si sa trimita vizitatorii catre o clona a site-ului ce imprastie malware.