Rezultate 1 la 8 din 8

Subiect: Adevarata problema cu PDF-urile folosite in blackhat seo

  1. #1
    Avatarul lui CDK
    CDK
    CDK este deconectat Membru SeoPedia
    Reputatie:
    35
    Data înscrierii
    17th June 2013
    Vârstă
    43
    Posturi
    94
    Putere Rep
    35


    12 out of 12 members found this post helpful.

    Implicit Adevarata problema cu PDF-urile folosite in blackhat seo

    Pentru cei care nu stiu despre ce este vorba aruncati mai intai o privire aici: https://blogs.sophos.com/2015/07/07/...rn-new-tricks/

    Ca PDF-urile sunt calculate de Google dupa criterii diferite nu mai este un secret pentru nimeni. Ceea ce nu am vazut adus in discutie este faptul ca majoritatea PDF-urilor folosite in asemenea campanii nu contin doar cuvinte generate de diferite softuri ci si full text content preluat de pe site-urile care rankeaza in primele doua pagini ale Google pe cuvintele cheie targetate. Aici nu vorbim de content furat cu copy/paste, ci zilnic extras automat de scripturile spammerilor si adaugat in PDF-uri. Cum PDF-urile nu sufera inca de pe urma penalizarilor Google si sunt tratate cu indiferenta de algoritmii anti-spam, apare problema cu duplicate content.

    Credeti ca Google stie sa faca diferenta intre site-ul care este sursa originala a unui text si PDF-urile folosite in campanii blackhat? Nope. Nu are nici cea mai mica idee. Asa ca daca va pomeniti cu o scadere a traficului de 20-30% si la o cautare pe Google gasiti fisiere PDF ce contin parti din textele scrise de voi, puteti sa injurati printre dinti concurenta si sa ridicati din umeri neputinciosi. Sa nu ramaneti uimiti daca vedeti ca acele PDF-uri au doar cateva zile vechime si contentul vostru este prezent de ani buni. Pentru ca se pare ca si aici exista o mica problema. Ce gaseste Google in PDF este de cele mai multe ori tratat ca si content original, chiar daca PDF-ul de-abia a aparut pe net. Asta nu inseamna ca acele PDF-uri vor fi neaparat intotdeauna inaintea voastra in rezultate. Insa site-ul vostru scade in SERP si concurenta va creste automat.

    Nu cred ca am auzit pana acum de o metoda atat de simpla si rapida de a iti darama, in mod neloial, concurenta. Seamana foarte mult cu problema agregatoarelor, dar rezultatele negative pot fi mult mai dezastruoase si mai rapide.

    Ca rezolvare nu va ramane decat sa raportati asemenea fisiere si sa sperati la minuni. Daca fisierele PDF sunt hostate pe site-uri sparte folositi https://www.google.com/safebrowsing/report_badware/. Asa exista sansa ca si site-ul celui care foloseste aceste metode sa fie blocat.


    //Editez ca sa evit potentiale discutii la calitatea testelor pe care le-am facut.//

    Testele mele nu sunt facute pe piata romaneasca. Am urmarit evolutia testului doar pe google.com/co.uk/de/pl/hu/lv

    Am folosit trei site-uri personale aflate in primele 3 pozitii in Google cu anumite keywords pe care nu le prea monetizez si puteau fi sacrificate.

    Toate cele 3 site-uri au hosting, ip si registrar info diferite. Contentul este diferit pe fiecare dintre ele.

    Cele trei site-uri nu au mai suferit fluctuatii majore in SERP pe acele kw de aproape un an si beneficiaza de cateva backlinks cu autoritate pe nisa lor. Fiecare dintre cele 3 site-uri folosite in test are linkurile provenite din surse diferite.

    Am luat bucati intregi de content de pe paginile mele care rankau pe acele kw si le-am adaugat in PDF-uri statice (fara cloaking redirect ca in exemplele date pe sophos).

    PDF-urile au fost puse pe 8 domenii fara legatura cu nisa mea si cu o autoritate foarte mica.

    Fiecare dintre cele 8 domenii aveau pe index link catre pdf-urile hostate pe acelasi server doar pentru a fi indexate. Domeniul A.COM avea link doar catre A.COM/fisier.pdf, B.com doar catre B.com/fisier.pdf

    Testul a inceput pe data de 9 Iulie si am vazut primele schimbari negative in SERP dupa 4 zile (aproape imediat cum fost indexate PDF-urile). Ieri, domeniile mele au suferit o cadere foarte brusca, majoritatea ajungand pe paginile 2 si 3 pe cuvintele cheie folosite la test.
    Ultima modificare făcută de CDK; 18th July 2015 la 16:49.

  2. #2
    Avatarul lui Hakuna Matata
    Hakuna Matata este deconectat Membru SeoPedia
    Reputatie:
    47
    Data înscrierii
    21st January 2011
    Locaţie
    Bucuresti
    Vârstă
    46
    Posturi
    791
    Putere Rep
    47


    Implicit

    Din pura curiozitate as dori sa stiu cateva info suplimentare, desigur daca doresti sa le expui.

    Am folosit trei site-uri personale aflate in primele 3 pozitii in Google cu anumite keywords pe care nu le prea monetizez si puteau fi sacrificate.
    Cate cautari lunare avea fiecare keyword adus in discutie?

    Toate cele 3 site-uri au hosting, ip si registrar info diferite. Contentul este diferit pe fiecare dintre ele.
    Care era dimensiunea contentului pe pagina [inteleg ca rankai cu internal] dar si cea a domeniului?

    ... si beneficiaza de cateva backlinks cu autoritate pe nisa lor. Fiecare dintre cele 3 site-uri folosite in test are linkurile provenite din surse diferite.
    Backlinkurile erau intdreptate doar catre index sau si internal si daca da, ce rata de variatie pe ancora si nofollow aveau? De asemenea care era numarul lor in comparatie cu concurenta de pe prima pagina?

    Ai testat si viceversa?

    Merci!

  3. #3
    Avatarul lui CDK
    CDK
    CDK este deconectat Membru SeoPedia
    Reputatie:
    35
    Data înscrierii
    17th June 2013
    Vârstă
    43
    Posturi
    94
    Putere Rep
    35


    Implicit

    Cate cautari lunare avea fiecare keyword adus in discutie?
    Fiind vorba de mai multe keywords si fiind limitat doar la cele ce puteau fi sacrificate, alternarea numarului de cautari difera foarte mult. Unele kw au 1000 de cautari lunare, altele 3000, altele au 15000. Sa spunem undeva intre 1000 si 15000 pe luna, in functie de keyword.

    Care era dimensiunea contentului pe pagina [inteleg ca rankai cu internal] dar si cea a domeniului?
    Sper ca am inteles bine intrebarea. In afara de pagina de contact si de index, mai toate paginile au continut text mai mare de 700 cuvinte. Difera si numarul de cuvinte in functie de subiectul abordat in pagina. Cele mai importante pagini depasesc cu mult numarul de cuvinte, pentru ca le-am acordat atentie mai mare.

    Site-urile au pagini statice, nu ruleaza sub o platforma. Contentul nou este adaugat o data la 3-4-5 luni, in functie de site. Ultimul update de content a fost facut acum o luna, respectiv doua/doua luni.

    Backlinkurile erau intdreptate doar catre index sau si internal si daca da, ce rata de variatie pe ancora si nofollow aveau?
    Si catre index si internal. Catre internal sunt indreptate intre 5 si 10 linkuri, cateva pe anchor exact pentru unele keywords si majoritatea cu link direct sau expresii de tipul "click here". Nu a fost necesar sa fortez prea mult nota pentru a ranka in primele pozitii pe acele cautari. Atat indexul cat si paginile pe care nu le-am folosit in test rankeaza bine in continuare pe money kw, fara fluctuatii.

    De asemenea care era numarul lor in comparatie cu concurenta de pe prima pagina?
    Concurenta nu a avut si inca nu are prea multe linkuri pe majoritatea keywordurilor testate. Unii au ajuns sub rezultatele mele natural, fara nici un fel de link. Cum majoritatea cuvintelor cheie folosite in test difera in functie de site, "concurenta" din testele mele nu s-a limitat doar la cateva domenii aflate "sub mine", ci la domenii foarte diversificate, in functie de fiecare kw in parte.

    Nu pot spune ca am verificat la sange strategia de linkbuilding a tuturor domeniilor competitive, pentru ca mi-ar fi luat prea mult timp si nu voiam sa intru chiar atat de adanc in detalii cu testul asta. Insa, la o parte din acele keywords pe care le-am considerat mai importante stiu ca este sub mine competitia si nici nu au interes sa rankeze pe acele cautari ca sa forteze o crestere in SERP prin linkbuilding.

    Ca sa intelegi exact, in general contentul scris de mine e copiat de zeci de alte site-uri, unele spammy, altele care "se inspira" masiv din textele mele si totusi nu ma afecteaza pentru ca am domenii cu vechime si cu ceva mai multa autoritate. Insa contentul de pe unele pagini folosite in teste e prezent doar pe vreo doua-trei agregatoare de foarte mult timp, pentru cei care copiaza manual textele la ei pe site-uri neprezentand interes. Atat de slaba e concurenta pe kw respective.

    Nu este o scadere in SERP datorata unei coincidente, daca la asta te gandesti. Nu ar fi avut cum sa se intample pe 3 domenii diferite, pe keywords diferite total in functie de domeniu si fara sa modific ceva la site-uri.

    Ai testat si viceversa?
    Nu cred ca inteleg intrebarea, dar de testat am testat doar ce am descris mai sus. Mai las fisierele PDF sus o perioada si apoi o sa le sterg ca sa vad ce se intampla.

  4. #4
    Avatarul lui Robert
    Robert este deconectat Ambasador
    Reputatie:
    98
    Data înscrierii
    7th August 2007
    Locaţie
    Bucuresti
    Vârstă
    48
    Posturi
    4.029
    Putere Rep
    98


    Implicit

    Citat Postat în original de CDK Vezi Post

    Nu cred ca inteleg intrebarea, dar de testat am testat doar ce am descris mai sus. Mai las fisierele PDF sus o perioada si apoi o sa le sterg ca sa vad ce se intampla.
    Posibil sa nu se (mai) intample nimic. Asa mi-am luat-o eu in mufa cu cateva domenii. Desi am reusit sa elimin din serp paginile celor care m-au plagiat, in urma unui dmca, siteul nu si-a mai revenit niciodata pe acele cautari.
    Daca te pot ajuta cu un sfat sau daca doresti o oferta de optimizare pentru siteul tau, da-mi un mesaj!

  5. #5
    Avatarul lui Hakuna Matata
    Hakuna Matata este deconectat Membru SeoPedia
    Reputatie:
    47
    Data înscrierii
    21st January 2011
    Locaţie
    Bucuresti
    Vârstă
    46
    Posturi
    791
    Putere Rep
    47


    Implicit

    Multumesc pentru raspunsul detaliat.

    Nu este o scadere in SERP datorata unei coincidente, daca la asta te gandesti. Nu ar fi avut cum sa se intample pe 3 domenii diferite, pe keywords diferite total in functie de domeniu si fara sa modific ceva la site-uri.
    Nu la asta m-am gandit, am vrut doar sa vad care era profilul fiecarui site.

    Nu cred ca inteleg intrebarea, dar de testat am testat doar ce am descris mai sus. Mai las fisierele PDF sus o perioada si apoi o sa le sterg ca sa vad ce se intampla.
    Ma refeream la efectul invers al acestei strategii si anume, daca tot controloze acele pdf-uri, incearca sa pui key pe care ai picat in ele, pentru toate cele 3 domenii in cele 8 pdf-uri si vezi daca are si efectul invers, adica daca se duc de unde au plecat.

    Interesant ar fi daca ai avea un al 4-lea domeniu, pe aceiasi nisa, pentru care sa pui link din acele pdf-uri sa vezi in ce directie il misca [dupa logica din test ar trebui sa-l urce].

    ================================================== ================================================== ======

    In alta ordine de idei nu este tocmai ok ca astfel de teste sa apara pe un forum de white seo, motivele fiind lesne de inteles. Tu ai avut o oarecare deontologie testand pe site-urile proprii insa e putin probabil ca si altii sa aplice aceiasi etica [e mai usor sa-ti bati joc de munca altora decat sa creezi singur ceva]. Ar fi fost ok ca acest test sa apara daca exista si antidotul, insa cand si altii confirma ca are efect, nu este in regula.

    Din punctul meu de vedere este o scapare a algoritmului care va fi corectata rapid, in testul de pe blogs.sophos.com am observat ca acele pdf-uri s-au dus incet dar sigur la vale, site-urile afectate au revenit pe pozitiile anterioare.

    ================================================== ================================================== ======

    In rest ... mult succes!
    Ultima modificare făcută de Hakuna Matata; 20th July 2015 la 09:39.

  6. #6
    Avatarul lui CDK
    CDK
    CDK este deconectat Membru SeoPedia
    Reputatie:
    35
    Data înscrierii
    17th June 2013
    Vârstă
    43
    Posturi
    94
    Putere Rep
    35


    1 out of 1 members found this post helpful.

    Implicit

    Citat Postat în original de Hakuna Matata Vezi Post
    In alta ordine de idei nu este tocmai ok ca astfel de teste sa apara pe un forum de white seo, motivele fiind lesne de inteles. Tu ai avut o oarecare deontologie testand pe site-urile proprii insa e putin probabil ca si altii sa aplice aceiasi etica [e mai usor sa-ti bati joc de munca altora decat sa creezi singur ceva]. Ar fi fost ok ca acest test sa apara daca exista si antidotul, insa cand si altii confirma ca are efect, nu este in regula.
    Daca eu m-am gandit sa fac un asemenea test cu siguranta si altii s-au gandit si l-au facut deja sau il vor face. Uneori, calea cea mai buna de a forta o companie sa ia masuri este sa faci full disclosure si sa lasi hienele sa abuzeze sistemul. Cand procentul abuzurilor creste de la o zi la alta apar si rezolvari rapide. In schimb, daca vorbim de cateva cazuri izolate, problema in sine va fi trecuta pe o lista TODO si va persista mult mai mult timp pana apare un patch. Uneori este de preferat sa exista pierderi majore intr-un timp foarte scurt si sa apara o rezolvare rapida, decat sa persiste problema timp indelungat si sa fie aplicata de cei din comunitatile underground. Pentru ca in underground nu exista reguli si poti fi oricand afectat mult mai grav de ceva de genul asta.

    In cazul de fata ce am facut eu se poate numi cu greu full disclosure, dar este foarte important ca tot mai multi oameni sa fie constienti de anumite tactici blackhat si sa le raporteze la timp. In felul acesta rata incidentelor raportate catre Google va creste vertiginos si li se va acorda atentia potrivita. Implicatiile unei asemenea metode depasesc cu mult problema seo. Sa ne gandim cum ar fi, prin absurd, daca cineva ar reusi sa detroneze de pe primul loc printr-o asemenea metoda un site ce ofera un produs software la download si sa trimita vizitatorii catre o clona a site-ului ce imprastie malware.

  7. #7
    Avatarul lui Hakuna Matata
    Hakuna Matata este deconectat Membru SeoPedia
    Reputatie:
    47
    Data înscrierii
    21st January 2011
    Locaţie
    Bucuresti
    Vârstă
    46
    Posturi
    791
    Putere Rep
    47


    Implicit

    Daca eu m-am gandit sa fac un asemenea test cu siguranta si altii s-au gandit si l-au facut deja sau il vor face.
    Sa fim seriosi CDK, tu esti la un alt nivel. Sunt destui "meseriasi de seo" pe acest forum [cu sau fara cont] carora le-a picat site-urile si crezand ca e vina celui care l-a detronat cauta sa-l dea jos.

    Uneori, calea cea mai buna de a forta o companie sa ia masuri este sa faci full disclosure si sa lasi hienele sa abuzeze sistemul. Cand procentul abuzurilor creste de la o zi la alta apar si rezolvari rapide.
    Uneori este de preferat sa exista pierderi majore intr-un timp foarte scurt si sa apara o rezolvare rapida,
    Aici ai dreptate insa, este de preferat [cel putin in cazul meu], ca acele pierderi sa fie facute de catre cei initiati, de cei care sunt pasionati de o anumita tehnica deoarece ei depun o munca de cercetare , fac teste, sunt iuti la minte, etc, etc nu de orice obosit sau frustrat care a gasit o pleasca pe net data mura-n gura.

    In schimb, daca vorbim de cateva cazuri izolate, problema in sine va fi trecuta pe o lista TODO si va persista mult mai mult timp pana apare un patch... decat sa persiste problema timp indelungat si sa fie aplicata de cei din comunitatile underground. Pentru ca in underground nu exista reguli si poti fi oricand afectat mult mai grav de ceva de genul asta.
    Asta ziceam si eu, astfel de tehnici trebuie sa se regeseasca pe alte forumuri mai mult sau mai putin publice.

    In cazul de fata ce am facut eu se poate numi cu greu full disclosure, dar este foarte important ca tot mai multi oameni sa fie constienti de anumite tactici blackhat si sa le raporteze la timp. In felul acesta rata incidentelor raportate catre Google va creste vertiginos si li se va acorda atentia potrivita.
    Oamenii afectati oricum raportau indiferent daca erau sau nu constienti de aceasta tehnica.

    Implicatiile unei asemenea metode depasesc cu mult problema seo. Sa ne gandim cum ar fi, prin absurd, daca cineva ar reusi sa detroneze de pe primul loc printr-o asemenea metoda un site ce ofera un produs software la download si sa trimita vizitatorii catre o clona a site-ului ce imprastie malware.
    Sunt metode mult mai eficiente de a face acest lucru in detrimentul afisarii unui PDF in search results insa nu este exclus si acest lucru.

  8. #8
    Avatarul lui CDK
    CDK
    CDK este deconectat Membru SeoPedia
    Reputatie:
    35
    Data înscrierii
    17th June 2013
    Vârstă
    43
    Posturi
    94
    Putere Rep
    35


    Implicit

    Update: cu toate ca fisierele inca exista pe servere, niciun pdf folosit in test nu mai exista in rezultatele Google. Toate site-urile mele au revenit pe pozitiile de dinainte de inceperea testelor pe cautarile respective, cu mici exceptii care pot fi independente de testele mele. Nu imi dau seama daca are vreo legatura cu Panda update sau daca este ceva total diferit. Acum doua zile erau indexate toate pdf-urile. Tinand cont de faptul ca nu am folosit keywords stuffing sau vreo forma de cloaking a pdf-urilor, mi se pare foarte ciudat ca nu mai sunt indexate deloc.

    Ma gandesc ca pe langa Panda mai ruleaza si alte update-uri despre care nu am fost anuntati, mai ales ca de 4-5 zile pe versiunile mobile vad fluctuatii mari de trafic la unele site-uri.

Informații subiect

Utilizatori care navighează în acest subiect

Momentan este/sunt 1 utilizator(i) care navighează în acest subiect. (0 membrii și 1 vizitatori)

Thread-uri Similare

  1. Problema cu site-urile de seriale online
    De cristiytzu în forumul Plagiat
    Răspunsuri: 33
    Ultimul Post: 8th June 2013, 21:08
  2. Blackhat ca la carte de catre autofarm.ro
    De deadworldisee în forumul SPAM made in .RO
    Răspunsuri: 12
    Ultimul Post: 26th December 2011, 16:18
  3. Propun categorie BlackHat
    De Marylina în forumul Discutii administrative
    Răspunsuri: 10
    Ultimul Post: 5th October 2011, 11:58
  4. folosite punc in htaccess
    De Mascka în forumul Server side
    Răspunsuri: 0
    Ultimul Post: 14th August 2011, 01:29
  5. FUN: pentru blackhat
    De Krm în forumul Bar, lobby...
    Răspunsuri: 2
    Ultimul Post: 23rd October 2010, 05:36

Permisiuni postare

  • Nu puteţi posta subiecte noi.
  • Nu puteţi răspunde la subiecte
  • Nu puteţi adăuga ataşamente
  • Nu puteţi modifica posturile proprii
  •