Blackhat360 despre Duplicate Content

Versiune printabilă

Arata 40 post(uri) din acest thread pe o singura pagina

9th September 2008, 13:45
Mircea Budean

Fiind la baza programator nu mi se pare foarte greu sa se identifice continutul duplicat indiferent de cate miliarde de pagini sunt indexate.

Solutia ar fi ca fiecare text indexat sa aiba niste caracteristici cum ar fi densitatea si probabil altele care nu ar fi foarte greu de compus. Odata ce se stie densitatea se reduce enorm numarul de texte\pagini cu care se compara noua pagina indexata, comparatia facandu-se numai intre pagini\texte cu densitati asemanatoare.
9th September 2008, 14:06
Tudi

Oricum, daca ar fi o astfel de comparatie, nu o face crawler-ul direct. Se face undeva in spatele usilor inchise :) Crawler-ul nu are cum sa sara din link in link si la fiecare sa compare de fiecare data caracteristicile pentru ca ar incetini prea mult indexarea si ar fi impotriva logicii unui crawler (care are scopul de a indexa rapid).

Dar e un punct de vedere valid Mircea.
9th September 2008, 15:14
Broscoi

Desi identificarea duplicate content-ului este o prioritate pentru motoarele de cautare principale , acest scop este foarte greu de atins din cauza gradului mare de relativitate a subiectului . E foarte greu de stabilit care este bucata de text ce trebuie e analizata de un motor de cautare pantru a da siguranta depistarii unui duplicate content . Paragraful? Pai pe netul asta cat e de mare ( si cat o sa mai cresca ) nu e chiar imposibil sa formulez o propozitie identica sau aprope identica cu altcineva pe un alt site fara sa am in intentie duplicate content .Mai multe paragrafe? Ce inseamna aprope identic ?
Intr-un articol de critica literara este o obisnuinta prezentarea de parti din textul literar la care face referire , intr-un articol stiintific se prezinta teorii mai vechi care au stat la baza descoperirilor stiintifice etc .Acesta practica nu este duplicate content , dar poate contine bucati de text foarte mari care se regasesc si pe paginile altor situri .
Concluzie :judecata de duplicate content nu este la indemana motoarelor de cautare .
9th September 2008, 16:00
Tudi

Broscoi ai foarte mare dreptate, asta e problema, cum delimiteaza un motor de cautare continutul dublu care e dublu pentru ca e furat de continutul dublu produs de citari de exemplu.

Pentru ca eu, sa scriu un articol de exemplu, nu as avea nimic in potriva daca un alt webmaster l-ar copia pentru a-l cita, dar as avea o problema daca l-ar pune la el pe site ca fiind al lui.
9th September 2008, 17:31
forapathy

eu am facut mai multe site-uri (aceasi structura) cu continut luat de la site-urile la care ma afiliasem..
am luat textele alea si pozele si le-am pus asa.. (cautand prin google am gasit sute de alte site-uri cu acelasi continut).. si nu mi-au fost banate site-urile ba chiar unele din ele au luat si PR 1- 2 ..

asta cam in 4 luni.. apoi m-am gandit sa adaug o propozitie unica la inceputul paragrafului si inca una unica la final.. dar nu am mai adaugat pagini noi..
traficul a crescut in aproximativ 2 luni cu 300%.. si de atunci doar asa le fac :P

ahh si e vb de site-uri cu afilieri adult.. deci e vb de milioane de site-uri cu acelasi continut..
9th September 2008, 17:35
Tudi

Nu stiu, eu la mine am avut rezultate foarte contradictorii cu duplicate-ul. Pe unele pagini-uri am fost trimis in supplemental index, desi eu avam continutul original. Pe altele sunt primul si cel care a copiat e al doilea, sau in supplemental. Pe altele suntem amandoi in supplemental >.<
9th September 2008, 23:08
w!ll

@forapathy, daca Google gaseste continut duplicat pe un site, asta nu inseamna ca o sa-l baneze din start, ci este posibil ca site-ul respectiv sa fie mai prost clasat in rezultatele cautarilor din Google
10th September 2008, 09:28
forapathy

Citat:

Postat în original de w!ll

@forapathy, daca Google gaseste continut duplicat pe un site, asta nu inseamna ca o sa-l baneze din start, ci este posibil ca site-ul respectiv sa fie mai prost clasat in rezultatele cautarilor din Google

exact.. defapt asta vroiam sa zic.. avand site-urile alea cu acelasi continut.. nu erau clasate deloc bine..
sincer eu unul nu mi-am gasit site-urile alea in cautari insa aveam vreo 200 de vizite de pe google..
dar dupa ce am pus propozitie unica la inceputul si sfarsitul acelor paragrafe.. site-urile au crescut foarte tare..
asta inseamna ca nu trebuie sa modifici prea multe pentru a te ascunde de duplicate content :D

Arata 40 post(uri) din acest thread pe o singura pagina