Ce reprezinta aceasta? :) Cumva spam de la ODP cei nepatati? Offf.
Versiune printabilă
Ce reprezinta aceasta? :) Cumva spam de la ODP cei nepatati? Offf.
Nu, pur si simplu nu au scos search-ul din indexare si cineva a pus link spre acea cautare.
Nu cred. Google :))
Cu toate astea, in robots.txt vad asa
User-agent: *
Crawl-Delay: 1
Disallow: /public/
Disallow: /editors/
Disallow: /search/
Disallow: /cgi-bin/
Pai si ce-ti sugereaza tie treaba asta? Pot sa pun si eu un link pe un site de-al meu spre Open Directory - Search Results si o sa apara in index.
LE: Ooops, deja am pus :D, o sa-l gasesti in google in cateva zile.
Au uitat sa modifice robots.txt dupa ce au trecut la DMOZ 2.0. Te asigur ca nu e nimic intentionat, ei nu castiga nimic daca ies la cautari. E o greseala.
@puthre mai rasfoieste forumul cautand dupa taguri ca noindex, vezi cum functioneaza, cum ar trebui sa arate un site spam free si vei fi mai bine informat data viitoare :)
@Krumel am inteles, ar fi ok sa se rezolve, nu isi fac o imagine ok in felul asta.
Merci de sugestie, stiu cum functioneaza noindex, s-ar putea sa fiu mai bine informat data viitoare insa am fost suficient de bine informat si de data asta. Faptul ca se indexeaza pagini de cautare, nu inseamna neaparat ca e spam.
@Nikita A se observa ultimul slash de dupa search din robots.txt. Acolo e problema.
Nu-si pierde dmoz-ul imaginea pentru un .. rahatzel d-asta... E clar ca e neintentionat ...
Nu inteleg cu ce afecteaza aceasta pagina, de ce este spam?
@lovelife cu ce te afecteaza daca o sa cauti castraveti pe google si gasesti o pagina goala cu textul N-am gasit castraveti in acest site ? Nu este spam, nu?
Mnu, tu arunci cu rahat cand nu este cazul. Google NU trebuia sa returneze nimic la acea cautare, faptul ca intamplator este o cautare care nu ar aparea pe un cuvant cheie in mod normal NU scuza faptul ca acele pagini sunt indexate DESI NU AR TREBUI SA FIE.
Si nu e vorba neaparat de DMOZ aici, caci tu m-ai intrebat "cu ce dauneaza paginile astea" ori pagini de genul asta au si spammeri de clasa din .ro, siteuri mari cu articole despre sanatate de pilda, care fac trafic aiurea si te fac sa pierzi timpul deschizand pagini FARA CONTINUT RELEVANT CAUTARII, este spam! Si nu imi vine inca sa cred ca avem seopedisti care nu stiu definitia spamului in motoare de cautare si sar in sus cand cineva vrea sa le explice.
Se pare ca tu arunci cu rahat in DMOZ, asa ca sa te afli in treabaCitat:
tu arunci cu rahat cand nu este cazul.
Habar n-ai ce vorbesti, n-ai inteles nimic si eu nu imi mai bat capul sa iti explic atat timp cat tu postezi intr-un topic despre spam desi nu sti ce e ala spam. Pentru cei care au vrut sa inteleaga, eu am explicat destul de clar problema la fel cum am inteles destul de clar de la Krumel ce s-a intamplat defapt.
si de aici se trage indexarea opensiteexplorer.org/links?site=http%3A%2F%2Fwww.dmoz.org%2Fsearch%3Fq% 3Dejocuri.ro si sunt multe site-uri de analiza site care ofera link de genul asta in care pun si link spre cautarea in dmoz a site-ului respectiv
Stiu ce este spam, dar poate avem notiuni diferite,
Dar cand deschizi asa topicuri aiurea prin care tu ingerul perfect in materie de SEO ai gasit o mica hiba la DMOZ si apoi trebuie musai sa faci cancan din asta ma dezgusta
Linkul de la analizasite e nofollow, asta asa... ca sa fi in cunostinta de cauza. Oricum, n-ai nevoie de linkuri ca sa iti indexeze paginile alea, daca te-ar fi interesat subiectul ai fi incercat sa cauti altceva sa vezi ca returna tot o pagina aiurea.
Forumul este o unealta de socializare draga lovelife, nu am mintit, nu am adus informatii gresite, nu am postat despre castraveti intr-un forum de seo, pur si simplu am adus la cunostinta userilor o informatie peste care am dat intamplator. Si daca a vazut cineva topicul asta si in timpul asta s-a gandit "ia sa vad daca mie imi indexeaza prostii din astea sau daca am pus si eu un / gresit in robots.txt" tot il consider folositor. Nu te roaga nimeni sa citesti aiurelile mele, zau asa. Cel ce face cancan atunci cand nu este cazul, esti defapt tu.
se pare ca nu stii cum interpreteaza google un link nofollow, google urmareste link-ul dar nu transfera autoritate, juice, ancora etc (cel putin asa afirma google, dar realitatea e putin diferita)Citat:
Postat în original de Marylina
Tu nu ai afirmat asta, doar ai aruncat cu noroi si ai spus "DMOZ spam", te rog reciteste cu atentie postul tau cu care ai deschis subiectul, si chiar titlul postului.Citat:
pur si simplu am adus la cunostinta userilor o informatie peste care am dat intamplator. ............
Si daca a vazut cineva topicul asta si in timpul asta s-a gandit "ia sa vad daca mie imi indexeaza prostii din astea sau daca am pus si eu un / gresit in robots.txt" tot il consider folositor.
Direct de la google support. Ca or mai avea ei scapari, nici robotii nu sunt perfecti, dar tagul de nofollow pentru asta este facut.Citat:
This gives webmasters more granular control: instead of telling search engines and bots not to follow any links on the page, it lets you easily instruct robots not to crawl a specific link. For example:
<a href="signin.php" rel="nofollow">sign in</a>
Da, dar am fost lamurita ca nu a fost intentia de spam si in trecut nu au practicat asta, ceea ce denota ca este o eroare dar asta nu inseamna ca pagina in sine nu este spam al motoarelor de cautare, intentionat sau nu.
Nu va aprindeti asa tare :P Incercati sa demonstrati ca stiti, nu ca celalalt nu stie, pentru ca in ultimele 5-6 reply-uri v-ati axat pe asta :P E doar o sugestie.
In rest, ce face Dmoz poate fi catalogat cu usurinta ca spam, pentru ca sunt niste pagini generate automat bla bla, care n-ar trebui sa fie indexate niciodata. Daca v-ati uitat insa in robots.txt ati fi vazut ca exista o comanda care blocheaza search-ul. Apoi din comentariul lui Krumel, am aflat ca s-a facut un update la Dmoz, ceea ce inseamna ca structura search-urilor s-a schimbat, astfel incat sa nu mai fie sub incidenta acelei reguli din robots.txt
E foarte usor sa concluzionam ca este vorba doar de o scapare nefericita.
Asta e concluzia si interpretarea mea pe baza informatiilor din acest thread. Solutia nu e nici sa va balacariti nici sa insistam pe problema. Cel mai probabil rezolvarea ar putea veni in urma unei sesizari.
Pagina aia nu e generata mai automat decat pagina asta pe care dai raspunsuri pe forum. Nu e nici o diferenta intre url-urile care dau rezultate din o anumita categorie si urlurile care dau rezultate dupa o anumita cautare. Se poate considera spam doar in cazul in care nu exista rezultate pe acea cautare iar pagina a fost facuta doar pentru motoarele de cautare. In rest poti sa-ti categorisesti informatia dupa ce vrei tu, cautari, categorii, taguri, culori, zona si miros, e informatia ta si o prezinti cum vrei. Ca in procesul asta o sa faci continut duplicat, aia e alta poveste si n-are legatura cu spamul.
De asta ce ziceti Open Directory - Search Results ?
Inteleg ca te contrazici singur? Despre asta e vorba. Si nu, nu poti sa iti categoristesti informatia dupa cum vrei tu, google spune sa pui noindex pe cautari.
Citat:
# Use robots.txt to prevent crawling of search results pages or other auto-generated pages that don't add much value for users coming from search engines.
Nu am inteles unde ai vazut tu ca m-am contrazis.
In ceea ce priveste ce zice google nu vad ce legatura are cu subiectul. Noi vorbeam aici de spam iar tu vorbesti de recomandarile lui google. In primul rand google e un motor de cautare si atat. Nu google a inventat notiunea de spam, ar fi fost spam si fara google asa cum este si cu el. Pe de alta parte, recomandarile alea n-au nici o legatura cu spamul, au legatura cu slabiciunile lui Google ca motor de cautare si anume cu faptul ca foloseste keyword-urile din titlu si din url ca fiind relevante pentru o pagina, iar daca iti indexeaza tie pe site o pagina de cautare pe un keyword total irelevant pentru site-ul tau, dar care are niste rezultate, pagina aia ar putea ajunge in fata altei pagini a unui site mai relevant pentru ca ar avea title "rezultate pentru {keyword}", ar avea h1 "rezultatele cautarii pentru {keyword}" si ar avea {keyword} subliniat in toate rezultatele cautarii. E evident ca cei de la google incearca sa evite asta, si tocmai din motivul asta au aceasta recomandare.
Dar asta e alta discutie, n-are nici o legatura cu spamul, DMOZ-ul sau modul in care iti categoristesti informatiile pe siteul tau. Informatiile le categorisesti dupa cum vrei si dupa cum are sens pentru tipul de informatie pe acre il oferi si pentru vizitatorii tai, nu neaparat dupa cum recomanda google, bing ,yahoo, yandex sau altii.
@Cristi tu poate ai vazut ca eu nu ma bag in discutii ca sa ma aflu in treaba, nu sunt pe forum de ieri, postez rar si cand spun ceva, o spun pentru ca stiu si nu te contrazic fara sa verific ceea ce zic, spre deosebire de lovelife care isi aduce aminte din ce a visat aseara ca google foloseste nofollow ca sa nu transfere juice si vine repede sa ma contrazica pentru ca eu l-am contrazis pe el. Eu nu vin sa il contrazic de dragul polemicii ci pentru ca habar nu are ce zice, este singurul motiv.
Uh, Kinky. Dar mai frumos Dmoz XSSCitat:
De asta ce ziceti Open Directory - Search Results ?
Atata ca uiti un amanunt important: cautarea este realizata de useri si nu are o structura clara. De asta se diferentiza de restul.
Si nu in ultimul rand, daca tu pui taguri de genul: tag, taguletz, tagushor, tagul, tagurile, tagul meu, taguit, etc. - toate la un singur articol. E spam sau nu?
Consider afirmatia ca aceasta pagina pe care postam aici este identica cu una generata de cautari o adevarata ineptie. Din punctul de vedere al programatorului da (sau mai bine zis din punct de vedere semantic). Dar chiar si din punct de vedere SEO? Seriously? Despre ce discutam aici? Sau doar ne contrazicem de dragul de a ne contrazice? :)
--- Later Edit --- (ca mi-a fost lene sa apas "Edit")
De ce e corect? Doar pentru ca iti da tie dreptate? :)) Raspunde-mi si tu la intrebarea cu tag-tagusor :P
Daca ai o pagina generata prin cautare (tag) a unui cuvant relevant "tag" este echivalentul unei pagini "Cu cele mai importante articole despre "tag" si este ok, este o informatie care poate fi utila, o organizare a informatiei de pe site, la fel cum este si la un magazin online organizarea in functie de pret, telefoane cu GPS, etc.
Iar cautarea respectiva din DMOZ dupa numele domeniului (de fapt asta era discutie), eu consider ca este foarte utila, arata in cate categorii DMOZ se regaseste un anumit site, si corelat cu faptul ca in robots.txt este trecut sa nu indexeze search-ul, si modificarile de structura dmoz, este clar ca nu este spam din partea DMOZ (cel putin asa vad eu lucrurile), fiind ceva involuntar.
Spam devine atunci cand se abuza de acesta facilitate cum ai spus tu tag, tagusor, etc.
Este o limita intre spam si nospam destul de delicata.
Analizat mai dur si advertoriale pentru produsul x in mare parte sunt tot spam pentru ca prezinta acceasi informatie, daar putin formulata diferit fara sa aduca nimic nou pentru vizitator
Am fost mai categoric pentru ca ma deranjat atitudinea asta in care se acuza de spam pe DMOZ, iar in acelasi timp unele dintre site-urile noastre fiind pline de spam in adevaratul sens al cuvantului. Ma deranjeaza ipocrizia asta.
--- Later Edit --- (ca mi-a fost lene sa apas "Edit")
Apare in cautari? nu inteleg
Pai te contrazici un pic. Discutam din punct de vedere moral sau din punct de vedere tehnic? Din punct de vedere moral nu-i putem acuza ca ar face spam, pentru ca e o scapare. Am zis deja de 2-3 ori asta in paginile precedente. Insa din punct de vedere tehnic e spam, pentru ca nu ai avea de ce sa indexezi asa ceva, mai ales in conditiile in care nu ai control asupra a ceea ce indexezi (userul cauta: site.com, http://site.com, www.site.com, etc. si asa ajungi sa ai poate o mie de variante).
Nu discutam despre utilitatea functiei search (spui tu ca e bine sa vezi in ce categorii e un site) ci despre faptul ca aceasta apare in search.
Scuze, eram putin offtopic. Nu are legatura cu spamul, ci cu faptul ca Dmoz este vulnerabil la atacuri XSS.
Cat despre spam, nici eu nu consider ca e spam, pentru ca ei nu au linkuri pe site catre aceste cautari.
Totusi e o problema de indexare in momentul in care tu cauti site:dmoz.org ejocuri.ro , iar primele 5 rezultate sunt din search. Un site de calibrul lor nu ar trebui sa aiba astfel de probleme.
Exista intr-adevar aceasta diferenta, si anume ca oricine poate indexa o pagina a DMOZ cu o cautare spammy. Faci o cautare pe "cumparati Viagra de la colt" pe dmoz, copiezi url-ul, pui un link catre el si s-ar putea sa apara dmoz in cautari pe "viagra", si e util mai ales daca tu ai magazinul "la colt" si te ocupi cu vanzare de viagra. Deci clar nu e o idee buna sa indexezi search pages cu orice query. Faptul ca poate fi folosit de spammeri nu inseamna ca DMOZ face spam. E ca si cum ai acuza un blog ce aproba automat comentariile ca face spam. Bineinteles ca nu face spam, e doar tinta spammerilor.
Putem spune despre DMOZ ca nu fac spam ci doar sunt vulnerabili la spam pentru ca ei nici n-ar avea cum profita de pe urma lui in vreun fel. Asadar e un caz aparte. Insa treaba asta, generic vorbind, poate insemna pe alte site-uri beneficii enorme, pentru ca asa cum pot indexa ce cauta userii, proprietarul unui site poate indexa si ce ar dori el (de exemplu indexeaza toate formele de long tail pe care cineva le-ar cauta despre viagra chiar pe un magazin/blog care comercializeaza viagra... e destul de greu sa faci cate o pagina pentru fiecare long tail, dar ai putea genera un search care returneaza fix aceleasi rezultate, insa tehnic, tot pe pagini diferite).
Nu e nevoie neaparat de mai multe pagini. Pe langa eroare de robots.txt, Dmoz e vulnerabil si XSS. Uite ce linkuri frumoase se pot face pe o singura pagina, catre orice domeniu
http://www.dmoz.org/search?q=<a href="http://example.com" title="Free examples">Free examples</a> | <a href="http://example.com" title="example website">example website</a>
Am observat ca problema e mai veche. Cel putin de un an de zile XSS: Get linked from Dmoz instantly | Phurix Labs
Oare cati spammeri au profitat de asta pana acum?
Eu cred ca google nu indexeaza astfel de link-uri. Sunt multi care sunt vulnerabili xss, iar google ar deveni vulnerabila (sa fie manipulat ma refer) la randul ei prin indexarea unor astfel de link-uri (care prin structura url-ului nu sunt greu de identificat). O dovada, nu clara inca, e data de faptul ca niciuna dintre cele doua pagini n-a fost indexata. Daca vor fi indexate, atunci voi fi contrazis. Pana atunci e interesant sa mai testam (eventual sa mai dam niste link-uri catre ele).