Pagina 1 din 2 12 UltimulUltimul
Rezultate 1 la 10 din 14

Subiect: Sintaxa robots.txt?

  1. #1
    Avatarul lui vivaldi
    vivaldi este deconectat Junior SeoPedia
    Reputatie:
    0
    Data înscrierii
    27th November 2007
    Posturi
    14
    Putere Rep
    0


    Implicit Sintaxa corecta robots.txt?

    Vreau sa opresc indexarea tuturor paginilor dintr-un site ce reprezinta versiunile printabile ale paginilor de produs - toate url-urile care contin print.html (duplicate content). Ca sa fac asta prin robots.txt care ar fi sintaxa corecta?

    Eu ma gandeam la ceva de genul:

    Noindex: /*print.html$
    (e corecta sintaxa asta daca vreau sa afecteze doar paginile din site care contin print.html?)

    As folosi Noindex pentru ca vreau sa fie si scoase din indexul Google automat (stiu ca Noindex e inteles doar de Google).

    E mai bine sa folosesc Disallow? Ce s-ar intampla daca as folosi si Noindex si Disallow cu aceeasi sintaxa in robots.txt? Ar fi scoase cele deja indexate in Google si in acelasi timp s-ar interzice accesul la cele noi?

    Noindex: /*print.html$
    Disallow: /*print.html$

    Multumesc anticipat pentru raspunsuri
    Ultima modificare făcută de vivaldi; 18th February 2010 la 14:14. Motiv: completare

  2. #2
    Avatarul lui martynesku
    martynesku este deconectat Membru SeoPedia
    Reputatie:
    33
    Data înscrierii
    23rd September 2007
    Vârstă
    43
    Posturi
    220
    Putere Rep
    33


    Implicit

    Cred ca poti pune in head-ul paginii print.html <meta name="robots" content="noindex, nofollow" /> si este de ajuns.

    In robots.txt din cate stiu eu se foloseste numai Disallow, nu si Noindex... posibil sa ma insel.

  3. #3
    Avatarul lui vivaldi
    vivaldi este deconectat Junior SeoPedia
    Reputatie:
    0
    Data înscrierii
    27th November 2007
    Posturi
    14
    Putere Rep
    0


    Implicit

    Se poate pune si noindex in robots.txt insa este inteles doar de Google.
    Stiu ca se poate pune meta name="robots" in pagini, insa nu ma pricep asa bine la script-uri si cred ca e putin mai complex la site-ul de care vorbesc pentru ca pagina de produs e generata de un products.php (in care se genereaza meta-title si meta-description) iar versiunea printabila ia nastere printr-un rename rule in htaccess.
    Nu stiu cum sa fac script-ul in asa fel incat sa puna meta-robots doar pe paginile printabile, si sunt foarte multe, peste 3000....

  4. #4
    Avatarul lui martynesku
    martynesku este deconectat Membru SeoPedia
    Reputatie:
    33
    Data înscrierii
    23rd September 2007
    Vârstă
    43
    Posturi
    220
    Putere Rep
    33


    Implicit

    Se foloseste o conditie in php folosing variabila din url gen:

    if($_REQUEST['name'] == 'print') {

    echo '<meta name="robots" content="noindex, nofollow" />';

    }

    acum depinde de structura url-ului pentru a scrie corect partea asta: $_REQUEST['name'] == 'print'

  5. #5
    Avatarul lui vivaldi
    vivaldi este deconectat Junior SeoPedia
    Reputatie:
    0
    Data înscrierii
    27th November 2007
    Posturi
    14
    Putere Rep
    0


    Implicit

    Uh, se pare ca Noindex ca directiva in robots.txt este (inca) experimentala la Google: "At the moment we will usually accept the “noindex” directive in the robots.txt, but we are not yet at a point where we are willing to set it into stone and announce full support."

  6. #6
    Avatarul lui Cristi U
    Cristi U este deconectat Super Moderator
    Reputatie:
    51
    Data înscrierii
    26th January 2008
    Locaţie
    Oradea
    Vârstă
    36
    Posturi
    3.172
    Putere Rep
    51


    Implicit

    De ce ai pute in robots.txt si noindex si disallow? Eu unul nu vad sensul... E de ajuns disallow
    Mai dau cate-un sfat juridic aici, uneori chiar despre online. Nu-l rata! :) Vezi și sfaturi de nutritie.

  7. #7
    Avatarul lui vivaldi
    vivaldi este deconectat Junior SeoPedia
    Reputatie:
    0
    Data înscrierii
    27th November 2007
    Posturi
    14
    Putere Rep
    0


    Implicit

    Citat Postat în original de martynesku Vezi Post
    Se foloseste o conditie in php folosing variabila din url gen:

    if($_REQUEST['name'] == 'print') {

    echo '<meta name="robots" content="noindex, nofollow" />';

    }

    acum depinde de structura url-ului pentru a scrie corect partea asta: $_REQUEST['name'] == 'print'
    Ok, multumesc pentru raspuns, am sa incerc sa studiez in directia asta

  8. #8
    Avatarul lui vivaldi
    vivaldi este deconectat Junior SeoPedia
    Reputatie:
    0
    Data înscrierii
    27th November 2007
    Posturi
    14
    Putere Rep
    0


    Implicit

    Citat Postat în original de cristi Vezi Post
    De ce ai pute in robots.txt si noindex si disallow? Eu unul nu vad sensul... E de ajuns disallow
    Pai tocmai asta ar fi si intrebarea: daca existenta celor doua (presupunand ca noindex este luat in considerare) este permisa....
    Ideea ar fi ca paginile print.html deja indexate sa fie scoase din index...

  9. #9
    Avatarul lui Cristi U
    Cristi U este deconectat Super Moderator
    Reputatie:
    51
    Data înscrierii
    26th January 2008
    Locaţie
    Oradea
    Vârstă
    36
    Posturi
    3.172
    Putere Rep
    51


    Implicit

    Citat Postat în original de vivaldi Vezi Post
    Pai tocmai asta ar fi si intrebarea: daca existenta celor doua (presupunand ca noindex este luat in considerare) este permisa....
    Ideea ar fi ca paginile print.html deja indexate sa fie scoase din index...
    Pai disallow are eficienta maxima (teoretic cel putin, pt ca sunt si care ignora). Tot nu inteleg de ce sa pui si noindex in robots.txt
    Mai dau cate-un sfat juridic aici, uneori chiar despre online. Nu-l rata! :) Vezi și sfaturi de nutritie.

  10. #10
    Avatarul lui vivaldi
    vivaldi este deconectat Junior SeoPedia
    Reputatie:
    0
    Data înscrierii
    27th November 2007
    Posturi
    14
    Putere Rep
    0


    Implicit

    Disallow are eficienta in blocarea crawling pe acele pagini, insa daca ele sunt deja indexate le lasa indexate.
    Teoretic Noindex ar trebui sa le si deindexeze automat la urmatorul crawl pe acele pagini deja indexate.

    Insa chiar daca Google le accepta pe amandoua in robots.txt, s-ar putea sa se bata cap in cap, exact asa cum e in cazul in care pui meta-robots noindex, follow de exemplu si in acelasi timp pui Disallow in robots.txt pe acele pagini cu meta-robots (meta-robots de pe acele pagini nu mai este citit pentru ca nu se mai face crawl pe ele).

Pagina 1 din 2 12 UltimulUltimul

Informații subiect

Utilizatori care navighează în acest subiect

Momentan este/sunt 1 utilizator(i) care navighează în acest subiect. (0 membrii și 1 vizitatori)

Thread-uri Similare

  1. Best robots.txt for Wordpress?
    De Nosfer în forumul Server side
    Răspunsuri: 1
    Ultimul Post: 9th September 2009, 20:34
  2. intrebare robots.txt
    De giovanni12345 în forumul Discutii generale privind optimizarea si motoarele de cautare
    Răspunsuri: 3
    Ultimul Post: 2nd September 2009, 11:40
  3. sintaxa domeniu
    De Seph în forumul Metode de promovare, Analiza trafic.
    Răspunsuri: 6
    Ultimul Post: 3rd August 2008, 00:23
  4. robots.txt
    De cris în forumul Discutii generale privind optimizarea si motoarele de cautare
    Răspunsuri: 1
    Ultimul Post: 5th August 2007, 20:08
  5. robots.txt
    De brahma în forumul Discutii generale privind optimizarea si motoarele de cautare
    Răspunsuri: 2
    Ultimul Post: 31st July 2005, 00:25

Permisiuni postare

  • Nu puteţi posta subiecte noi.
  • Nu puteţi răspunde la subiecte
  • Nu puteţi adăuga ataşamente
  • Nu puteţi modifica posturile proprii
  •