Rezultate 1 la 7 din 7

Subiect: Intrebare Robots.txt Allow

  1. #1
    Avatarul lui Tudi
    Tudi este deconectat Ambasador
    Reputatie:
    35
    Data înscrierii
    30th December 2007
    Locaţie
    Cluj-Napoca
    Vârstă
    38
    Posturi
    1.581
    Putere Rep
    35


    Implicit Intrebare Robots.txt Allow

    Am o mica dilema la un site personal, facut pe un script custom. Site-ul respectiv are o functie de paginatie, care creeaza URL-uri de tipul

    http://www.domeniu.com/categories/2
    http://www.domeniu.com/categories/3
    http://www.domeniu.com/categories/4

    Fiecare pagina are un titlu aproape identic si aceleasi meta tags (inclusiv description) si imi apar ca erori in webmaster tools (pe buna dreptate). As vrea sa blochez paginile respective de la indexare, dar problema e ca nu pot bloca intreg directorul categories, deoarece am acolo si cateva linkuri cu categoriile principale, de care am nevoie sa fie vizibile. De exemplu:

    http://www.domeniu.com/categories/fashion/
    http://www.domeniu.com/categories/gossip/
    http://www.domeniu.com/categories/howtos/

    Intrebarea mea e daca pot folosi o combinatie de Disallow/Allow in robots.txt pentru directorul categories. Stiu, e un workaround, nu o solutie si stiu ca in principiu se poate, dar vreau sa stiu daca a mai folosit cineva metoda asta si cu rezultate pozitive, pentru ca la mine e prima data cand folosesc si Allow. Ceva in genul asta ma gandeam:

    User-agent: *
    Disallow: /categories/

    Allow:
    /categories/fashion/
    /categories/gossip/
    /categories/howtos/

    Mersi in avans :*

  2. #2
    Avatarul lui Krumel
    Krumel este deconectat Ambasador
    Reputatie:
    69
    Data înscrierii
    15th November 2004
    Locaţie
    Iasi
    Vârstă
    47
    Posturi
    6.261
    Putere Rep
    69


    Implicit

    Nnu poti pune doar nofollow si noindex pe paginile alea?

    Robots.txt nu e usor de folosit si risti sa scoti pagini care nu ar trebui scoase. In schimb meta tag-urile alea pot fi puse mai usor.

  3. #3
    Avatarul lui Tudi
    Tudi este deconectat Ambasador
    Reputatie:
    35
    Data înscrierii
    30th December 2007
    Locaţie
    Cluj-Napoca
    Vârstă
    38
    Posturi
    1.581
    Putere Rep
    35


    Implicit

    M-am gandit si la varianta asta, o sa il intreb pe cel ce a facut script-ul daca se poate implementa solutia cu meta robots. Cea cu robots.txt era mai degraba o solutie de avarie pana rezolv problema, pentru ca incepeau sa imi apara warning-uri in webmaster tools legate de paginatie.

    Mersi oricum Krumel de sugestie.

  4. #4
    Avatarul lui evolution
    evolution este deconectat Membru SeoPedia
    Reputatie:
    37
    Data înscrierii
    29th October 2006
    Locaţie
    Bucuresti
    Posturi
    997
    Putere Rep
    37


    Implicit

    Poti pune doar liniile astea:

    User-agent: *
    Disallow: /fashion/
    Disallow: /howto/


    Ce nu e blocat va fi indexat, deci nu e cazul sa mai pui allow.

    oricum , dupa ce e downloadat robots.txt , verifica in WMT->Tools->Robots.txt mai multe pagini aleator si vezi daca sun Allow ori nu.

  5. #5
    Avatarul lui eugen
    eugen este deconectat Membru SeoPedia
    Reputatie:
    35
    Data înscrierii
    28th August 2006
    Locaţie
    RO
    Posturi
    436
    Putere Rep
    35


    Implicit

    Citat Postat în original de evolution Vezi Post
    oricum , dupa ce e downloadat robots.txt , verifica in WMT->Tools->Robots.txt mai multe pagini aleator si vezi daca sun Allow ori nu.
    Nu e nevoie să aştepţi până ce Google descarcă ultima variantă a fişierului robots.txt, te poţi "juca" direct în GWT.

  6. #6
    Avatarul lui Gabriel Puscuta
    Gabriel Puscuta este deconectat Ambasador
    Reputatie:
    36
    Data înscrierii
    7th September 2006
    Locaţie
    Sibiu
    Posturi
    786
    Putere Rep
    36


    Implicit

    @Tudi: Daca rezolvi problema posteaza te rog solutia aici, am si eu o problema asemanatoare. Danke!

  7. #7
    Avatarul lui eugen
    eugen este deconectat Membru SeoPedia
    Reputatie:
    35
    Data înscrierii
    28th August 2006
    Locaţie
    RO
    Posturi
    436
    Putere Rep
    35


    Implicit

    Eu am folosit următoarele reguli în robots.txt:

    Cod:
    Disallow: /wp-uploads/
    Allow: /wp-uploads/abc/
    Allow: /wp-uploads/def/
    Testând din Google Webmasters Tools, /wp-uploads/abc/ şi /wp-uploads/def/ pot fi accesate în timp ce /wp-uploads/ şi /wp-uploads/<orice> nu pot fi accesate.

Informații subiect

Utilizatori care navighează în acest subiect

Momentan este/sunt 1 utilizator(i) care navighează în acest subiect. (0 membrii și 1 vizitatori)

Thread-uri Similare

  1. intrebare robots.txt
    De giovanni12345 în forumul Discutii generale privind optimizarea si motoarele de cautare
    Răspunsuri: 3
    Ultimul Post: 2nd September 2009, 12:40
  2. robots.txt unreachable
    De alecs în forumul Google
    Răspunsuri: 0
    Ultimul Post: 3rd October 2007, 03:02
  3. robots.txt
    De cris în forumul Discutii generale privind optimizarea si motoarele de cautare
    Răspunsuri: 1
    Ultimul Post: 5th August 2007, 21:08
  4. meta name= robots
    De prodan_13 în forumul Client side
    Răspunsuri: 2
    Ultimul Post: 19th January 2007, 12:03
  5. robots.txt
    De brahma în forumul Discutii generale privind optimizarea si motoarele de cautare
    Răspunsuri: 2
    Ultimul Post: 31st July 2005, 01:25

Permisiuni postare

  • Nu puteţi posta subiecte noi.
  • Nu puteţi răspunde la subiecte
  • Nu puteţi adăuga ataşamente
  • Nu puteţi modifica posturile proprii
  •