Pagina 1 din 2 12 UltimulUltimul
Rezultate 1 la 10 din 14

Subiect: Lista IP-uri boti

  1. #1
    Avatarul lui VisualMind
    VisualMind este deconectat Membru SeoPedia
    Reputatie:
    35
    Data înscrierii
    29th August 2006
    Posturi
    53
    Putere Rep
    35


    Implicit Lista IP-uri boti

    Salut.
    Ma poate ajuta cineva cu o lista a IP-urilor care o pot folosi sa contorizez exact numarul de vizitatori umani ? Nu vreau sa-mi scape si sa am hituri la un sistem de contorizare din partea botilor, indiferent de natura sau origine.

    Are cineva asa ceva ? Eu am adunat o lista destul de mare, dar cred ca-mi scapa totusi cei din Romania. Daca e sa fac o comparatie pe o pagina de test, numarul afisarilor cu cel de la trafic.ro nu bate deloc.

    Mersi

  2. #2
    Avatarul lui Krumel
    Krumel este deconectat Ambasador
    Reputatie:
    70
    Data înscrierii
    15th November 2004
    Locaţie
    Iasi
    Vârstă
    47
    Posturi
    6.261
    Putere Rep
    70


    Implicit

    Liste Ip Pe Judete
    Tot cu o cautare pe forum.
    Sper sa te ajute.

    Liste des adresses IP de GoogleBot - lista Ip-urilor pe care le are GoogleBot.
    Ultima modificare făcută de Krumel; 29th August 2006 la 19:31.
    Krumel - apeleaza la serviciile oferite de mine prin formularul de pe blog.

  3. #3
    Avatarul lui Cristian Mezei
    Cristian Mezei este deconectat Administrator
    Reputatie:
    63
    Data înscrierii
    20th February 2005
    Locaţie
    Everywhere
    Posturi
    6.975
    Putere Rep
    63


    Implicit

    Cel mai simplu contorizezi dupa User-Agent nu dupa IP..

    Fiecare bot poate avea zeci/sute de IP-uri.

    http://www.robotstxt.org/wc/active/html/index.html
    http://www.psychedelix.com/agents/index.shtml
    Co-founder of Deepstash. Tech lover. Dinosaur. Dad. Chef.

  4. #4
    Avatarul lui VisualMind
    VisualMind este deconectat Membru SeoPedia
    Reputatie:
    35
    Data înscrierii
    29th August 2006
    Posturi
    53
    Putere Rep
    35


    Implicit

    Citat Postat în original de Cristian Mezei Vezi Post
    Cel mai simplu contorizezi dupa User-Agent nu dupa IP..
    Dupa user-agent ar fi putin cam riscant. As putea exclude si vizitatori reali sau nu as bloca toti botii. Fie una, fie alta. Multi boti se mascheaza ca
    Mozilla/4.0 (compatible; MSIE 5.0; Windows NT).

    Ma gandeam ca sunt niste liste publice actualizate cu IP-urile astea. Mai ales pe Romania. Site-urile de statistici banuiesc ca le folosesc. Cred ca botii de la "SE-urile" din romania imi scapa

  5. #5
    Avatarul lui VisualMind
    VisualMind este deconectat Membru SeoPedia
    Reputatie:
    35
    Data înscrierii
    29th August 2006
    Posturi
    53
    Putere Rep
    35


    Implicit

    Ar mai fi o solutie.

    Sterg robots.txt si prind din htaccess apelul fisierului cu ErrorDocument 404.
    Astfel ii prind IP-ul botului si il bag in baza de date in tabela de filtrare, refac headerul si ii trimit textul pentru robots.txt.
    Asa, la fiecare apel al botilor, tabela se populeaza si incet incet o sa am toate IP-urile botilor.

    Singura chestie de care nu sunt sigur este: toti botii apeleaza intai robots.txt ?

  6. #6
    Avatarul lui Krumel
    Krumel este deconectat Ambasador
    Reputatie:
    70
    Data înscrierii
    15th November 2004
    Locaţie
    Iasi
    Vârstă
    47
    Posturi
    6.261
    Putere Rep
    70


    Implicit

    Singura chestie de care nu sunt sigur este: toti botii apeleaza intai robots.txt ?
    Probabil nu toti, dar marea majoritata, da.
    Krumel - apeleaza la serviciile oferite de mine prin formularul de pe blog.

  7. #7
    Avatarul lui Cristian Mezei
    Cristian Mezei este deconectat Administrator
    Reputatie:
    63
    Data înscrierii
    20th February 2005
    Locaţie
    Everywhere
    Posturi
    6.975
    Putere Rep
    63


    Implicit

    Citat Postat în original de Krumel Vezi Post
    Probabil nu toti, dar marea majoritata, da.
    Astia respecta toti.

    http://www.robotstxt.org/wc/active/html/index.html
    Co-founder of Deepstash. Tech lover. Dinosaur. Dad. Chef.

  8. #8
    Avatarul lui serban
    serban este deconectat Membru SeoPedia
    Reputatie:
    36
    Data înscrierii
    17th February 2006
    Locaţie
    Bucharest
    Posturi
    133
    Putere Rep
    36


    Implicit re

    cel mai bine este sa faci un match cu expresii regulate pe un array unde sa ai stocate semnaturile crawlerelor. ex http://www.ghita.ro/article/3/list_w...tools_etc.html

    - nu este eficient matchul dupa IP
    - nu este eficient dupa robotx.txt ; cel mai bine e cu htaccess sau din script

    @VisualMind & all : dupa user-agent este cel mai bine. tu nu faci match la "Mozilla" ci la "Googlebot", "slurp", "msnbot" ,etc. - ex cauta in lista (http://www.ghita.ro/user_agents_list.html) googlebot si cauta mozilla
    Serban Ghita - my website

  9. #9
    Avatarul lui Krumel
    Krumel este deconectat Ambasador
    Reputatie:
    70
    Data înscrierii
    15th November 2004
    Locaţie
    Iasi
    Vârstă
    47
    Posturi
    6.261
    Putere Rep
    70


    Implicit

    serban... interesanta resursa.
    Felicitari.
    Krumel - apeleaza la serviciile oferite de mine prin formularul de pe blog.

  10. #10
    Avatarul lui mihaitha
    mihaitha este deconectat Junior SeoPedia
    Reputatie:
    0
    Data înscrierii
    12th September 2006
    Vârstă
    45
    Posturi
    3
    Putere Rep
    0


    Implicit hmmm...

    Sincer nu prea sunt de acord cu modelul acesta al lui serban. Cautarea dupa agent in mod sigur va elimina vizitatori din sistemul de contorizare, intrucat e evident ca multi spideri/crawleri se mascheaza ca si agenti 'cumsecade', probabil tocmai din acest considerent. Citez din lista de crawleri:
    Mozilla/4.0 (compatible; MSIE 6.0; Windows 98; en) Opera 8.50
    Mozilla/4.0 (compatible; MSIE 6.0; Windows 98; en) Opera 8.51
    Mozilla/4.0 (compatible; MSIE 6.0; Windows 98; en) Opera 8.53
    Mozilla/4.0 (compatible; MSIE 6.0; Windows 98; en) Opera 8.54
    sau
    Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0) Opera 7.11 [en]
    Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0) Opera 7.23 [en]
    Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0) Opera 7.50 [en]
    Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0) Opera 7.54 [en]
    Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0) Opera 7.54u1 [en]
    Cu alte cuvinte, orice vizitator care imi intra cu Opera 8.5x de pe Win98 sau cu opera 7.x de pe Win2000 e vazut ca si crawler si nu mi-e contorizat. Mie nu-mi convine asa ceva. Zic ca ideea lui VisualMind cu accesul la robots.txt e cea mai buna. Daca cineva face un spider care nu acceseaza robots.txt oricum iti da hituri aiurea, asa macar ii prinzi pe aia de bun augur.
    Sporuri.

Pagina 1 din 2 12 UltimulUltimul

Informații subiect

Utilizatori care navighează în acest subiect

Momentan este/sunt 1 utilizator(i) care navighează în acest subiect. (0 membrii și 1 vizitatori)

Thread-uri Similare

  1. lista directoare seo
    De matican în forumul Directoare web straine
    Răspunsuri: 14
    Ultimul Post: 6th January 2011, 11:46
  2. Lista mea de directoare
    De tataraseni în forumul Directoare romanesti
    Răspunsuri: 4
    Ultimul Post: 26th June 2008, 10:27
  3. Fac lista keywords-uri
    De Popescu Marian în forumul Servicii web / Jobs
    Răspunsuri: 3
    Ultimul Post: 19th April 2008, 19:42
  4. Lista de Directoare
    De altec883 în forumul Google
    Răspunsuri: 11
    Ultimul Post: 9th April 2008, 12:58
  5. Cumpar clickuri/trafic catre site, inclusiv boti/autosurf
    De Serban Cristian în forumul Link-uri/Bannere
    Răspunsuri: 3
    Ultimul Post: 1st February 2008, 15:15

Permisiuni postare

  • Nu puteţi posta subiecte noi.
  • Nu puteţi răspunde la subiecte
  • Nu puteţi adăuga ataşamente
  • Nu puteţi modifica posturile proprii
  •