@krumel, am pus formul si pe pagina cu rezultate ca sa nu fie nevoie de "back"
@haos, ai dreptate, trebuie facuta o lista de "stopwords"
@krumel, am pus formul si pe pagina cu rezultate ca sa nu fie nevoie de "back"
@haos, ai dreptate, trebuie facuta o lista de "stopwords"
Caut cu jingle.ro.
puthre, uite ceva asemanator cu ce ai tu ptr zona de skills si joburi. Ti-am zis ca acum incerc sa determen cuvintele cheie complementare, asemanatoare dar si cautate ptr un anumit set de servicii online. Le-am luat de aici ptr ca sint relevante. Toolul tau da ceva rezultate dar unele din ele nu prea sint ok.
Un tool asemanator are Google, dar din pacate nu dau de el - nu e pe Romania. Oricum, e perfectibil toolul tau si am apreciat efortul si share-ul cu un +1.![]()
Krumel - apeleaza la serviciile oferite de mine prin formularul de pe blog.
@krumel, da, se bazeaza cam pe acelasi lucru, si anume ce skills mai au cei ce au un anumit skill. Dar la ei e ceva mai simplu pentru ca sunt mult mai putine skills decat cuvinte cheie (de ordinul sutelor fata de ordinul sutelor de mii)
Da, toolul e perfectibil, insa calitatea rezultatelor e direct proportionala cu volumul de web crawlat, care din pacate e direct proportionala cu costul de intretinere![]()
Caut cu jingle.ro.
Krumel - apeleaza la serviciile oferite de mine prin formularul de pe blog.
Caut cu jingle.ro.
interesanta jucarie ... vad ca se misca al naibii de repede desi zici ca sunt sute de mii de site-uri crawluite in spatele acestor date ...
se face procesarea "on the spot" sau datele sunt deja procesate intr-o anumita masura ?
Vezi cum e vremea inainte sa iti faci planuri !
Peste 4000 iconite in ORICE culoare, ORICE dimensiune si in 5 formate: iconsDB.com
@StarNET - Sunt sute de mii dar doar prima pagina, nu e deep crawl, datele sunt tinute ca keyword_id <-> site_id
Era cineva aici pe forum care avea o baza de date cu webul romanesc deep crawl, dar nu am reusit sa dau de el prin mesageria de pe forum (Proiect triplu (motor de cautare si nu numai))
Eu nu ma apuc acum sa deep crawl tot webul romanesc ca n-am atata rabdare si banda
--- Later Edit --- (ca mi-a fost lene sa apas "Edit")
Daca intereseaza pe cineva, lista celow mai folosite keywords in webul romanesc (doar keywords declarate in meta keywords, nu si keywords din title, h1, meta description, text)
4045 romania
1738 bucuresti
1253 cazare
1180 web design
1147 design
1104 hosting
1044 online
1038 auto
976 consultanta
974 turism
950 joomla
947 servicii
919 constructii
848 web
826 software
826 hotel
823 service
810 accesorii
792 imobiliare
728 case
719 vile
714 brasov
711 stiri
702 transport
696 publicitate
692 internet
686 evenimente
685 restaurant
676 webdesign
675 apartamente
674 video
672 anunturi
670 vanzari
643 nunta
637 masini
626 pensiune
626 oferte
622 timisoara
602 nunti
587 foto
587 magazin
586 site
579 inchirieri
568 calculatoare
563 gazduire
559 web hosting
555 cluj
553 sport
550 afaceri
512 produse
511 firme
511 bucharest
510 muzica
509 hoteluri
496 sanatate
496 proiectare
496 constanta
494 pensiuni
490 iasi
471 forum
464 munte
463 domenii
462 terenuri
462 mobilier
460 jocuri
455 shop
450 vacanta
448 vanzare
448 marketing
445 preturi
444 casa
444 webhosting
444 mobila
435 poze
430 sibiu
422 instalatii
421 gazduire web
420 seo
420 copii
403 inregistrare domenii
401 magazin online
400 business
394 camere
391 contabilitate
390 oferta
382 advertising
381 management
374 blog
372 vila
368 calitate
364 birouri
360 amenajari interioare
353 cadouri
350 php
345 pret
339 fotografii
339 echipamente
338 firma
337 lemn
335 cursuri
Caut cu jingle.ro.
chiar si asa ... am un proiect de crawling care pe la 200.000 dadea deja semne de oboseala ... momentan am oprit crawling pentru ca mergea prea incet ... si nu i-am dat drumu din nou pentru ca nu am avut timp de optimizari ...
corecteaza daca gresesc ... in proiectul tau logica ta e urmatoarea:
eu caut spre exemplu: jucarii ...
tu te uiti la toate site-urile care au cuvantul jucarii in continut ...
dupa aia te uiti la toate celelalte cuvinte pe care le mai folosesc acele site-uri
cele mai frecvente cuvinte gasite le arati ...
ma insel ?
LE: acuma ti-am vazut le-ul tau ... deci sa inteleg ca preiei doar ce e in meta keyword si nu continutul in sine ?
Vezi cum e vremea inainte sa iti faci planuri !
Peste 4000 iconite in ORICE culoare, ORICE dimensiune si in 5 formate: iconsDB.com
@starnet logica ta e buna, preiau toata pagina dar topul si ce se returneaza in momentul de fata e doar din meta keywords filtrat si curatat, dar probabil ca dupa inca o tura prin cod o sa returneze ponderat din tot continutul
Stiu de proiectul tau, chiar ti-am cerut la un moment dat lista ta de domenii .ro dar deja il oprisei
Caut cu jingle.ro.
numarul de "occurances" al unui keyword in context ar trebui sa fie un factor ... si atunci pe langa keyword_Id, si site_id ar trebui sa mai ai si occurances ... si atunci ar fi mai relevanta chestia ...
ai pastrat la crawl si html-ul returnat ?
Vezi cum e vremea inainte sa iti faci planuri !
Peste 4000 iconite in ORICE culoare, ORICE dimensiune si in 5 formate: iconsDB.com
Momentan este/sunt 1 utilizator(i) care navighează în acest subiect. (0 membrii și 1 vizitatori)