Ce tampeniesi eu ma gandeam ca un "inger pazitor" mi-a platit pentru reclama
![]()
Am incercat o cautara pe http://www.cautari.ro/ pentru "Star Academy" - si mi-a gasit site-ul pe locul 2 si 3 (asta-i numele site-ului meu)]Postat în original de WeaselMan @ Aug 17 2005, 07:56 PM) [post=3248
Am dat din greseala peste www.cautari.ro, dar e spammer rau de tot. Am cautat o data nu-stiu-ce, si am dat peste cateva zeci de rezultate de genul kw1.cautari.ro, kw2.cautari.ro, ..., kwX.cautari.ro![]()
In plus, nu gaseste nimic pentru "weasel" :p
[/QUOTE]
Am incercat o cautara pe http://www.cautari.ro/ pentru "Star Academy" - si mi-a gasit site-ul pe locul 2 si 3 (asta-i numele site-ului meu)
Oare de unde isi ia datele?
Google.Postat în original de The Fan @ May 5 2006, 06:22 PM) [post=14387
Co-founder of Deepstash. Tech lover. Dinosaur. Dad. Chef.
pai ce sa comentezi la acel motor.. inca nu am vazut un motor care sa fie creatie "proprie" si nici nu am sa vad cre.. toate sunt facute cu ajutorul acestui soft
aleadsoft.com
al pui pe un server sa ruleze cateva zile sau poate saptama`ni .. si ai un search engine de toata frumusetea.. desigur .. cu mici modificari de design..
Adica macar noi ce de aici sa incercam sa eliminam pornografia ?Postat în original de toto
Dar cred ca visez prea mult.![]()
Co-founder of Deepstash. Tech lover. Dinosaur. Dad. Chef.
hehe.. mai Cristi.. nu ai cum sa elimini asa ceva.. e treaba aia cu.. democratia...
ca sa faci un motor de cautare trebuie obligatoriu sa ai in spate o tehnologie hardware foarte avansata (servere cu clustere). cel putin din testele facute de mine pe o raza infima de site-uri 400+ pentru a retine toate datele link-uri, statistici, rank-uri si statistici detaliat raport cuvant -> pagina, etc si sa le si returnezi la un query in timp mic iti trebuie o super viteza de procesare (luand in calcul ca s-au facut toate optimizarile, si ca rezultatele sunt relevante, nu aberatii)
este greu, dar merita studiat din plin, se pot desprinde foarte multe din niste statistici de genul asta
faptul ca majoritatea isi fac <<motoare de cautare>> bazate pe API-uri sau pe anumite softuri, este un pas mic, deoarece nu este de ajuns numai parsarea unor rezultate rezultate dintr-o schema xml. dar si acest lucru poate fi ok, daca sa zicem parsezi rezultatele, mai calculezi o data relevanta acestora, si eventual mai arati la fiecare si alte statistici, gen: coordonate harta, adresa de contact, email, owner domeniu, nr tel.. adica ii mai adaugi functionalitati
Serban Ghita - my website
Despre hardware: Clusteringul este intr-adevar necesar pentru un motor de cautare cu o baza de date serioasa. De notat insa - se pot obtine ceva rezultate bunicele si cu un singur server, daca hardware-ul este bun si mai ales pe baza de software scris de oameni cu aptitudini solide in domeniu.
Despre teste: Testele pe care le-am facut (chiar cu ani buni in urma) au scos rezultate foarte bune in ce priveste viteza de cautare (sub 0.1 s) pe 100.000 pagini indexate, pe un banal calculator P3, incluzand un sistem de calcul al popularitatii similar PageRank cat si analiza in-page pentru calculul unui factor de relevanta bazat si pe continut. De notat un aspect - din pacate, la ora actuala, motoarele de cautare romanesti n-au nimic de-a face cu analiza semantica, LSI s.a.m.d - pur si simplu niste cautari chioare pe o baza de date mai mult sau mai putin actualizata.
(ca o nota separata, de amuzament - am lucrat la primul motor de cautare cam prin 1997-98 .... avea 25.000 de pagini in baza de date si statea la capatul unei faimoase conexiuni pe cupru de 33kbps. mai mult ca experiment, dar oricum - ce vremuri...)
Apropo de hardware, in afara de cautari, problema este chiar mai serioasa pe partea de indexare... spider-ul de regula consuma latime de banda si CPU ca la balamuc.
Dar ca sa revin la ce vad eu mai important de zis legat de toata trebusoara aceasta: Problema cea mai mare in ce priveste motoarele de cautare romanesti, nu cred ca este totusi tehnologia. Tehologie s-ar mai gasi; ba chiar exista deja, in opinia mea, cu toate ca pana in prezent au ajuns live mai mult niste scriptulete copiate de prin alte parti. Probabil ca niste baieti isteti cu ceva aptitudini de c++ care sa puna pe picioare o treaba din asta s-ar gasi, desi probabil ca le-ar lua vreun an sau doi ca sa puna pe picioare treaba asta ca lumea, mai ales spiderul si partea de indexare, plus ceva functii lingvistice care sa imbunatateasca rezultatele. Poate si cineva dispus sa bage cativa banuti in treaba asta.
Parerea mea este ca cea mai mare lipsa a motoarelor de cautare romanesti este imaginatia, inspiratia, originalitatea. Ceva care sa le faca diferite - si necesare. Daca as avea asta acum, as lansa unul maine.
Momentan este/sunt 1 utilizator(i) care navighează în acest subiect. (0 membrii și 1 vizitatori)