7th September 2019, 19:41
#1
2 out of 2 members found this post helpful.
vidi.ro - Cel mai rapid motor de căutare românesc
Salut, prima mea postare aici, așa că probabil unora li se va aprinde beculețul principal. Postarea este pe bune.
Pe scurt, citesc seopedia din când în când cam din 2013, în special secțiunea cu motoarele de căutare românești, care mi-a atras atenția în mod deosebit, încât am decis în 2013 să încerc să văd ce aș putea face eu pe zona asta. Am pus la cale teste, am descărcat o mare parte a internetului românesc la vremea aceea, după care lucrând cu datele, a devenit clar că nu am o soluție la problema relevanței.
Ajungem în prezent, unde am rezolvat, pe ansamblu, problema relevanței (vezi ultima postare de pe blog cu privire la rezultatele prezente la data acestei postări), așa că am decis să trec proiectul la faza publică prin intermediul motorului de căutare vidi.ro
Scopul motorului nu este să indexeze toate site-urile în baza de date ci să le indexeze pe acelea cu conținut acceptabil și relevant. Din păcate o mare parte din paginile de pe web-ul românesc sunt într-o stare precară, dar asta avem, cu asta lucrăm, eu văd în asta o oportunitate de a oferi puțină ordine în haos prin intermediul căreia poate încurajăm o direcție mai bună. Atenție, indexarea și scanarea (crawling) sunt lucruri diferite, am descărcat și scanat deja cam toate site-urile în limba română, în urma filtrelor, au fost indexate cele care au trecut de filtru, în prezent fac ajustări la filtru pentru o indexare echilibrată, așa cum am explicat pe blog, ultimul update a înjumătățit site-urile indexate, l-a deindexat și pe Mihai Eminescu
De asemenea, pun accent pe viteză, pe rezultate mai puține dar relevante, fără sute de pagini de formă care de fapt nu conțin ce trebuie, când ați dat click mai departe de pagina 2-3 pe Google? Rar. Ce rost are să zicem că avem 5 miliarde de pagini? Cu ce ajută un om care caută o agenție de turism să i se spună că sunt 50000 de agenții din 1000000 de rezultate? Nu ajută, ba chiar încurcă. Deci nu merg pe principiul cu numere de formă de luat ochii.
Așa cum am scris pe blog, printre elementele de noutate deja implementate, sunt modul de afișare pe coloane, și separația vizuală a paginilor de domeniu, pagini principale, de paginile de articol (o știre, o postare de blog etc) legat de subiectul căutat. Pe viitor, urmează atașarea de informații contextuale la fiecare căutare. De exemplu, definiția unui cuvânt, vremea, cursul valutar, wikipedia etc.
Pe partea tehnică, linux, PHP, C (cod compilat), 2 servere și 1 server de acasă. Tot codul este scris de mine de la 0.
Vă invit să vă jucați cu motorul, să-l testați. Criticile constructive, sugestiile și salutările sunt binevenite.
10th September 2019, 15:00
#7
1 out of 1 members found this post helpful.
Postat în original de
AlexD
... ceea ce oferă vidi...
Exista cerere pentru ceea ce ofera?