Pagina 3 din 4 PrimulPrimul 1234 UltimulUltimul
Rezultate 21 la 30 din 39

Subiect: Proiect triplu (motor de cautare si nu numai)

  1. #21
    Avatarul lui emm
    emm
    emm este deconectat Ambasador
    Reputatie:
    55
    Data înscrierii
    11th November 2006
    Posturi
    829
    Putere Rep
    55


    Implicit

    Citat Postat în original de PhoeniXman Vezi Post
    Salut, sunt curios sa vad versiunea beta cand va fi gata
    Salut, te voi anunta prin PM cand este gata (si pe toti cei care si-au aratat interesul in thread). Multumesc - este incurajator sa vad oameni interesati.

  2. #22
    Avatarul lui felix
    felix este deconectat Membru SeoPedia
    Reputatie:
    41
    Data înscrierii
    30th November 2010
    Locaţie
    Baia Mare
    Vârstă
    50
    Posturi
    1.325
    Putere Rep
    41


    Implicit

    Salut, vreau si eu un PM sa vad varianta BEATA, multumesc.
    Studiu de caz pentru un magazin online

  3. #23
    Avatarul lui emm
    emm
    emm este deconectat Ambasador
    Reputatie:
    55
    Data înscrierii
    11th November 2006
    Posturi
    829
    Putere Rep
    55


    Implicit

    Citat Postat în original de felix Vezi Post
    Salut, vreau si eu un PM sa vad varianta BEATA, multumesc.
    Sa speram ca nu va fi chiar beata, ci doar mahmura.

  4. #24
    Avatarul lui tiberiur
    tiberiur este deconectat Membru SeoPedia
    Reputatie:
    29
    Data înscrierii
    26th September 2010
    Locaţie
    Cluj
    Vârstă
    32
    Posturi
    455
    Putere Rep
    29


    Implicit

    Mi-ar place placere sa testez si eu proiectul. Daca am asentimentul tau lasa-mi si mie un pm cand va fi cazul.
    .

  5. #25
    Avatarul lui felix
    felix este deconectat Membru SeoPedia
    Reputatie:
    41
    Data înscrierii
    30th November 2010
    Locaţie
    Baia Mare
    Vârstă
    50
    Posturi
    1.325
    Putere Rep
    41


    Implicit

    Scuze, am tastat de pe mobil, fiind ecranul mic mi-a scapat, as vrea sa testez si eu varianta BETA daca se poate, mersi mult.
    Studiu de caz pentru un magazin online

  6. #26
    Avatarul lui emm
    emm
    emm este deconectat Ambasador
    Reputatie:
    55
    Data înscrierii
    11th November 2006
    Posturi
    829
    Putere Rep
    55


    Implicit

    M-am gandit sa postez un mic update despre proiect, intrucat multi s-au aratat interesati.

    Deocamdata s-a incheiat cu succes prima faza, cea mai dificila, si anume spiderul. Aici au fost probleme zdravene de optimizare, din mai multe motive:

    - Softul este gandit deocamdata sa ruleze single server, nu in cluster (asta va fi poate pe viitor)
    - Cantitatea de date procesata este evident mare, si o viteza de procesare decenta cat si spatiul de stocare, impun optimizare "la sange"
    - Cu cresterea bazei de date, pot aparea probleme mari de scalare. Sper din tot sufletul, ca aceste probleme sunt acum rezolvate.

    Nota importanta: Deocamdata NU se poate testa nimic, intrucat ceea ce este acum disponibil sunt niste fisiere binare, intr-o baza de date, care n-ar spune nimic nimanui.

    Acum urmeaza inca 2 etape (din fericire mult mai scurte):

    - indexerul - este un alt serviciu, care proceseaza datele stocate si genereaza factorii de ranking. Din motive de performanta, ruleaza independent de spider (ritmul lor de lucru este foarte diferit).
    - partea de front-end pentru search engine (interfata), care face si selectia si sortarea propriu-zisa a datelor, si afiseaza practic ceea ce vede utilizatorul, cand face o cautare.

    Pot spune ca greul a trecut; indexerul si front-endul sunt mai mult distractie pentru un coder.

    Dupa ce aceste 2 module sunt gata, voi putea lansa prima parte a proiectului, care este evident free, si anume motorul de cautare. Nu ma astept sa fie chiar un succes comercial, sau sa-l inlocuiasca pe Google. Sper insa ca va oferi o alternativa de cautare informatii relevante, si ca se va dovedi util in acest mod.

    Partea de front-end are si ea un task chiar greu: relevanta search-ului, si suportul lingvistic. Aici dau chix mai toate motoarele de cautare. Varianta initiala a proiectului va avea suport mai limitat pentru diacritice (rezultatele cu/fara diacritice vor fi identice). Mai problematice sunt flexiunile; inca nu am o solutie perfecta pentru asta. Probabil prima varianta beta va folosi mai mult exact match si suport pentru "flexiuni posibile", dar e posibil sa intoarca si unele rezultate nu tocmai precise.

    Urmatorul pas ar fi partea a doua, cea care va oferi informatii de tip webmaster utilizatorilor, care va fi mult mai interesanta pentru membrii de pe forum.

    Aici, este loc de o multime de lucruri, dar idei inca trebuiesc adunate. Deocamdata prima idee este furnizarea de informatii privind link structure, link-urile inbound, outbound, rank intern, "PR" transmis de fiecare site, nofollow si dofollow, statistici site etc.

    Ulterior sper sa pot oferi si alte informatii avansate. Nu voi vorbi inca despre ele, dar sper sa fie o surpriza placuta. Sunt ceva idei interesante pe rol, sa vedem daca voi gasi si solutiile tehnice de implementare.

    Nota: la partea de avansate va fi foarte mult de munca; nu stiu daca nu cumva va trebui sa existe si o versiune paid a proiectului. Intentia mea este sa fie pe cat posibil un proiect free, dar s-ar putea ca partea de avansate sa necesite o echipa de dezvoltare, caz in care costurile vor trebui suportate cumva. Dar chiar si in acest caz, probabil va exista un acces free si la informatiile avansate, cu limita de utilizare, pentru ca fiecare sa-si dea seama daca chiar ii este util sau nu).

    Sper ca aceste 2 sub-proiecte (search engine si webmaster/seo info) sa fie live, in faze beta, in termen de 1-2 luni maxim.

    Pentru ultimul proiect, si anume analiza de nisa, nu am inca un termen. Aici va trebui sa asamblez o echipa de coderi care sa-mi continue munca. Nu mai e o treaba pentru un singur dezvoltator.

  7. #27
    Avatarul lui Sorin Frumuseanu
    Sorin Frumuseanu este deconectat Ambasador
    Reputatie:
    62
    Data înscrierii
    2nd August 2005
    Locaţie
    Orsova
    Vârstă
    52
    Posturi
    3.946
    Putere Rep
    62


    Implicit

    Citat Postat în original de emm Vezi Post
    Sper insa ca va oferi o alternativa de cautare informatii relevante
    informatii relevante = cuvantul magic
    Toti suntem intersati de asa ceva si la o adica si investitorii.
    Daca te ajuta la ceva, am inceput sa numar paginile indexate la statistici retele sociale.

    Ulterior m-am gandit ca e interesanta o comparatie cu yahoo, bing sau actualele motoare de cautare romanesti.
    Daca am timp data viitoare...

    Ca idee continua si asteptam vesti bune.
    Credinta la institutiile specializate. Aici facem Servicii de seo
    Mi se spunea 1nesco

  8. #28
    Avatarul lui emm
    emm
    emm este deconectat Ambasador
    Reputatie:
    55
    Data înscrierii
    11th November 2006
    Posturi
    829
    Putere Rep
    55


    Implicit

    Citat Postat în original de 1nesco Vezi Post
    informatii relevante = cuvantul magic
    Toti suntem intersati de asa ceva si la o adica si investitorii.
    Daca te ajuta la ceva, am inceput sa numar paginile indexate la statistici retele sociale.

    Ulterior m-am gandit ca e interesanta o comparatie cu yahoo, bing sau actualele motoare de cautare romanesti.
    Daca am timp data viitoare...

    Ca idee continua si asteptam vesti bune.
    Multumesc, 1nesco!

    Dealtfel, orice idee de functie utila, primita in acest thread, pentru care gasesc solutie tehnica, voi cauta sa o implementez.

    De remarcat insa ca pentru mine, partea de search engine este un proiect secundar (celelalte 2 sunt mai importante din punctul meu de vedere). E pur si simplu o rezultanta logica a utilizarii datelor. Nu voi sta sa fac foarte mari investitii in relevanta, ci doar sa o aduc la un nivel decent... pe cat posibil.

    --- Later Edit --- (ca mi-a fost lene sa apas "Edit")

    Asta pentru ca este destul de greu sa ii iei painea de la gura lui Google (mult trambitata relevanta).

    --- Later Edit --- (ca mi-a fost lene sa apas "Edit")

    Si un comentariu despre relevanta si spam:

    Google are probleme cu spam-ul, dupa parerea mea, tocmai pentru ca spam-filtering-ul se face mai ales automatic. De aici, probleme mari cu relevanta, intrucat algoritmii lor sunt din ce in ce mai orientati pe trust si mai putin pe relevanta. Practic spammerii castiga teren, in lupta cu G. De aici, faptul ca rezultatele relevante sunt de multe ori pe pozitia 462.

    Acest motor de cautare este mult mai mic ca domeniu (pagini ro). Daca va fi suficient de bun din punct de vedere comercial, va avea o echipa full-option de manual ban, si dezvoltatori care sa implementeze filtre conform tentativelor de spam detectate. Poate sortarea nu va fi perfecta (ranking-ul), dar macar sper sa nu apara rezultate complet anapoda in index.

    Lucru care imi da oarecari sperante cu relevanta. Dar, fireste, e devreme sa stiu sigur.

  9. #29
    Avatarul lui Sorin Frumuseanu
    Sorin Frumuseanu este deconectat Ambasador
    Reputatie:
    62
    Data înscrierii
    2nd August 2005
    Locaţie
    Orsova
    Vârstă
    52
    Posturi
    3.946
    Putere Rep
    62


    Implicit

    Ba cred ca poti concura cu google.
    Personal, cand chiar ma intereseaza ceva, utilizez MetaCrawler
    Credinta la institutiile specializate. Aici facem Servicii de seo
    Mi se spunea 1nesco

  10. #30
    Avatarul lui avram
    avram este deconectat Membru SeoPedia
    Reputatie:
    57
    Data înscrierii
    7th May 2011
    Posturi
    1.361
    Putere Rep
    57


    Implicit

    Citat Postat în original de emm Vezi Post


    Probabil prima varianta beta va folosi mai mult exact match si suport pentru "flexiuni posibile", dar e posibil sa intoarca si unele rezultate nu tocmai precise.

    .
    foloseste Levenshtein distance - Wikipedia, the free encyclopedia pentru similaritatea cuvintelor Reusable Code: Levenshtein distance

Pagina 3 din 4 PrimulPrimul 1234 UltimulUltimul

Informații subiect

Utilizatori care navighează în acest subiect

Momentan este/sunt 1 utilizator(i) care navighează în acest subiect. (0 membrii și 1 vizitatori)

Thread-uri Similare

  1. Cel mai bun motor de cautare romanesc
    De radupaco în forumul Motoare de cautare romanesti
    Răspunsuri: 27
    Ultimul Post: 4th May 2008, 09:19
  2. Motor cautare
    De radupaco în forumul Alte motoare de cautare
    Răspunsuri: 2
    Ultimul Post: 15th April 2008, 12:37
  3. Motor de cautare masini
    De mariusx în forumul Motoare de cautare romanesti
    Răspunsuri: 5
    Ultimul Post: 12th April 2007, 03:06
  4. Un nou motor de cautare romanesc
    De aricius2000 în forumul Motoare de cautare romanesti
    Răspunsuri: 5
    Ultimul Post: 15th November 2006, 02:15
  5. oare ce motor de cautare?
    De dexter în forumul Discutii generale privind optimizarea si motoarele de cautare
    Răspunsuri: 2
    Ultimul Post: 22nd May 2005, 14:36

Permisiuni postare

  • Nu puteţi posta subiecte noi.
  • Nu puteţi răspunde la subiecte
  • Nu puteţi adăuga ataşamente
  • Nu puteţi modifica posturile proprii
  •