Multumesc mult, este util. Totusi implementarea nu va fi atat de simpla. Dar este un punct bun de start.
Iti dau si un exemplu: cuvantul "roata" si flexiunea "roti". Distanta Levenshtein este 3, totusi cuvintele sunt extrem de aproape unele de altele.
Daca as accepta Levenshtein <=3 ca principiu, ar aparea o gramada de garbage in search results.
Probabil ca va trebui sa folosesc o combinatie de Levenshtein si date statistice pe dictionarul master... si asta de obicei inseamna o gramada de consum CPU.
--- Later Edit --- (ca mi-a fost lene sa apas "Edit")
Ca si contraexemplu care arata ce spun: cuvantul "Roma" are distanta 2 fata de "roti", deci mai mic decat "roata", si totusi nu are nicio legatura cu acesta.
--- Later Edit --- (ca mi-a fost lene sa apas "Edit")
Nu stiu cum face Google, dar el intoarce totusi rezultate foarte diferite intre cele 2 cuvinte.
Probabil ca o solutie simpla este sa las userul sa decida.... exact match sau distanta = 1, 2, 3.