Nu vreau sa fiu rau, dar au fost prea multe minciuni.... pana la urma tot ce ai facut tu la site a fost logo-ul. Recunoaste si tu si nu se ajungea pana aici. Ti-am zis ca te ajut ca am ceva experienta cu motoarele de cautare.
Hai sa iti dau ceva sfaturi:
- pt ce vrei tu, un cont shared de gazduire nu e de ajuns.
- ca sa indexezi doar siteurile din romania.... eu de abia am pus cateva sute de siteuri cu vreo 20 mii de pagini si deja baza de date a ajuns la vreo 5 GB. MySQL se descurca bine cu baze de date f mari dar gandeste-te ca, cautarea in baza de date trebuie sa se faca f repede, nu sta nimeni mai mult de cateva secunde sa se afiseze rezultatele. Pentru asta iti trebuie un server mysql puternic, sa il setezi incat sa se descurce bine cu baze de date f mari. Si lucrul asta nu il poti face cu un cont de gazduire normal pt ca nu ai acces la setarile serverului. Trebuie sa ai server propriu.
- eu de ex am facut asta vara un experiment, am mutat bazele de date la mine in calculator, atunci aveam un VPS, pentru a nu stresa prea mult serverul. Pot sa zic ca mergea hardul si procesorul la 100% zile intregi. Si aveam configuratie destul de buna, 3500 procesor, 2 GB RAM. Si asta la doar 5 GB de date. Ca sa indexex siteurile romanesti mi-ar trebui cel putin cateva servere puternice. Asta daca vreau sa fac ceva serios.
Citeste si topicul:
Optimizare baze de date foarte mari
si mai ales:
http://forum.seopedia.ro/44149-post28.html
Acolo am scris mai multe despre lucrul cu baze de date foarte mari, si cum se poate optimiza serverul de mysql pt asta
- daca tot ai pornit de la sphider, sau orice script gratuit, nu te multumi doar sa il instalezi, incearac sa studiezi fisierele, sa ii mai aduci si tu imbunatatiri. Sincer de la sphider am pornit si eu si de aia ti=am zis din prima despre ce e vorba.
- eu cred ca problema la un motor de cautare nu e softul sau robotul, ci partea hardware si puterea de calcul a serverelor.
- gandeste-te ca o sa ai probleme si cu anumite siteuri pe care le indexezi. Eu de ex am avut probleme cu softpedia, mi-a fost banat de cateva ori IP-ul din cauza robotului si a trebuit sa vb cu cineva de acolo sa il deblocheze.
- gandeste-te ca nue de ajuns sa indexezi siteurile si gata, ele raman in baza de date. Trebuie sa ai un algoritm, sa vezi cat de des se schimba continutul, sa sti cat de des sa il reindexezi. Ar trebui sa ai o gramada de servere care sa ruleze non stop. Deci un cost hardware f mare.
- si ce e cel mai important pt vizitatori: relevanta rezultatelor. Sphider e cam varza la asta. De aia am si eu un proiect separat cu un alt algoritm, un fel de page rank cum e la google dar normal ca se va numi altfel.
- un motor de cautare nu este un motor de cautare in adevaratul sens al cuvantului daca doar indexeaza siteurile care se inscriu la tine, si nu indexeaza automat.
- iti dau un sfat, daca folosesti sphider: da-i sa porneasca de la un director cunoscut si cu cat mai multe siteuri in baza de date.
- incearca sa vorbesti calm si sa ceri sfaturi si o sa ai mai mult de invatat asa. Si poate in viitor o sa am un concurect important legat de motoarele de cautare
Imi cer scuze, dar sincer nu pot sa ma abtin
Deci:...un search engine cu algoritm de pagerank implementat ... algoritm de pagerank facut personal ... doar eu si google avem asa ceva ...
Bafta.