Un motor de căutare este un apelabil program căutător, care accesează Internetul în mod automat și frecvent și care stochează titlul, cuvinte cheie și, parțial, chiar conținutul paginilor web într-o bază de date.
În momentul în care un utilizator apelează la un motor de căutare
pentru a găsi o informație, o anumită frază sau un cuvânt, motorul de
căutare se va uita în această bază de date și, în funcție de anumite
criterii de prioritate, va crea și afișa o listă de rezultate (engleză: hit list ).
Problema nu este de loc trivială, deoarece:
Pentru crearea acestor motoare de căutare este necesar un spider
(bot, spider, crawler) care este realizat într-un limbaj care poate fi
Perl, Ruby, Java, Php. Acesta extrage linkurile utile. Apoi aceste
linkuri se găsesc într-o formă prelucrată și filtrată prin metode
specifice într-o bază de date.
Problema nu este de loc trivială, deoarece:
- există deja peste 100 milioane de situri web, sumând în total miliarde de pagini web, distribuite pe tot globul
- conținutul acestori pagini nu este static, ci chiar extrem de dinamic (se schimbă frecvent)
- răspunsul la o comandă de căutare trebuie să vină repede, în general în mai puțin de o jumătate de secundă, chiar atunci când lista de rezultate conține, să zicem, zeci de mii de pagini web potrivite la criteriile de căutare folosite.
Motor de căutare | Cotă de piață |
---|---|
82,7% | |
Yahoo! | 6,5% |
Baidu | 4,7% |
Bing | 3,7% |
Ask | 0,5% |
Aol | 0,4% |
Excite | 0,0% |
Comentarii
Trimiteți un comentariu