Motoare de cautare

Un motor de căutare este un apelabil program căutător, care accesează Internetul în mod automat și frecvent și care stochează titlul, cuvinte cheie și, parțial, chiar conținutul paginilor web într-o bază de date. În momentul în care un utilizator apelează la un motor de căutare pentru a găsi o informație, o anumită frază sau un cuvânt, motorul de căutare se va uita în această bază de date și, în funcție de anumite criterii de prioritate, va crea și afișa o listă de rezultate (engleză: hit list ).
Problema nu este de loc trivială, deoarece:
  • există deja peste 100 milioane de situri web, sumând în total miliarde de pagini web, distribuite pe tot globul
  • conținutul acestori pagini nu este static, ci chiar extrem de dinamic (se schimbă frecvent)
  • răspunsul la o comandă de căutare trebuie să vină repede, în general în mai puțin de o jumătate de secundă, chiar atunci când lista de rezultate conține, să zicem, zeci de mii de pagini web potrivite la criteriile de căutare folosite.
Motor de căutare Cotă de piață
Google 82,7%
Yahoo! 6,5%
Baidu 4,7%
Bing 3,7%
Ask 0,5%
Aol 0,4%
Excite 0,0%
Pentru crearea acestor motoare de căutare este necesar un spider (bot, spider, crawler) care este realizat într-un limbaj care poate fi Perl, Ruby, Java, Php. Acesta extrage linkurile utile. Apoi aceste linkuri se găsesc într-o formă prelucrată și filtrată prin metode specifice într-o bază de date.

Comentarii