.

Загальні принципи роботи пошукових систем

   Пошукова система складається з наступних основних компонентів:

    * Spider (павук) - браузероподібна програма, яка завантажує веб-сторінки.
    * Crawler (краулер, «мандрівний» павук) - програма, яка автоматично проходить по всіх посиланнях, знайденим на сторінці.
    * Indexer (індексатор) - програма, яка аналізує веб-сторінки, які були завантажені павуками.
    * Database (база даних) - сховище викачаних і оброблених сторінок.
    * Search engine results engine (система видачі результатів) - витягує  результати пошуку з бази даних.
    * Web server (веб-сервер) - веб-сервер, який здійснює взаємодію між користувачем і іншими компонентами пошукової системи.

Детальна реалізація пошукових механізмів може відрізнятися одне від одного (наприклад, зв'язка Spider + Crawler + Indexer може бути виконана у вигляді єдиної програми, яка завантажує відомі веб-сторінки, аналізує їх і шукає за посиланнями нові ресурси), проте всім пошуковим системам властиві описані загальні риси.

Spider. Павук - це програма, яка завантажує веб-сторінки тим же способом, що і браузер користувача. Відмінність полягає в тому, що браузер відображає інформацію, що міститься на сторінці (текстову, графічну і так далі), павук же не має ніяких візуальних компонент і працює безпосередньо з HTML-текстом сторінки (ви можете зробити «перегляд HTML-коду» в Вашому браузері, щоб побачити «сирий» HTML-текст).

Crawler. Виділяє всі посилання,що  присутні на сторінці. Його завдання - визначити, куди далі повинен йти павук, грунтуючись на посиланнях або виходячи із заздалегідь визначеного списку адрес. Краулер, заходячи на знайдені посилання, здійснює пошук нових документів, ще невідомих пошуковій системі.

Indexer. Індексатор розбирає сторінку на складові частини і аналізує їх. Виділяються і аналізуються різні елементи сторінки, такі як текст, заголовки, структурні та стильові особливості, спеціальні службові HTML-теги і т.д.

Database . База даних - це сховище всіх даних, які Пошукова система викачує і аналізує. Іноді базу даних називають індексом пошукової системи.

Search engine results engine . Система видачі результатів займається ранжуванням сторінок. Вона вирішує, які сторінки задовольняють запит користувача, і в якому порядку вони повинні бути відсортовані. Це відбувається згідно з алгоритмами ранжирування пошукової системи. Ця інформація є найбільш цінною і цікавою для нас - саме з цим компонентом пошукової системи взаємодіє оптимізатор, намагаючись поліпшити позиції сайту у видачі, тому надалі ми докладно розглянемо всі фактори, що впливають на ранжирування результатів.

Web server. Як правило, на сервері є HTML-сторінка з полем введення, в якому користувач може задати цікавить його пошуковий термін. Веб-сервер також відповідає за видачу результатів користувачеві у вигляді HTML-сторінки.

За матеріалами whiteseo.ru
 

Accounts area
Ім'я користувача:
Пароль:
Забули пароль? Реєстрація
Заслуговують уваги
Заслуговують уваги


Сиделка с проживанием на дому у больного . Где заказать сайт? Отзывы. . Лабораторная посуда от Спектар-Украина