Поисковые системы

Материал из «Знание.Вики»
Поисковая система «Яндекс»

Поиско́вые систе́мы — системы, предназначенные для осуществления функции поиска в Интернете. Запрос обычно задаётся в виде какой-либо текстовой фразы. Поисковые системы в Интернете представляют собой наборы алгоритмов, которые работают как часы, когда пользователи обращаются к ним с запросом[1].

История появления поисковых систем

В 1990 году появилась первая поисковая система Archie-компьютерная программа, осуществлявшая поиск файлов на анонимных FTP-серверах. Она была создана Аланом Эмтейджем, Питером Дойчем и Биллом Хилланом — студентами Монреальского университета. Эта программа часто применялась и скачивала списки файлов со всех доступных FTP-серверов и строила базу данных с возможностью поиска по названию файла.

В 1991 году студент Миннесотского университета Марк Маккэхилл создал новый сетевой протокол Gopher. На базе этой статьи были созданы две новые — Veronica и Jughead. Veronica проводила поиск по ключевым словам почти всех заголовков системы Gopher. Jughead выполнял поиск информации по серверу по одному разу.

В 1993 году разработчиком Оскаром Нирштрассом из Женевского университета была представлена поисковая система W3catalog. Она копировала веб-страницы и переписывала их в стандартный формат. В этом же году разработчик из Массачусетского института Мэтью Грей создал первую в мире систему Wandex, которая могла индексировать сайты и выдавать результаты поиска по запросу[2].

Как работает поисковый индекс

Поисковые индексы работают автоматически, при помощи специальных программ (веб-пауков) сканируют страницы Интернета и индексируют их, то есть заносят к себе в базу данных. Поисковый робот («веб-паук») — программа, являющаяся составной частью поисковой системы и использующаяся для обхода страниц Интернета с целью занесения ключевых слов в базу поиска. Для многих программа «паук» больше всего напоминает обычный браузер. Он сканирует содержимое страницы, забрасывает его на сервер поисковой машины, которой она принадлежит, и отправляет по ссылкам на следующие страницы Интернета.

Большие сервисы выполняют индексацию в определённом интервале из-за необходимого времени и затрат на обработку информации, в тот момент как поисковые машины, основанные на агентах, строят индекс в результате реального времени[3].

Типы поисковых систем

Поисковые системы с общим поиском

Поисковые системы с общим поиском — это тип поисковых систем, с помощью которых можно найти любую информацию в интернете, по любым сайтам и источникам[4].

Специализированные поисковые системы.

Специализированные поисковые системы — это поисковые системы, которые предназначены только для определённых областей знаний или схожего контента. Они передают меньше информации, но находят более точную, связанную с конкретной темой или отраслью[4].

Метапоисковые системы

Метапоисковые системы — это поисковые системы, которые обрабатывают запрос пользователя сразу в разных сайтах поисковых систем. Далее эта система объединяет полученные результаты и предоставляет их пользователю в виде документа со ссылками[5].

Вертикальные поисковые системы

Вертикальные поисковые системы — общее название для тематических систем поиска в сети Интернет. Системы вертикального поиска сосредоточены на конкретной информации и выполняют глубокий поиск именно по данной тематике[5].

Социальные поисковые системы

Социальные поисковые системы — это поисковые системы, которые основаны на социальных сетях и сообществах. В процессе осуществления веб-поиска в социальном поисковике, используются не только алгоритмические данные, но и информация, содержащаяся в персонализированных тэгах, которые сохраняет пользователь[4].

Примечания

  1. Дибров М. В. 1 // Сети и телекоммуникации. Маршрутизация в IP-сетях в 2 ч. : учебник и практикум для вузов. — М.: Юрайт, 2020. — С. 182. — 333 с. — ISBN 978-5-9916-9956-3.
  2. Калмыков Михаил Александрович. История развития поисковых систем и алгоритмы их работы // Научные известия : журнал. — 2022. — № 28. — С. 33-35.
  3. Как работает поисковой индекс?. Студопедия (21 мая 2020). Дата обращения: 15 декабря 2023.
  4. 4,0 4,1 4,2 Угринович Н. Д. Информатика и информационные технолгогии. — М.: Бином. Лаборатория знаний, 2003. — С. 453. — 512 с.
  5. 5,0 5,1 Замятина О. М. Вычислительные системы, сети и телекоммуникации. — М.: Юрайт, 2020. — С. 87. — 159 с. — ISBN 978-5-534-00335-2.
WLW Checked Off icon.svg Данная статья имеет статус «готовой». Это не говорит о качестве статьи, однако в ней уже в достаточной степени раскрыта основная тема. Если вы хотите улучшить статью — правьте смело!