Іпс-це... Призначення та функції інформаційно-пошукових систем

Сучасній людині важко уявити собі життя без Інтернету і практично миттєвого доступу до джерел інформації. Користувач рідко замислюється про те, як здійснюється пошук потрібного контенту в мережі. Але ж це дуже цікаво.

Інформаційно-пошукова система (ІПС) - це складний програмно-апаратний комплекс, що здійснює відбір інформації за запитом користувача. Інформація зберігається на серверах в цифровому вигляді, як раніше стояли книги на полицях бібліотек. Система складається з багатьох підсистем. Кожна виконує своє завдання в процесі обробки запиту користувача і надання йому інформації в текстовому або звуковому вигляді. Множинністю розв`язуваних завдань і обумовлена складність архітектури сучасних ІПС (абревіатура інформаційно-пошукової системи). Такий собі "чорний ящик": на вході-текст запиту, що всередині – невідомо, на виході-вичерпна інформація.

Картотека в реалі

Вхідний потік

Запити на отримання інформації, які формує людина в текстовому вигляді на екрані свого гаджета, складають малу частину оброблюваних пошуковою системою запитів. Основні масиви запитів для пошуку формують роботи, які приймають запит людини і здійснюють багатокроковий пошук і зворотний зв`язок з користувачем. До інформаційно-пошукових систем належать відомі всім Google, "Яндекс" і інші, що обробляють щодня мільйони запитів.

Вихідні об`єкти пошуку

Набором вихідних об`єктів, що представляють інтерес для пошуку, є документи, записи, відеофільми, зображення та інше. Створюються вони поза ІПС. Загальна система зберігання і пошуку інформації повинна мати вбудовану бібліографічну систему-своєрідний каталог, що дозволяє здійснювати пошук будь-якого роду об`єктів.

Об`єкти або їх цифрові перетворення стають "ресурсом входу" в ІПС. Це серед них відбирають потрібну користувачеві інформацію.

Пошук інформації

Зовнішні джерела

У поданні вибору інформації використовуються зовнішні джерела знань. Це та інформація, яку шукає Користувач. Назва фільму, цитата з книги та інше. Для комп`ютерного пошуку цю інформацію необхідно перевести в запит на алгоритмічній мові. В ІПС це здійснюється за допомогою блоку створення, індексування та розробки запитів.

В ідеалі ці три процеси-репрезентація, індексація та розробка запитів - повинні спиратися на ідентичні джерела знань, але на практиці це недосяжно.

Необхідно постійно переглядати і оновлювати джерела знань, причому оновлення має бути ідентичним і синхронізованим. Та й зовнішнє джерело знань завжди хронологічно передує використанню його в пошукових системах для запиту, іноді на кілька років.

Система пошуку інформації

Уявлення

Представлення вихідних об`єктів складаються з вхідних даних в деяку комбінацію або перетворюються відповідно до правил і алгоритмами конкретної інформаційно-пошукової системи.

Подання-це більш-менш перетворені копії оригінального об`єкта пошуку. У колекції невідредагованих повних текстів кожен текст є власним поданням. У колекції об`єктів музейних експонатів і артефактів поданням може бути трансформований опис об`єкта з його зображенням. У деяких випадках подання може бути частково отримано з вихідного об`єкта і частково з опису: в бібліографічних системах пошуку уявленнями є похідні від об`єкта-наприклад, назва, ім`я автора буде поєднуватися з анотацією твору.

Пошук потрібного

Індекс з можливістю пошуку

Так як інформація в інформаційно-пошукових системах зберігається у формі подання, логічно припускати, що пошук здійснюється за поданням і після відбору видається користувачеві. На практиці це не так. Наприклад, поточні каталоги мережевих бібліотек зазвичай обмежують пошук за кількома полями: автором, заголовком та підзаголовками всередині подання, що містить інші поля, де пошук не вдається. Це достатня причина, чому необхідно розрізняти подання та індекс, який можна шукати, який є пошуковою частиною подання. Він визначає все, що повинно бути доступним для пошуку. Індекс, який можна шукати, як подання та вихідний об`єкт, можна розділити на окремі субіндекси, щоб забезпечити більш точний, цільовий пошук

Пошукові системи звичайно мають всередині синтетичну структуру для зіставлення допустимих результатів пошуку. Ця структура є другим компонентом індексу, який можна шукати.

Процедурно процес індексації може бути реалізований по-різному: Індекс, доступний для пошуку, може бути отриманий шляхом:

  • буквального копіювання подання, доступного для пошуку;
  • шляхом копіювання деталей подання. Це може бути частина або всі подання, які існують фізично лише у вигляді фрагментів, розподілених за правилами створення індексу для пошуку, який буде зібраний за потреби.
Управління пошуком

Правила розробки запитів та формальні запити

Розробка запитів-це функція, яка є посередником між запитом користувача та офіційним запитом. Вона перетворює запит Користувача, узгоджуючи його зі словниками команд вилучення, специфікації індексу та індексом до вилучення. На зорі розвитку ІПС ця роль традиційно відводилася кваліфікованим IT-фахівцям.

Розробка комп`ютерних запитів, які можуть зіставляти запити зі словником в індекс системи з можливістю пошуку, зазвичай називається модулем "введення словника". Автоматизація цієї функції є перспективною та пропонує можливості для експертних та імовірнісних методів пошуку.

Формальний запит стає таким після перетворення запиту користувача. Приклади таких формальних перетворення включають усічення, заміну, нормалізацію, векторизацію та інші перетворення "зовнішній" уявлення у "внутрішній" представлення комп`ютерних ІПС – розшифровка-інформаційно-пошукова система).

Витягнуті Набори посилань на документи

Отриманий набір джерел інформації логічно є підмножиною подань, створений за правилами зіставлення, застосованого до формального запиту індексом з можливістю пошуку.

Зазвичай, але не обов`язково, існує окремий процес сортування відновленого набору інформації. Інтернет-каталоги бібліотек зазвичай переставляють отримані набори в алфавітному порядку за автором перед відображенням. У системах пошуку інформації, які виробляють суворе ранжування, ранговий порядок передує будь-якому переупорядкування.

Аналіз даних

Вихідний потік

Виведення результатів пошуку здійснюється традиційно на дисплей, частіше у вигляді потоку об`єктів, які будуть використовуватися в іншому місці або для деяких інших цілей, завершує основний цикл пошуку.Такі потоки можуть бути спрямовані на пристрої візуалізації, зберігання для подальшої обробки або використання в якості вхідних потоків в інші служби відбору.

Інформаційно-пошукові системи дозволяють здійснювати зворотний зв`язок з виходом будь-якого процесу відбору. Вихідні дані будь-якого процесу можуть являти собою зворотний зв`язок з іншими процесами. Зворотній зв`язок може забезпечити основу для експертного судження на будь-якому етапі.

Статті на тему