Студопедия

КАТЕГОРИИ:

АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника


Інформаційний пошук та спільне використання інформаційних ресурсів




Одне з призначень служби WWW – це відшукання потрібної інформації в Інтернет. Є декілька способів пошуку інформації у всесвітній павутині World Wide Web.

Перш за все зазначимо, що на відміну від бібліотеки, де для полегшення пошуку інформації надходження кожної книги належним чином реєструється у відповідних каталогах, Інтернет не є централізованою системою, тому величезні об’єми інформації щодня з’являються і зникають тут без всякої реєстрації. Завдання пошуку з більшим чи меншим успіхом вирішуються різноманітними пошуковими системами – спеціальними серверами, що постійно відслідковують певні сегменти Інтернету, забезпечуючи своїм користувачам можливість пошуку інформації за допомогою каталогів та індексів.

Каталоги пошукової системи організовані аналогічно систематичним каталогам бібліотек, що містять ієрархію розділів (наприклад: Держава і суспільство, Наука і освіта, Бізнес і фінанси тощо), які можуть поділятися на більш детальні підрозділи і т.д. Ведення і поповнення каталогів також організоване як у бібліотеках. Цим займаються як автори веб-сторінок, так і співробітники, що забезпечують функціонування пошукової системи.

Перевагою каталогів є більш чітка і впорядкована структурна організація, проте ведення каталогів вимагає значних обсягів людської праці, тому каталоги не можуть відслідковувати всю наявну в Інтернеті інформацію, до того ж досить часто буває важко однозначно віднести сторінку чи сайт до того чи іншого розділу, а отже і скористатися каталогом для їх пошуку.

Індекси пошукової системи автоматично формуються за допомогою потужних комп'ютерів, що постійно переглядають Інтернет, і дають змогу користувачам виконувати пошук інформації за ключовими словами.

Дійсно, комп'ютери можуть дуже швидко індексувати (тобто впорядковувати за алфавітом) великі масиви слів. Сервери пошукових систем виконують цю роботу не для окремих документів, а для всієї інформації, яку вони знаходять у Інтернеті, створюючи величезні індексні файли. В них поряд з кожним словом розміщується інформація про те, з якої веб-сторінки воно взяте. Отримавши запит на пошук по ключовому слову, пошукова система знаходить його в своєму індексному файлі приблизно так, як ми знаходимо слово у словнику, та надсилає нам перелік веб-сторінок, в яких це слово зустрічається.

Пошукові системи знають граматичні форми мов, з якими вони працюють: Rambler, Яndex та Апорт – російської, Мета – української і російської тощо. Наприклад, якщо в цих системах набрати ключові слова человек идет, то сторінки з текстом люди шли також будуть знайдені, не кажучи вже про однокорінні слова, що відрізняються лише відмінком, родом, числом і т.п. Натомість так звані стоп-слова (прийменники, займенники, деякі інші часто вживані слова) як правило ігноруються пошуковими системами, бо зустрічаються практично у кожному документі і тому не несуть інформації, корисної для пошуку.

Перевагою індексів є те, що вони створюються автоматично і тому охоплюють більші обсяги інформації і оперативніше відслідковують її зміни. Недоліком – те, що розшукувані ключові слова можуть використовуватися у іншому контексті, й часто трапляється, що знайдена інформація хоч і містить ключові слова, проте не має нічого спільного з тим, що ми насправді розшукуємо.

Деякі пошукові системи взагалі не мають каталогів і використовують тільки індекси. Навпаки, є пошукові системи, такі як www.list.ru, www.weblist.ru, www.stars.ru, www.au.ru, www.ru, www.ulitka.ru, що відзначаються перш за все великим обсягом і зручною організацією каталогів, хоча у них є можливість пошуку і за індексами, в тому числі в межах вибраного вами розділу каталогу.

Аналізуючи результати пошуку, не слід забувати й про те, що за час, який минув від моменту створення каталогів та індексів до моменту коли ми ними скористалися, інформація на веб-сторінках могла змінитися, а частина сторінок може бути тимчасово чи вже остаточно недоступною.

Перелік найпопулярніших пошукових систем подано в табл. 2.1.1.

Таблиця 2.1.1

Пошукова система Адреса в Інтернеті Мова інтерфейсу Охоплює переважно
Мета www.meta-ukraine.com Укр., рос., англ. Україну
Rambler www.rambler.ru Російська Росію та СНД[1]
Яndex www.yandex.ru Рос., англ. Росію та СНД
Апорт www.aport.ru Російська Росію та СНД
AltaVista www.altavista.com www.fr.altavista.com www.de.altavista.com www.es.altavista.com Англійська Французька Німецька Іспанська Америку, Західну Європу
Yahoo www.yahoo.com www.fr.yahoo.com www.de.yahoo.com www.es.yahoo.com Англійська Французька Німецька Іспанська Америку, Західну Європу
Lycos www.lycos.com Англійська Америку, Західну Європу
Hotbot www.hotbot.com Англійська Америку, Західну Європу

 

Щоб скористатися пошуковою системою, треба відкрити її веб-сторінку, вибрати потрібний каталог та його підкаталоги або ввести ключові слова у відповідне поле і натиснути кнопку пошуку чи клавішу Enter.

Існують також так звані сторінки метапошуку, наприклад www.find.ru через які можна послати запити до декількох пошукових систем одночасно.

Подібний засіб є також у складі самої програми Internet Explorer. Щоб ним скористатися натисніть на панелі інструментів кнопку Поиск, виберіть у вікні Поиск категорію пошуку: Поиск веб-страницы, введіть ключові слова і натисніть кнопку пошуку чи клавішу Enter. Результати пошуку відображатимуться у вікні Поиск. Щоб виконати пошук тих самих ключових слів у наступній пошуковій системі, натисніть кнопку Следующий. Кнопка Настройка, дозволяє задати перелік пошукових систем і послідовність, у якій вони застосовуватимуться.

Вікно Поиск зберігає також результати десяти попередніх пошуків. Щоб їх переглянути, виберіть радіокнопку Предыдущий поиск та знайдіть у списку ключові слова, за якими виконувався цей пошук.

Складні запити і розширений пошук. Складні запити застосовують, коли пошук за одним чи декількома ключовими словами не дає бажаного наслідку, бо кількість знайдених документів залишається непомірно великою. На жаль, загальних стандартів побудови складних запитів не існує, і кожна пошукова система має свої особливості, детально ознайомитись з якими можна на її сайті, скориставшись сторінкою допомоги.

У табл. 2.1.2 наводяться приклади найбільш вживаних логічних функцій, що застосовуються у складних запитах пошукових систем, зазначених у табл. 2. Користуючись ними, можна будувати більш складні вирази, враховуючи пріоритетність виконання логічних операцій НЕ, І, АБО: в першу чергу виконуються операція НЕ (NOT, !), потім І (AND, &, +), в останню чергу – АБО (OR, | ). Щоб виконати ці операції в іншій послідовності, застосовують дужки, наприклад у пошуковій системі Rambler запит джем OR (фрукти NOT (яблука OR груші)) забезпечує пошук сторінок, де є слово фрукти, але нема слів яблука чи груші, також будуть знайдені сторінки, де є слово джем.

Таблиця 2.1.2

Знайти сторінки, що містять: Запит Мета Rambler Яndex Апорт AltaVista Yahoo Lycos Hotbot
і слово a, і слово b а b · · · · · ·    
а + b ·     ·     ·  
+а +b     ·   · · ·  
а AND b   ·   · ·     ·
а & b   · ·   ·      
слово a, але не містять слова b ab ·              
а –b     ·   · · ·  
а ~ b     ·          
а NOT b   ·     ·     ·
а & !b   ·            
або слово a, або слово b а | b · · · · ·      
а OR b   ·   · ·      
слово а (точна цитата) а · ·     · · · ·
    ·          
слово, що починається з а а*       · · ·    
слова a і b в межах фрагменту, що складається з n слів [n, a b] ·              
‘(n, a b)’   ·            
слn(a b)       ·        
a /(n-1)b     ·          
a і b в не далі ніж за 10 слів а NEAR b         ·      
слово a в назві документу title(а) ·              
t:a           ·    
слово a в одному з заголовків heading(а) ·              
слово a в адресі URL u:a           ·    

 

Писати подібні вирази безпосередньо у полі пошуку не дуже зручно. У якійсь мірі спростити цю роботу можна, викликавши сторінку розширеного пошуку (advanced search), що є майже у кожній пошуковій системі. Наприклад, у системі Lycos можна ввести декілька слів у поле пошуку а потім вибрати у розташованому нижче списку All Words (AND match) (усі слова) або Any Words (OR match) (якесь із слів) чи Exact phrase (quoted query) (точна цитата), що заміняє застосування AND, OR та “...” відповідно. Крім цього на сторінці розширеного пошуку можна задати багато інших параметрів зокрема:

· Де саме шукати вказані ключові слова? Можливі варіанти вибору: у всьому документі, в його назві, заголовку чи основному тексті, у підписах до малюнків чи назвах музичних файлів; серед сайтів, що є результатами попереднього пошуку; у сайтах, написаних вибраною мовою; у сайтах певного призначення, наприклад сайтах новин, товарів тощо, або навіть у цілком конкретному сайті чи його папках.

· Чи слід обмежувати максимальну відстань між ключовими словами у тексті? Якщо так, то як саме?

· Чи є обмеження на час створення розшукуваних документів? Якщо так, то у якому діапазоні дат виконується пошук?

· В якому вигляді слід виводити знайдену інформацію? Тільки назва документа чи певний фрагмент з уривком тексту. Яка величина фрагменту?

· В якому порядку і якими порціями виводити інформацію про знайдені документи? Відсортованими за датою їх створення (спочатку новіші чи навпаки), за релевантністю, тобто мірою відповідності критеріям пошуку тощо.

Перегляд результатів пошуку. Найперше, на що слід звернути увагу, аналізуючи результати пошуку, – це дані про кількість знайдених сайтів і документів, що відповідають умовам пошуку. Якщо ця кількість виявляється занадто великою, то, очевидно, слід задати більш детальні критерії пошуку, щоб відібрати саме ту інформацію, яка найбільш точно відповідає нашим потребам.

Результати пошуку виводяться сторінками. Кожна з них містить інформацію приблизно про 10-15 знайдених документів. Для переходу до наступної чи попередньої сторінки треба натиснути кнопку з посиланням на відповідний номер сторінки: 1 2 3 4 чи діапазон номерів документів: 1-10 11-20 21-30 31-35. Сторінка, на якій ви зараз знаходитесь, (в нашому прикладі – це 2 чи 11-20) не містить посилання на саму себе. По краях списку можна знайти також символи подібні до >>> чи <<<, що означають продовження пошуку і перехід до сторінки, де будуть посилання на наступну групу сторінок, наприклад: 5 6 7 8, та повернення до сторінки з посиланнями на групу сторінок, що переглядалися раніше.

Нагадаємо, що інформація про знайдені документи може виводитись у короткій (тільки назва документу) чи більш деталізованій формі (з невеликим уривком його основного тексту). При значній кількості знайдених документів має значення, у якій саме послідовності вони виводитимуться: спочатку новіші документи чи ті, що точніше відповідають умова пошуку тощо. Всі ці й деякі інші параметри задаються на сторінці Розширений пошук.

Знайшовши сторінку в Інтернеті, часто буває необхідно віднайти на ній потрібний текст. Для цього можна скористатися опцією Найти на этой странице… у меню Правка або комбінацією клавішів Ctrl+F.


Поделиться:

Дата добавления: 2014-12-03; просмотров: 112; Мы поможем в написании вашей работы!; Нарушение авторских прав





lektsii.com - Лекции.Ком - 2014-2024 год. (0.005 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав
Главная страница Случайная страница Контакты