КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
ПРИЛОЖЕНИЕ. Практический поиск в Internet ⇐ ПредыдущаяСтр 2 из 2
Практический поиск в Internet. Примеры поиска
1.Примеры поиска с использованием русскоязычных поисковых систем Рассмотрим примеры поиска с помощью русскоязычной информационно-поисковой российской системы Yandex.ru. Пусть требуется найти документы, где приводится материал по языку гипертекстовой разметки HTML. Учитываем особенности системы Yandex.ru, которая "любит" развёрнутые фразы. Допустим, что требуются те документы, которые в своих главных заголовках содержат словосочетание "описание HTML". В этом случае поисковая фраза может выглядеть так: $Title описание html. Для усиления запроса укажем расстояние между словами: $Title описание /1 html. Вводим и посылаем запрос. Результат поиска приведён на рис.1.
Рис.1.Результат поиска Далее можно рассуждать следующим образом: часто документы с описанием языка HTML упоминают технологию WWW. Поэтому можно дать задание на поиск, задав html и www как ключевые слова, возможно, в этом случае глубина поиска будет большей. Допустим, в первую очередь нас интересуют сведения об html. Можно задать порядок ранжирования результатов с учётом этого: html:5|www.Результаты поиска приведены на рис.2.
Рис.2.Изменение порядка ранжирования результатов поиска Анализ результатов показал, что ресурсов найдено больше, но релевантность документов гораздо ниже, чем в первом случае. То есть, мы организовали слишком общий запрос, и даже на первый взгляд видно, что в начале списка находятся документы, не отвечающие запросу. В этом случае можно попытаться поискать в найденном (активизируем флажок "Искать в найденном"), уточнив запрос (рис. 3). Рис.3.Результаты "поиска в найденном" Анализ этих результатов показал более высокую релевантность документов, поставленных в списке на первые места. Можно поискать такую же информацию, например, в системе Rambler.ru. Язык запросов этой системы не позволяет задать в запросе поиск в названиях документов, поэтому обратимся к расширенному поиску, где такая возможность имеется (рис.4 ).
Рис.4.Использование режима "расширенный поиск"
Результаты поиска приведены на рис.5.
Рис.5.Результаты "расширенного поиска" Rambler отыскал с помощью расширенного поиска весьма релевантные страницы с описанием языка HTML. Эта же система выдаст другие результаты, если задать поиск описания HTML не в расширенном поиске, а с применением языка запросов (рис.6).
Рис.6. Результаты поиска в Rambler с применением языка запросов.
Здесь задание на поиск вводилось в кавычках, в этом случае Rambler ищет не отдельные слова, а фразы, заключённые в кавычки. 2.Поиск файлов в Internet В Internet несколько тысяч (а может быть, десятков тысяч) FTP-серверов, и нерационально и невозможно обходить их по очереди в поисках нужного файла. Поэтому списки всех имеющихся файлов готовятся заранее специальными поисковыми системами. Поскольку FTP-серверы не содержат ссылок друг на друга, система для поиска файлов должна иметь их готовый список. Пользуясь таким списком, система периодически навещает каждый FTP-сервер и заносит в свою базу данных имена хранящихся там файлов. Чтобы найти файл, нужно соединиться с поисковой системой, набрать в специальном окошке полное имя файла или его фрагмент (как правило, можно использовать шаблон), нажать соответствующую кнопку (или просто клавишу Enter) и ждать результатов. Чтобы, например, отыскать стандартный архиватор PKZIP.EXE, воспользуемся услугами системой поиска файлов. Какую систему выбрать? Глобальной поисковой файловой системой является американская система ftpsearch.lycos.com. В последнеевремя в RuNet появилось много универсальных систем поиска файлов. Если Вам не известна ни одна из них, можно просто обратиться к поисковым системам Yandex.ru или Rambler.ru. за адресами. Например, просто введём поисковую фразу "поиск файлов" в окне системы Yandex.ru (рис.7). Рис.7.Запрос сведений о системах поиска файлов
Как видно, найдено 1333 сервера, предлагаемых для поиска файлов. Воспользуемся известной российской поисковой системой filesearch.ru (рис.8), введём в область поиска название программы, установим нужные режимы и выберем кнопку найти. Рис.8.Использование системы поиска файлов
Результаты поиска отображены на рис.9.
Рис.9.Результаты поиска файлов
Теперь щелчок по имени программы на понравившемся Вам сервере вызовет на экран окно загрузки (рис.10 ), где надо выбрать нужные режимы.
Рис.10.Диалог загрузки найденного файла
Рекомендуется выбрать режим "Сохранить", после чего в окне сохранения указать, в каком каталоге и с каким именем сохранять файл. После сохранения программу надо проверить на вирус и только после этого начать её установку или использование. Команду "Открыть" выбирать не следует из-за большей опасности получить вирус. Если Вы ищете не программу, а текстовые файлы, то можно попробовать и открыть файл, поскольку пока текстовые файлы на представляют опасности с точки зрения вирусов. Хотя надо всегда осторожно относиться к любым файлам, поскольку современные технологии предоставляют возможность, например, встраивать макросы в текстовые файлы формата .doc. Когда найдено много файлов, то, находясь в России, логично искать сервер из домена .ru. Но бывает и так, что файлы загружаются быстро с японских и австралийских серверов. Знакомство с файлами уместно завершить описанием наиболее часто встречающихся расширений, помогающих понять, что перед нами за файл. .zip, .arj, .rar — архивные файлы в системе Windows/MS-DOS. В архивах могут быть собраны файлы, из которых состоит объемный документ или программа. Архивные файлы создаются специальными программами-архиваторами, которые собирают множество файлов в один, стараясь упаковать их как можно плотнее. Объем архива может быть в несколько раз меньше суммарного размера всех содержащихся в нем файлов. Архиваторы очень полезны для экономии места на диске и для хранения множества файлов в одном месте; .jpg, jpeg, .gif, .tif, .tiff, .bmp — графические форматы. В файлах с такими расширениями хранятся всевозможные изображения. Особенно важны форматы .gif и .jpg, потому что только их «понимают» броузеры, и файлы именно этогоформата мы видим на Web-страницах; .txt - обычные текстовые файлы. Чаще всего это буквы и ничего кроме букв; .doc - чаще всего такое расширение имеют файлы, созданные в одной из версий редактора MS Word. К сожалению, стандартного формата .doc не существует, и файл, подготовленный в одной из версий MS Word, может не прочитатьсяили прочитаться с искажениями в другой версии. Вполне возможно, что расширение .doc имеет обычный текстовый файл; .ps - документ в формате Postscript. Чтобы читать документы в этом формате, необходима специальная программа GSView, сведения о которой можно найти по адресу www.cs.wisc.edu/~ghost/. Формат Postscript очень распространен в мире UNIX,, многие научные статьи и диссертации хранятся именно в этом формате; .pdf - очень распространенный формат для хранения документов, представляет собой специальным образом упакованный Postscript-файл. Для чтения файлов с расширением .pdf нужна специальная бесплатная программа Acrobat Reader. Как правило, там, где есть файлы в формате .pdf, есть и ссылки на серверы, откуда можно переписать эту программу; .sit, .sea - архивы, созданные в системе Macintosh. Эти архивы, как и другие файлы, могут быть закодированы в формате .hqx для того, чтобы их можно было пересылать как обычные тексты, например, электронной почтой; .wav, .mрЗ — в таких форматах хранятся музыкальные файлы. МРЗ - очень популярный сейчас формат, в который можно перевести файлы .wav. При этом длина файла уменьшается на порядок, а качество звука если и ухудшается, то не намного. 3.Особенности сохранения найденных ресурсов Рассмотрим некоторые особенности сохранения WEB-страниц. В общем случае, когда Вы получили на экран искомый документ, его можно сохранить на своём локальном диске, используя стандартную процедуру: ФАЙЛ-СОХРАНИТЬ КАК. Следует иметь в виду, что возможно несколько режимов сохранения, выбираемых в области "Тип файла". Это следующие.режимы: WEB-страница полностью - сохраняется текст в виде html-документа, а также все встроенные объекты в отдельной одноимённой папке), на диске занимает самый большой объём; WEB-страница, только HTML (.htm, .html)-сохраняется только html-документ без встроенных объёктов; текстовый файл (расширение .txt)- сохраняется в виде неформатированного текста; архивный файл (.mht) – сохраняется в виде архива. Некоторые страницы такими способами не могут быть сохранены в том виде, в котором они отображаются на экране. Например, страница, формирующая фреймовую структуру и отображающая в разных фреймах (окнах) разные документы, сохранит только HTML – код. В этом случае, если Вам нужно сохранить какое-то изображение, можно скопировать экран в буфер (клавиша Print Scrn) и затем вставить содержимое буфера, например, в документ редактора MS Word и затем его сохранить. Для сохранения каких-то фрагментов WEB – страницы следует выделить его на экране, скопировать в буфер и также вставить в документ MS Word, затем его сохранить и использовать в дальнейшем.
|