КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Язык запросов для Windows XPИспользуя запросы, можно искать документы по содержащимся в них словам и фразам или их свойствам: Для всех документов доступны следующие свойства.
Простейшим типом запроса является одно слово. Существуют пять типов запросов: · текстовые запросы в свободной форме; · запросы фраз; · запросы соответствий шаблону; · относительные запросы; · векторные запросы Для реализации всех типов запросов существует специальный язык запросов. Например, имена свойств могут задаваться как в длинной, так и в короткой формах.
В имени свойства регистр не учитывается. Если в имени больше одного слова, в запросах оно должно заключаться в кавычки как в длинной, так и в короткой форме. Тег {/prop} закрывает ссылку на имя свойства. Если в запросе использовано несколько имен свойств, первый тег {/prop} закрывает имя ближайшего предшествующего свойства, а текущим становится имя предыдущего свойства в запросе.
Имеются два специальных имени свойств: Contents и All. Свойство Contents включает все содержимое документа. Если в запросе задано свойство Contents, службой индексирования будет выполнен поиск только по содержимому документа. Если в запросе задано свойство All, службой индексирования будет выполнен поиск по содержимому и значениям свойств документа. Если в запросе не указано свойство, службой индексирования по умолчанию будет использовано свойство Contents. Системы локального поиска Системы локального поиска (для домашнего использования): · Персональный поиск Яндекса · Архивариус 3000 · Copernic Desktop Search; · Google Desktop Search с GDE Enterprise · DVYGUN Smart Search
Системы корпоративного локального поиска: · dtSearch Desktop · iSYS Desktop · DVYGUN Smart Search Enterprise Edition · SearchInform Desktop Professional Архивариус 3000 Программа Архивариус 3000 – это поиск документов и почтовых сообщений в компьютере, в локальной сети и в съёмных дисках.
Основные возможностиАрхивариус 3000: · Мгновенный полнотекстовой поиск документов и почты. · Смысловой поиск с морфологией на 18 языках (в том числе белорусском). · Поддерживаются локальная сеть и съёмные диски (CD, DVD и прочие). · Поддержка более 400 форматов от MS Office и PDF до LEX, и W&D (Слово и дело). · Поиск во всех распространенных типах архивов (начиная от ZIP и RAR, и заканчивая ARJ и ZOO. Архивариус 3000 умеет распаковывать архивы без использования внешних архиваторов). · Поиск почтовых сообщений Outlook, Outlook Express, MS Exchange, The Bat! и других. · Поиск в базах данных Lotus Notes и Lotus Domino. · Серверный режим и доступ из дома к рабочим документам через Интернет. Полностью поддерживается Unicode и более 100 кодировок (все европейские, все кириллические, все греческие, китайские, японские, корейские. Поддерживаются даже очень редкие кодировки: казахские, армянские, грузинские, тайские, тибетские и другие). SearchInform Desktop Professional SearchInform Desktop Professional- профессиональная программа полнотекстового поиска документов на персональном компьютере.
SearchInform поддерживает индексацию электронных писем, подключение и индексацию баз данных и других внешних источников. Для работы с сетью предлагаются клиент-серверная архитектура и политика настройки доступа к проиндексированным документам.
Основные возможности: · морфологический и цитатный поиск, · логические операции, · поиск с синтаксическим разбором слова (по началу слова, его окончанию, по средней части либо полное совпадение) · смешанный цитатный поиск (все слова из запроса должны присутствовать в документе, но не обязательно во введенном порядке) · поиск с коррекцией ошибок, использование синонимов и т.д. · применение словаря незначимых слов (в программе уже есть их готовый список) и использовать для поиска словарь приоритетных слов. · поиск документов, похожих по своему содержимому на текст запроса. Тестирование: SearchInform проиндексировала тестовую базу (документы в форматах DOC, TXT и HTML размером около 20 Гбайт) за 3 часа 17 минут, создав индексный файл размером 4,4 Гбайт. Компьютер: процессор Athlon/2,2 ГГц, оперативная память 1 Гбайт, IDE-диск Seagate на 160 Гбайт под управлением ОС Windows XP. Аппаратные решения корпоративного поиска 10.10.2007 Компания Google представила пятое поколение аппаратных поисковиков Search Appliance, ориентированных на крупные корпорации и правительственные организации. Search Appliance способны работать с более чем 220 типами различных файлов, включая документы HTML, Microsoft Office, PDF, PostScript, WordPerfect, Lotus и многие другие. Функция универсального поиска Universal Search обеспечивает связь с системами управления корпоративным контентом: · Microsoft SharePoint, · IBM FileNet, · OpenText LiveLink, · EMC Documentum. Стоимость аппаратных поисковиков Search Appliance от 30 000 $. Вопрос 13: Глобальный информационный поиск(поисковые системы, история поисковых систем, качество работы поисковых систем, поисковые запросы, поисковая оптимизация, социальный поиск)
История поисковых систем
По данным comScore лидерами поиска являются: 1. Google- 67,9% (рост за год 0,6%); 2. Baidu - 9,5% (китайская поисковая система); 3. Yahoo! - 8,9%. 4. Microsoft Bing - 2,9% 5. Naver - 2,1% (корейский поисковик), 6. Ask.com - 1,6%. 7. Яндекс - :1,5% (годовой рост 90%, переместился с 9 на седьмое место). По данным comScore лидерами поиска в Рунете являются: Яндекс - 54,5%, Google - 34,5%, Mail.ru. 9,7%, Rambler - 1,9%, (по данным ComScore за август 2009). Поисковые системы Поисковая система это: 1. Онлайн-сервис, предоставляющий возможность поиска информации на в Интернете. 2. Программно-аппаратная система, предназначенная для поиска и доставки информации. 3. Сайт, на котором по заданному запросу можно получить информацию о ресурсах в Интернете, соответствующих данному запросу. Основой поисковой системы является поисковый движок. Поисковый движок (search engine) - комплекс программ, обеспечивающий функциональность поисковой системы. Работа поискового движка состоит из этапов: · индексация информационных тесурсов; · поиск в индексе; · ранжирование результатов поиска и выдача их пользователю. Важнейшей частью поискового движка является поисковый робот. Поисковый ро́бот (web crawler) — программа, предназначенная для обхода и индексирования страниц Интернета. Web crawler сканирует содержимое страницы, заносит его на сервер поисковой машины, которой принадлежит и по ссылкам отправляется на следующие страницы. Индексация- процесс добавления поисковым роботом сведений о Web-страницах в индекс поисковой системы. Индекс- база данных поисковой системы, в которой перечислены все слова и указано, в каких местах они встречаются. Наличие заранее сформированного полнотекстового индекса позволяет поисковой системе произвести в нём поиск слов запроса и сразу получить список документов, в которых они встречаются.
|