КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Текстовый документ
1. Включите сканер. 2.Запустите программу FineReader (Пуск > Программы > ABBYY FineReader > Fine Reader 4.0 Professional). 3. Откройте крышку сканера, положите документ на окно сканера текстом вниз, закройте крышку сканера. 4. Щелкните на кнопке Сканировать на панели инструментов Scan&Read. 5. Дождитесь окончания сканирования. Обратите внимание на появление значка отсканированного документа на панели Пакет и окна Изображение. 6. Щелкните на кнопке Сегментировать на панели инструментов Scan&Read. Изучите результат автоматической сегментации. 7. Щелкните накнопке Распознать. Ознакомьтесь с распознанным текстом в окне Текст. 8. Сохраните распознанный текст в виде текстового файла. 9. Откройте текстовый файл в программе Блокнот и еще раз убедитесь в правильности распознавания. Закройте программу Блокнот. 10.Дайте команду Файл > Открыть и выберите изображение, созданное в предыдущем упражнении. 11.Выберите это изображение в окне Пакет и проведите его распознавание в соответствии с пп. 6-8 данного упражнения. 12.Сравните результаты распознавания при сканировании через TWAflV-драйвер и в обход его. Сравните трудоемкость этих операций.
Мы научились преобразовывать бумажные документы в электронную форму при помощи программы FineReader. Мы познакомились с возможностью работы с пакетом страниц. Мы также выяснили преимущества методов сканирования с использованием TWAIN-драй вера и в обход его. Упражнение 17.3. Ручная сегментация изображения
1. Включите сканер. Мин 2.Запустите программу FineReader (Пуск > Программы > ABBYY FineReader >FineReader 4.0 Professional). 3. Откройте крышку сканера, положите документ на окно сканера текстом вниз, закройте крышку. 4. Щелкните на кнопке Сканировать на панели инструментов Scan&Read и дождитесь окончания сканирования. 5. Щелкните на кнопке Сегментировать на панели инструментов Scan&Read. 6. Щелкните на кнопке Распознать на панели инструментов Scan&Read. Ознакомьтесь с тем, как проведено упорядочение распознанного текста в соответствии с автоматической сегментацией. Оцените пригодность полученного документа. 7. Закройте окно Текст. Полученный документ предварительно сохраните для сравнения. 8. Щелкните в окне Изображение правой кнопкой мыши и выберите в контекстном меню команду Удалить все блоки. 9. Сформируйте блоки вручную, выделяя отдельные элементы документа. 10.Чтобы блоки, содержащие иллюстрации, не распознавались как текст, щелкните на каждом из них правой кнопкой мыши и выберите в контекстном меню команду Тип блока > Картинка. 11.Щелкните на кнопке Перенумеровать блоки на панели Инструменты. Задайте последовательность блоков, щелкая на них в том порядке, в каком их содержимое должно включаться в окончательный документ. 12.Щелкните на кнопке Распознать на панели инструментов Scan&Read. Сохраните полученный документ. 13.Сравните документы, полученные в результате автоматической и ручной сегментации.
Мы научились производить ручную сегментацию изображения для распознавания и узнали, в каких случаях ее следует производить. Мы также узнали, как задается тип блоков и порядок блоков, чтобы полученный документ наилучшим образом соответствовал оригиналу. Упражнение 17.4. Создание шаблона
|