Студопедия

КАТЕГОРИИ:

АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника


Генераторы текстов




Онлайн-сервисы автогенерации текста:

http://referats.yandex.ru/ «Весна», она же служба «Яндекс.Рефераты» - предназначена для «всех, кто относится к тексту, как к количеству знаков» - студентов и школьников, дизайнеров и журналистов, создателей научных заявок и отчетов
http://ainte.spb.ru/talkbox/romhist/ Робот Сергей Дацюк: генератор постмодернистских текстов
http://dm.botik.ru/~madmax/tale/ Генератор сказок
http://ainte.spb.ru/talkbox/romhist/ Генератор романтических историй

Вопрос 17: Технологии компьютерной лексикографии (понятие, типы, сравнительная характеристика способов работы с электронным и книжным словарем, наиболее популярные группы электронных словарей, их пользовательские характеристики, карманные электронные словари).

Словарь - справочная книга, содержащая упорядоченное собрание слов (морфем, идиом и т.п.), дающая сведения об их значениях, употреблении, происхождении, переводе на другие языки, либо о предметах, обозначаемых ими.

Теорией и практикой составления словарей занимается лексикография.

Задачи компьютерной лексикографии

1 Автоматическое (с помощью компьютерных средств) получение из текста различных словарей (частотных, терминологических, конкордансов и т.д.)

2 Разработка теории и практики составления компьютерных словарей для NLP-систем (Natural Language Processing)

3 Создание электронных версий традиционных словарей и аутентичных электронных словарей

Антиномии бумажной лексикографии

Чем больше объем словаря, чем полнее и доказательнее описание лексических значений, тем сложнее им пользоваться. Это противоречие привело к поляризации рынка бумажных словарей: имеется большая группа массовых изданий, довольно примитивных, но относительно удобных, которой противостоят единичные пудовые профессиональные издания, непригодные для быстрого получения информации. Характерный пример - 20-томный Оксфордский словарь.
Чем полнее и глубже описание лексических значений, тем в меньшей степени словарь соответствует текущей языковой и культурной ситуации. Чрезвычайно долгий цикл создания и модификации фундаментальных бумажных словарей приводит к тому, что образ мира, который они фиксируют в системе своих значений, примеров и переводов, уже заметно отличается от действительности. Многие словари, основной корпус статей которых сформировался в языковой атмосфере середины века, представляют собой лексикографические музеи (а то и терминологические кладбища, если говорить о специализированных словарях).
Чем интереснее собственно лексикографическая концепция словаря, чем интегральнее средства описания лексических значений, тем уже его лексическая база. В результате, универсальные бумажные словари демонстрируют печальное отсутствие влияния достижений теоретической лексикографии на лексикографическую практику. Научные лексикографические проекты существуют, но реализуются в виде словарей, не покрывающих и 10% всего лексикографического пространства. Например, в знаменитом Толково-Комбинаторном Словаре (ТКС) под ред. Мельчука и Жолковского [1] описано всего около 400 лексических значений русского языка.

Особенности компьютерной лексикографии

Существенно более изощренные возможности показа содержания словарной статьи, включая возможность частичного показа по разным критериям ( различные "проекции" словаря), разнообразные графические средства, которые не используются в обычных словарях.
Использование для доступа к содержанию различных лингвистических технологий, таких как морфологический и синтаксический анализ, полнотекстовый поиск, распознавание и синтез звука и т.п.
Неизбежная актуальность лексикографии электроных словарей. Фундаментальные бумажные словари - неизбежно словари устаревшие. Функции фиксации текущего состояния языка берут на себя небольшие словарики, новые значения в которых оторваны от своих языковых корней, плохо или произвольно объяснены. Для массовых программных продуктов, каковыми являются электронные словари, характерны частая смена версий и наличие постоянной обратной связи с пользователями: коллективное авторство на словарное содержание принадлежит всем носителям языка, задача лексикографа - фиксация языковых фактов и их методически правильное описание.

Лексикографическое противоречие

Между новыми языковыми компьютерными технологиями и старым традиционным словарным содержанием возникает противоречие не позволяющим воспользоваться этими технологиями в полном объеме.

С точки зрения пользователя смысл реализации в электронном словаре всех этих технологий состоит в том, что становится возможным быстро получить информацию, которая содержится где-то в недрах словаря и непосредственно отвечает тому запросу, который сформулирован пользователем в удобной для него форме.
При традиционном подходе минимальной единицей доступа является лексема (имя словарной статьи): мы должны прочитать всю статью, чтобы определить, содержится ли в ней ответ на наш запрос. Для таких словарей, как оксфордский, это представляет серьезную проблему. Например, глагол set имеет там 400 только основных значений (и у многих из них имеются подзначения).

Пользователь хотел бы, чтобы словарь максимально локализовал релевантную информацию. При этом речь не идет об автоматическом выборе переводного эквивалента (если мы говорим о переводном словаре). Специфика словарного ответа в том, что он дает весьма разнообразную информацию о слове или словосочетании, а не просто переводное соответствие, предполагает активный выбор пользователя из нескольких возможных хорошо обоснованных альтернатив.
Однако, попытка решить проблему адекватной реакции словаря на запрос неизбежно наталкивается на сопротивление самого словарного материала, перенесенного из бумажного словаря.

Источник лексикографического противоречия

Электронный словарь представляет собой модель языка (морфологии, синтаксиса, семантики), устроенную на совершенно иных принципах, чем те формальные модели, которые лежат в основе компьютерных технологий.

Технология морфологического анализа всего лишь позволяет установить соответствие между исходной формой слова из текста и множеством лексем (словарных входов), для которой такая форма возможна. Синтаксический анализ позволяет сделать то же самое для словосочетаний, являющихся отдельными словарными входами.
Однако, для всех этих технологий само словарное содержание является "непрозрачным", полностью ими игнорируется. Заглянуть "внутрь" словарной статьи позволяет только полнотекстовый поиск. Однако, этот мощный инструмент работает со словарным содержимым как с текстом на естественном языке, что резко ограничивает его возможности.

Использование первичной разметки словарной статьи, формализация ее внутренней структуры позволяет различать переводы, примеры использования и комментарии, не снимая лексикографического противоречия.

Сверхзадача компьютерной лексикографии

Задача состоит в том, чтобы единицей описания было отдельное лексическое значение, и технологии анализа могли бы устанавливать соответствие между исходным запросом и теми лексическими значениями, которые релевантны для этого запроса по синтаксическим и семантическим критериям.

В качестве иллюстрирующего примера можно привести практически любой глагол, принадлежащий ядру языка. Например, глагол "развести" может встретиться в таких контекстах:

разводить руками;
разводить спирт водой;
разводить супругов;
разводить мосты;
разводить баранов;
разводить дерущихся;
разводить пилу;
разводить/разбивать сады
(английские эквиваленты: bring; conduct; part, separate; mix; dissolve; divorce; breed; plant, etc...)

Задача создания такого словарного содержания, которое позволило бы сделать единицей анализа отдельное лексическое значение, а не морфологическую лексему требует "синхронизации" словарных описаний и формальных моделей, используемых технологиями анализа.

В пределе это должно быть единое интегральное лексико-синтактико-семантическое описание.

Компьютерный перевод - преобразование с помощью компьютера текста на одном естественном языке в семантически эквивалентный текст на другом естественном языке.

Компьютерный перевод(machine translation) - процесс перевода текста компьютером в автономном режиме (и сам переведенный текст, как результат процесса перевода).

Компьютерный перевод (machine-assisted translation) - перевод текста с использованием компьютерных технологий, которые, наряду с собственно системами машинного перевода, включают электронные словари, накопители памяти, телеконференции, речевой интерфейс и т.д.

Computer-assisted/aided translation tools(CAT, в просторечии - "кошки") - средства автоматизированного перевода.

Electronic dictionary (электронный переводной словарь) - переводной словарь, представленный на электронном носителе информации.

В языке возникают новые слова, термины и выражения, меняется смысл старых слов. Традиционные «бумажные» словари уже не успевают за стремительным темпом современной жизни. На смену им приходят словари электронные.

Функции переводных словарей:

информативная (позволяет получить содержащуюся в словаре информацию);

коммуникативная (предоставляет необходимые слова родного или чужого языка);

нормативная (фиксирует значения и употребления слов способствуя унификации языка как средства общения)

Типы электронных переводных словарей

ü Словарь, представляющий собой электронный документ, воспроизводящий страницы традиционного бумажного словаря. Его функции ограничены, играет вспомогательную роль и неудобен в обращении. (Glossary Translation);

ü Словарь-программа, размещенный на компьютере пользователя. Как правило, электронные словари такого типа - это удобная и легко настраиваемая программная оболочка, работающая со словарными базами данных, имеющая настройки пользовательского интерфейса и позволяющая интеграцию с другими Windows-приложениями: MS Word и т.д.( Lingvo);

ü Сетевые словари (программы перевода которых размещены на удаленных серверах) не требуют наличия соответствующего программного обеспечения на персональном компьютере, но предполагают возможность работы в Интернете. On-line словарь функционально беден. Он позволяет получить двуязычный перевод введенного слова и выражения в любых грамматических формах.( Online Dictionary) ;

ü Словарь на собственном сайте, как форма, которая обращается к серверу. Каждый пользователь Интернета, имеющий свой собственный сайт, может разместить на нем On-line словарь и переводчик на Ваш сайт. Достаточно разместить на своем сайте формы On-line словаря и переводчика. С их помощью посетители сайта смогут переводить слова и целые предложения с русского на английский и обратно. Для того чтобы поставить выбранную форму на свой сайт, необходимо просто скопировать полученный код на удобное для Вас место. Формы позволяют посетителю страницы соединиться с соответствующими серверами и получить перевод введенного текста.( Lingvo Online);

ü Словарь-программа в мобильных устройствах: карманных компьютерах, коммуникаторах и смартфонах. Имеют удобный интерфейс, быстрый перевод нужного слова, большое количество словарных статей при малом потреблении памяти, возможность установки нескольких словарей, возможность получать перевод слов, не выходя из других программ.( Mobile Dictionary);

ü Словарь как специализированное устройство, в котором жестко прописывается программа, осуществляющая словарный перевод и дополнительные функции. Устройства оборудованы сенсорным экраном и могут управляться как с клавиатуры, так и специальным пером. У некоторых моделей имеется электронная записная книжка, которая позволяет вести записи на английском и русском языках и защищает паролем доступ к данным. Встроенный цифровой диктофон позволяет делать записи, предусмотрен обмен данными с персональным компьютером.( Portable Dictionery)

Популярные электронные переводные словари: Lingvo, Context, МультиЛекс, PROMT VER-Dict, LingvoSoft Dictionary

Электронный словарь жестов для глухих

Университет Бостона создал электронный словарь языка жестов для людей с расстройствами речи и слуха.

Принцип действия: человек, использующий язык жестов, располагается перед видеокамерой (Web-камерой компьютера). Движения его рук и мимика анализируются компьютерной программой, которая подбирает аналог из имеющегося словаря и "переводит" жест.

Характеристики Electronic Dictionary (электронный переводной словарь)

1 Количество переводов

2 Наличие и удобство обратного перевода

3 Наличие и удобство перевода на многие языки

4 Количество языковых пар переводов

5 Наличие и удобство перевода на многие языки

6 Показ дополнительной информации (синонимов, помет, примеров употребления и толкований, ударений, грамматических форм)

7 Наличие лингвистического справочника (лингвистические термины, толковый словарь, грамматика по языкам, правила транскрипции и правила чтения в различных языках)

8 Удобный интерфейс (контекстное меню, язык, прозрачность, закрытие, трей);

9 Возможность пополнять переводы информацией пользователя

10 Пользовательские словари (создание, подключение, пополнение, редактирование, публикация...)

11 Удобство ввода текста для перевода (узнавание языка, подсказка в базе данных...

12 Перевод слова во всех морфологических формах

13 Примеры фраз (устойчивых фразеологизмов)

14 Фильтрация словарей (выбор, группировка, слияние)

15 Возможность экспорта из программы информации по переводу

16 Прослушивание фонетической транскрипции слов (голосом диктора или через систему синтеза речи)

17 Интеграция с другими прикладными программами

18 Сетевая поддержка (сообщества...)

19 Настройки (системные, оформления, лексикографические)

20 Коррекция неправильно набранных слов, предложение синонимов

21 История поиска

22 Регулировка объема выдаваемой информации (краткие и полные переводы)

23 Пословный перевод фраз

24 Полнотекстовый поиск слов или словосочетаний по всему тексту карточек

25 Поиск перевода слова во всех языках

26 Добавление переводов в учебный словарь

27 Наличие разговорников

28 Скорость работы (перевода, поиска)

29 Поддержка различных устройств и операционных систем (в т.ч. мобильных)

30 Системные требования

31 Удобная и полная справочная система

32 Доступность и распространенность

Рortable Dictionery - электронное переводное устройство, жестко запрограммированное на словарный или текстовый перевод.

Sharp Brain PW-AC900

25.06.2009 Японская компания Sharp выпустила компактный электронный словарь Brain PW-AC900 в формфакторе миниатюрного ноутбука. Brain PW-AC900 имеет:

· тачпад для ввода рукописного текста,

· цветной 5-дюймовый дисплеем с разрешением 640х480 точек,

· 100 Мб встроенной памяти, предназначенной для хранения пользовательских данных,

· QWERTY-клавиатуру,

встроенные динамики и разъем для подключения наушников.

English - Russian Partner

English - Russian Partner – электронный переводчик с технологией распознавания речи (переводит произнесенные на русском языке слова и фразы на английский, сравнивает произношение с эталонным и выставляет оценку).

English - Russian Partner:

· работа с электронной почтой,

· англо-русский / русско-английский словарь объемом более 1 000 000 слов,

· толковый словарь английского языка,

· возможность расширения основного англо-русского словаря,

· разговорник из 1000 фраз на 7 языках: английском, русском, немецком, французском, испанском, итальянском и португальском.

· сенсорный экран, управление с клавиатуры и специальным пером,

· электронная записная книжка,

защища паролем доступа к данным.

ER-96ir

ER-96ir – электронный словарь для учеников младших классов со встроенной записной книжки с расписанием.

ER-96ir имеетинфракрасный приемопередатчик, позволяющий с одного словаря передавать сообщения на другие, как для игры, так и для учебы (полученную информацию перевести и отправить обратно).

ER-96irсодержит англо-русский словарь на 35 000 слов, словари американских идиом и неправильных глаголов.

Language Teacher DR-600T

Language Teacher DR-600T - портативный электронный немецко-русский словарь:

· легкий, портативный, надежный, простой в обращении,

· современная лингвистическая база,

· учебник немецкой грамматики,

· графический экран и широкая клавиатура,

· качественный синтез немецкой и русской речи,

· система обмена информацией с персональным компьютером,

электронная записная книжка.

Partner EGR430T

Partner EGR430T - интегрированная обучающая система от ЭКТАКО:

· англо/немецко/русский,

· полноразмерный графический экран,

· качественный синтез английской, немецкой и русской речи,

· 650 000 слов, возможность добавления новых слов и выражений,

· функция обратного перевода,

· орфографический корректор,

· грамматика, идиомы, неправильные глаголы, часто употребляемые фразы,

размеры 117x85x15 мм, вес 110 грамм.

RD-CM1

RD-CM1 комбинированное устройство от Sharp, представляющее собой электронный словарь и портативный медиаплеер одновременно.
RD-CM1 имеет 4.1-дюймовый сенсорный дисплей, слот для карт памяти SDHC (до 8 Гб), систему преобразования текста в речь и 130 различных словарей.
RD-CM1 с функциями мультимедийного проигрывателя, поддерживает форматы Xvid, Mpeg4, MP3, AAC, JPG, BMP, GIF, PNG, а также позволяет читать электронные книги.

Cканирующий переводчик Quicktionary

Quicktionary - сканирующий переводчик для школьников, студентов, преподавателей, деловых людей и путешественников:

· автоматически выводит на экран перевод сканированных слов,

· словарный запас более 280.000 слов и выражений,

· способы ввода: сканирование печатного текста, или с помощью кнопок,

· максимальная длина сканируемого выражения - 32 символа,

· память на сканируемые слова: последние 75 слов,

· экран 122х32 пикселей (3 строки по 15 символов),

· разрешение сканера 300 dpi,

· размер сканируемых букв: от 8 до 14 пунктов,

· форма сканируемых букв: обычные шрифты, включая курсив и подчеркнутые буквы,

питание: 3 батарейки ААА (в комплекте).

Cканирующий переводчик ScanPromt

Компактный сканер + OCR + переводчик.

В качестве переводчика - пакет Promt с поддержкой языков:

· английский,

· французский,

· испанский,

· немецкий,

· русский,

· португальский.

Скорость сканирования и перевода - до 1000 символов /сек.

Assistant AT-2093

Assistant AT-2093 - универсальный карманный переводчик с корпусом в виде ккнижного тома.
Assistant AT-2093 ориентирован на широкий круг лиц, углублённо изучающих английский, русский, немецкий, французский язык.
Assistant AT-2093 имеет встроенные полные аналоги бумажных словарей известных авторов.

На все словари получены лицензии, дающие право использования материалов в электронном виде.

Общий словарный запас Assistant АТ-2093 составляет 690 тысяч слов, 114 тысяч словарных статей, 9200 разговорных фраз (по 2300 фраз из каждого языка).

Предусмотрены: разговорник, органайзер, инженерный калькулятор, пересчёт валют, мер и весов, шесть логических игр и часы с будильником. 150 $.

Очки-переводчик от NEC

25.10.2009 Tele-Scouter - очки-переводчик от NEC в виде очков, которое преобразует устную речь на иностранном языке в текст и проецирует его перевод прямо на сетчатку глаза.

Tele-Scouter включает проектор и микрофон, присоединенные к очкам, а также мини-компьютер, который можно носить на запястье.

Tele-Scouter можно использовать часами, поскольку от них не устают глаза. Собеседники могут вести разговор на двух разных языках, глядя друг на друга и не утруждая себя чтением перевода.

Tele-Scouter первоначально предполагается использовать в качестве подспорья для персонала магазинов.

Вопрос 18: Дистанционное обучение(определение, формы, история, достоинства и недостатки дистанционного обучения, викиверситет, виртуальные школы, eLearning, дистанционное обучение в Беларуси).

Дистанцио́нное обуче́ние (ДО) — совокупность технологий, обеспечивающих доставку обучаемым основного объема изучаемого материала, интерактивное взаимодействие обучаемых и преподавателей в процессе обучения, предоставление обучаемым возможности самостоятельной работы по освоению изучаемого материала, а также в процессе обучения.

Современное дистанционное обучение строится на использовании следующих основных элементов:

  • среды передачи информации (почта, телевидение, радио, информационные коммуникационные сети),
  • методов, зависимых от технической среды обмена информацией.

Поделиться:

Дата добавления: 2015-04-21; просмотров: 145; Мы поможем в написании вашей работы!; Нарушение авторских прав





lektsii.com - Лекции.Ком - 2014-2024 год. (0.006 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав
Главная страница Случайная страница Контакты