КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Квантитативное изучение фонетикиСтр 1 из 2Следующая ⇒ При квантитативном исследовании лексико-фонетических групп ставится задача выявить особенности количественного распределения слов по их фонетическому строению (по началу и концу слова, по фоно- и графемо-тактике, по моделям дистрибуции звуков, фонем и графем, по длине слова) с учетом взаимосвязи с другими подуровнями лексики. Знание особенностей строения слова с точки зрения его начала и конца важно не только для изучения типологии языков, но и для решения вопросов автоматической обработки текстов. Буквенный состав концов слов, коррелирующий с грамматическими признаками, помогает определению классов слов и, в конечном счете, выведению формальной модели языка. Слово может иметь разные типы звуковой структуры, состоящей из соотношения согласных и гласных. В типологических исследованиях часто обращаются к канонической форме, чтобы можно было на более общей основе проводить сопоставительный анализ структуры слова разных языков. C – CONSANANT, V – VOWEL. Структуры слогов, слева направо – от самых часто распространенных к наиболее нераспространенным.
В тексте распределение частот таких структур может сильно различаться со словарным распределением. В русском языке 80% составляют слоги со структурой: CV, CVC, VC, CVCC. Интерес может представлять также квантитативное определение степени симметричности системы фонетических структур слов. Система симметрична, если зеркальная структура встречается одинаково часто (VC-CV, VCC-CCV, CCVC-CVCC, CCVCC – автосимметричная структура). Симметричность увеличивается, если сами структуры сами собой автосимметричны. Такие структуры покрывают в немецком языке около 40% всего словаря, в русском – около 45%. Важным количественным показателем структуры текста и его словаря является длина слова и распределение по длине слов в тексте и в словаре. Длина представляет собой систему образующий фактор, определяющий условие разбиения лексики на группы слов разной формационной структуры. Также распределение слов по длине указывает на статистическую взаимосвязь между словами разной длины в процессе порождения речи. Опыт показывает, что средняя длина словоформы и распределение по длине в тексте и словаре существенно различаются. Для английского языка средняя длина слова в тексте составляет 4,74 буквы; в словаре – 8,13. Короткие словоформы (до 4 букв) покрывают 35% английского текста. В словаре – всего 4% таких слов. Средняя длина словоформы варьируется в зависимости от стиля текста. В художественной прозе средняя длина – 4,8 буквы; в научно-технической литературе – 7,1 буквы. Опытным путем установлено, что распределение словоформ по длине в словаре хорошо выражается через лого-нормальное распределение. Примеры лого-нормального распределения.
Это свойство длины слова отвечает принципам оптимального кодирования информации и отражает стремление к ясному и безошибочному различению слов. Лого-нормальное распределение означает также, что выбор слова определенной длины при порождении речи зависит в некоторой степени от длины предшествующего слова. Благодаря этому в тексте чередуются длинные, короткие и средние по длине слова. Измерение длины слова в слогах имеет значение при выявлении так называемой «глубины слова». Эти данные используются в педагогике, стилистике, психолингвистике, в типологических исследованиях языков. Особенно ярко проявляется дифференциация языков при сравнении словоформ по длине в тексте. Например, односложные словоформы в английском языке покрываются 66,8% английского текста; в русском – 33%; в турецком – 18,8%.
Существует закономерная связь между числом слогов и числом звуков в слове. С удлинение словоформы отношение числа звуков к числу слогов уменьшается, т.е. чем длиннее слово, тем короче слоги в нем. Закономерность вывел лингвист Мендцерат. Тот факт, что короткие слова более частотны, чем длинные, свидетельствует о действии принципа экономии в процессе коммуникации. Французский ученый П. Гиро сформулировал закономерность, согласно которой для каждого языка можно определить константу «С», указывающую на связь между длиной слова «Х» и его рангом в частотном списке «i». Закономерность: С = lg2i/X. Зависимость между длиной слова и его частотой является взаимной, однако можно утверждать, что решающую роль играет частота употребления, т.е. если частотность слова возрастает, то слово часто подвергается редукции. Пример, ретроспективный – в стиле ретро; кинотеатр – кино; университет – универ.
|