КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Содержательный (вероятностный) подход при разной вероятности возникновения события. ⇐ ПредыдущаяСтр 3 из 3 Бывают случаи, когда поступает сообщение о не равновероятных событиях. Тогда, если N – это общее число возможных исходов какого-то процесса (вытаскивание шара, получение оценки, ловля рыбы), и из них интересующее нас событие (вытаскивание белого шара, получение пятерки, попадание щуки) может произойти К раз, то вероятность этого события равна p = K/N. Вероятность выражается в долях единицы. В частном случае, вероятность достоверного события равна 1 (из 50 белых шаров вытащен белый шар); вероятность невозможного события равна нулю (из 50 белых шаров вытащен черный шар). Качественную связь между вероятностью события и количеством информации в сообщении об этом событии можно выразить так: чем меньше вероятность некоторого события, тем больше информации содержит сообщение об этом событии. Количественная зависимость между вероятностью события (р) и количеством информации в сообщении о нем (i) выражается формулой: i=log2 (1/p) Пример 3.1. В коробке имеется 50 шаров. Из них 40 белых и 10 черных. Очевидно, вероятность того, что при вытаскивании «не глядя» попадется белый шар больше, чем вероятность попадания черного. Затем определим количество информации в сообщении о попадании белого шара и черного шара. Решение. Обозначим рч – вероятность попадания при вытаскивании черного шара, рб – вероятность попадания белого шара. Тогда: рч = 10/50 = 0,2; р6 = 40/50 = 0,8. Отсюда видно, что вероятность попадания белого шара в 4 раз больше, чем черного. iб = log 2 (l/0,8) = log 2 (l,25) = 0,321928; iч = log 2 (l/0,2) = log 2 5 = 2,321928.
Вероятностный метод применим и для алфавитного подхода к измерению информации, заключенной в тексте. Известно, что разные символы (буквы алфавита, знаки препинания и др.) встречаются в тексте с разной частотой и, следовательно, имеют разную вероятность. Значит, измерять информационный вес каждого символа в тексте так, как это делалось раньше (в предположении равновероятности), нельзя. Пример 3.2. В алфавите племени МУМУ всего 4 буквы (А, У, М, К), один знак препинания (точка) и для разделения слов используется пробел. Подсчитали, что в популярном романе «Мумука» содержится всего 10000 знаков, из них: букв А – 4000, букв У – 1000, букв М – 2000, букв К – 1500, точек – 500, пробелов – 1000. Какой объем информации содержит книга? Решение.Поскольку объем книги достаточно большой, то можно допустить, что вычисленная по ней частота встречаемости в тексте каждого из символов алфавита характерна для любого текста языке МУМУ. Подсчитаем частоту встречаемости каждого символа во всем тексте книги (т.е. вероятность) и информационные веса символов: буква А: 4000/10000 = 0,4; iA=log 2 (1/0,4) = 1,321928; буква У: 1000/10000 = 0,1; iУ=log 2 (1/0,1) = 3,1928; буква М: 2000/10000 = 0,2; iМ=log 2 (1/0,2) = 2,321928; буква К: 1500/10000 = 0,15; iК=log 2 (1/0,15) = 2,736966; точка: 500/10000 = 0,05; iточка=log 2 (1/0,05) = 4,321928; пробел: 1000/10000 = 0,1; iпробел=log 2 (1/0,1) = 3,321928. Общий объем информации в книге вычислим как суму произведений информационного веса каждого символа на число повторений этого символа в книге: I = iА × nА + iУ × nУ + iМ × nМ + iК × nК + iточка × nточка + iпробел × nпробел = =1,321928×4000+3,1928×1000+2,321928×2000+2,736966×1500+4,321928×500+3,321928×100=22841,84 бита. Примечание:
|