Информационная оценка лингва-математической модели сложной иерархической системы - Методы информационного анализа материальных процессов

Одной из важнейших работ, в которой подробно анализируются энтропийно-информационные характеристики различного вида систем, является монография Е. А. Седова "Эволюция и информация".

В центре обсуждения проблемы Е. А.Седов ставит вопрос о первичности стохастичности или причинности. На примере достижения термодинамического равновесия он показывает, что требование изоляции системы по существу эквивалентно устранению каких бы то ни было причин, отклоняющих систему от равновесия, при котором максимальная хаотичность (энтропия) достигается самопроизвольно и необратимо. Причина - это некоторое насилие над системой, и хотя оно также естественно, но вызвано воздействием более упорядоченной (детерминированной) системы над менее упорядоченной.

"До сих пор при рассмотрении проблем категорий случайности и причинности делались попытки найти Порождающие случайность причины И не учитывалась возможность возникновения случайностей, обусловленных Отсутствием устраняющих их причин. Этот факт следует расценивать как определенную дань сложившимся в науке традициям, проистекающим из априорного убеждения, что мир жестоко детерминирован, а всякое нарушение детерминированных связей возникает только в силу действия случайных причин. На самом же деле вопрос "Почему мир не чисто случаен? - более правомерен, чем неоднократно обсуждавшийся вопрос о том, почему возникает объективная случайность, отвергающая жестко детерминированный лапласовский мир".

Отсюда вытекает новая познавательная функция статистических методов: они указывают на существование той или иной причины отсутствия полной стохастичности, хотя в большинстве случаев и не вскрывают этой причины. С этой точки зрения можно говорить о том, что лежащее в основе подавляющего большинства природных систем вероятностное поведение микрочастиц обусловлено отсутствием каких-либо причин, приводящих к жестокой детерминации данного вида движения. Конечно, какая-то детерминация здесь все-таки есть, поскольку акт столкновения частиц управляется строгими законами механики, благодаря чему и реализуется в той или иной степени неравномерное распределение по скоростям и энергиям (за исключением нуля и бесконечно высокой температуры, когда столкновения становятся невозможными).

Но речь здесь идет о первичности, первозданности и о принципиальной неустранимости стохастичности в каких бы то ни было качественных процессах и явлениях. Вследствие этого и мышление и поведение человека всегда в той или иной степени непредсказуемо, неожиданно.

Наконец, еще одна грань взаимоотношении детерминации и стохастичности, но уже при самоорганизации, т. е. в иерархической системе, качественно рассмотрена Е. А.Седовым с учетом всех предыдущих особенностей и представлена на рисуке 4 в виде иерархической лестницы.

Саморазвитие идет скачком по уровням: от нулевого к более высоким - при постоянном стремлении к детерминации в пределах каждого уровня (пункт - полная стохастичность, пункт - полная детерминация). Скачок происходит в точках равной степени детерминации предыдущего и последующего уровней, так что общая степень детерминации при последующем развитии непременно возрастает, но при этом абсолютная величина остающегося пути детерминации при переходе с уровня на уровень увеличивается, за счет чего система не только никогда не утрачивает резерв адаптации, т. е. стохастичности, но и каждый раз расширяет этот резерв.

иерархическая лестница по седову

Рисунок 4 Иерархическая лестница по Седову

При всех достоинствах наглядности эта схема не лишена некоторых неясностей, к каковым в первую очередь относится парадоксальная возможность детерминации на нулевом уровне. Наверное, было бы точнее обозначить этот уровень непосредственно в вершине обратного конуса, и тогда он приобрел бы фундаментальное значение сингулярного состояния. Может быть, было бы необязательным совершать скачок по образующей конуса в точку равной детерминации, поскольку диалектика развития допускает возврат чуть ли не в противоположенное состояние (отрицает) с последующим наверстыванием упущенного в новых условиях. То есть имеется в виду переход с некоторой оптимальной точки предыдущего уровня в пункт или в район этого пункта на последующем уровне.

Правда, при этом общая степень детерминации системы уменьшается, но, по-видимому, переход на новый уровень и не должен сразу попадать в зону совершенства, на что указывает продолжительный естественный и социальный отбор самоорганизующих систем.

Последнее свидетельствует о недостаточной обоснованности краткости пути, который проходит система в пределах каждого уровня (см. рис. 4).

Возникает вопрос: чем же должна завершиться иерархия? Или она бесконечна?

Очевидно, ответ на эти вопросы возможен при другом уровне формализации всех рассматриваемых сторон стохастичности и детерминации, но и уже совершенный Е. А.Седовым прорыв в этом направлении означает, выражаясь энтропийно-информационным языком, переход с нулевого уровня формализации категорий развития, по крайней мере, на первый. В пределах этого уровня трактовка основных законов и принципов диалектики, по Е. А.Седову, сводится к следующему.

Принцип развития выражается в ускоренном накоплении информации согласно формуле, приведенной в работе [1]

, , (2.87)

А также в общей структуре иерархической лестницы.

В математическом отношении принцип увеличения разнообразия состоит в том, что с переходом на более высокие структурные уровни число "букв", составляющих полный "алфавит" (т. е. число образующих данный структурный уровень элементов - "кирпичиков", имеющих различные признаки), увеличивается прогрессивно, по закону

, (2.88)

Где - порядковый номер рассматриваемого уровня, начиная с нулевого;

    - число "букв" алфавита го уровня; - число элементов ("букв"), составляющих одно "слово"; - число элементов, дающих полный алфавит уровня, принятого за начало отсчета ().

В формуле (2.88) предполагается, что длина "слова" всюду одинакова. На самом деле это допущение соблюдается лишь приблизительно и более строго тот же принцип выразится как

(2.89)

Если для иллюстрации взять случай Хартли, т. е. равновероятное использование всех элементов уровня, то получим емкость информации уровня (в расчете на один элемент)

. (2.90)

Следовательно, с переходом от уровня к уровню емкость информации, приходящаяся на одну букву алфавита, каждый раз возрастает в раз (или в раз в более общем случае). Именно в этом смысле следует понимать утверждение многих авторов о том, что информация является мерой разнообразия. Отсюда и неограниченные возможности даже простейшего, альтернативного выбора, которому соотвествует двоичный код () и к которому можно свести любые коды. Так, при длине слова, равной шести элементам (), на четвертом уровне организации число элементов округленно составит, а полная информационная емкость уровня бит. Поэтому ввиду громадного разнообразия систем на высоких уровнях организации (пусть только потенциального разнообразия, нуждающегося в материальном воплощении) трудно найти распределение вероятностей по элементам этих уровней и приходится ограничиваться междууровневыми корреляциями. Но это уже частный, хотя и очень важный вопрос, требующий отдельного рассмотрения.

Из других общих свойств и характеристик информационно-энтропийных отношений Е. А.Седов выделяет введенный им коэффициент стохастичности. Поскольку информация есть разность между максимально возможной (), определяемой по формуле Хартли, и реализованной для данной системы в рассматриваемый момент энтропии ():

, (2.91)

То на этом основании можно найти те или иные относительные (безразмерные) критерии для сравнения различных систем.

(2.92)

Который представляет относительную долю реализованной информации и может быть рассчитан через реализованную и максимальную энтропию. Смысл избыточной информации связан с познанием системы, при котором извлекаемая информация всегда меньше объективно содержащейся в виде детерминированных связей, и соответсвует понятию абсолютной истины. Таким образом, может быть, правильнее называть коэффициентом абсолютности или реализованности информации.

Данная характеристика является информационной, и поэтому, как полагает Е. А.Седов, она не раскрывает всей полноты информационно-энтропийных свойств системы. Ввиду этого и предлагается коэффициент

Стохастичности, который представляет собой отношение реализованной энтропии к реализованной информации:

. (2.93)

Коэффициент стохастичности может изменяться от нуля до бесконечности и, как показазано в работе Е. А.Седова, способен более детально отражать адаптивно-консервативные свойства системы. В частности, указывается, что он является объектом оптимизации. Правда, этот важнейший аспект остается не до конца развитым, хотя можно предположить, что под этим подразумевается экстремальность или стремление к пределу при изменении каких-то параметров системы (может быть, времени или уровня организации) или же, что еще важно, поднимается проблема соразмерности, гармонии стохастической (адаптивной) и детерминированной (консервативной) составляющих.

В таблице 4 приведены данные расчета предельных информационных характеристик иерархической системы для конкретного случая, что соответствует структуре русских текстов.

При (на уровне букв) детерминация отсутствует и вся информационная емкость системы относится к стохастичной части. Соответственно этому При (на уровне слов) возникшая детерминация языка достигает суммарного предела 42,86 %, чему отвечает На уровне предложений () детерминация системы приближается к 76,74% (, ). Здесь уместно подчеркнуть отличие системных данных от уровневых, которые могут быть подсчитаны подстановкой в формулы для не интегральных, а число уровневых значений и

Таблица 4

Предельные характеристики иерархической системы при

15

15

35

15

20

0,4286

0,5714

1,3333

2

180

150

30

215

165

50

0,7674

0,2326

0,3030

3

1080

1035

45

1295

1200

95

0,9266

0,0734

0,0792

4

6480

6426

54

7775

7626

149

0,9809

0,0192

0,0195

5

38880

38826

54

46655

46452

203

0,9956

0,0044

0,0044

6

233278

233232

46,3

279933

279684

249,3

0,9981

7

1399668

139633

34,7

1679601

1679317

284,0

0,9998

8

8398004

839780

23,1

10077605

100771297

307,1

1,0000

9

50387955

50387939

13,9

60465560

60465236

321,0

1,0000

При этом интегральные величины детерминации меньше дифференцированных по уровням за счет включения в расчет информации предыдущих уровней, отличающихся большей стохастичностью. Вклад какого-либо уровня в системную величину может быть рассчитан по абсолютным долям (или процентам) как отношение:

или к

А по относительным:

или

Например, абсолютный вклад детерминированной составляющей второго уровня в суммарную детерминацию системы, достигшей, составит 69,77% (против суммарного значения 76,74%), относительный - 90,91%. Этому соответсвует детерминация второго уровня 83,33%.

Заметим, что информационные характеристики языка, способного оперировать предложениями (), приближаются к статистическим нормам русского языка. Эти нормы рассчитывались с помощью формулы Шеннона

(2.94)

По частоте появления различных букв во множестве различных текстов, а также по корреляции букв со слогами, словами, фразами.

Найдено, что в расчете на одну букву неопределенная информация составляет около 1 бита при максимально возможной неопределенности 5 бит. Отсюда вычислены фактические значения и.

Сопоставляя с этим и из данных таблицы можно сделать вывод о близости обсуждаемых величин уже на втором уровне организации языка, если достигается предельная допустимая детерминация слов и предложений.

На уровне фраз степень детерминации как и коэффициент избыточности системы, составляет при

Значения и являются промежуточными между теоретическими для второго и третьего уровней, что свидетельствует не только о неиспользованных резервах детерминации, но и об уменьшении влияния структуры фраз (а также элементов более высоких уровней) на вероятность появления той или иной буквы вслед за предыдущей.

Следует отметить, что детерминацию системы нельзя сводить к детерминации элементов какого-либо уровня, за исключением самых верхних, как это можно заметить по данным таблицы 4.

Из нее же можно найти вклад детерминации каждого уровня (а значит, и их собственных элементов) в общую детерминацию системы когда она достигает максимума стохастической информации:

Уровни

Как видим, детерминация букв в словах имеет пренебрежимо малое значение для организации текста на высоком уровне. Искать корреляцию между и по-видимому, бесперспективно.

Похожие статьи




Информационная оценка лингва-математической модели сложной иерархической системы - Методы информационного анализа материальных процессов

Предыдущая | Следующая