1999
Декабрь
Октябрь
Ноябрь
2000
|
21 декабря 1999 г.
Стремление превратить исследование литературы и искусства в точную науку одно из главных мечтаний в гуманитарном знании завершающегося столетия. И надо сказать, что в отдельных случаях (по крайней мере, в стиховедении) эта мечта сбылась. Характерно, что при этом обошлось (за исключением эпизодически мелькнувшего в теории стихотворного ритма академика Колмогорова) без участия математиков: филологи сами научились разговаривать языком фактов и подсчетов, а не впечатлений и догадок. Однако к концу века пришельцы из области точных наук все чаще совершают набеги на территорию филологии, и оценить последствия не так просто. Поэтому не возьмусь выразить какое-либо отношение к тому, о чем речь, а просто в порядке информации.
В очередном издании трудов академика Фоменко, посвященных всеобщей ревизии мировой истории, обнаружилось одно любопытное приложение: Фоменко В.П., Фоменко Т.Г. Авторский инвариант русских литературных текстов (в кн.: Фоменко А.Т. Методы статистического анализа исторических текстов. Приложения к хронологии. М.: Крафт-Леан, 1999. т.2, с.743-778). Из этой работы, которую родители академика выполнили в 1974-81 гг. (безо всяких компьютеров, вручную!), явствует, помимо феноменального семейного сходства способов мышления, следующее. Просчитав тексты двух с половиной десятков авторов от Княжнина до Леонида Леонова по десятку напрашивающихся параметров (длина предложений, средняя длина слов и т.п.), супруги Фоменко обнаружили, что ни один из этих параметров не является для автора постоянным (и, стало быть, не может служить для его идентификации). За единственным исключением: средняя частота употребления служебных слов для творчества данного автора является константой. Бывают, правда, авторы, у которых значения этой константы весьма близки, но уж если эти значения различны, то и авторы у текстов разные (принцип действует, разумеется, на больших объемах текста: несколько выборок по 16.000 слов с определенным шагом). В качестве служебных слов принимались 19 предлогов (цифра моя: Фоменко насчитали больше, поскольку отдельно учитывали алломорфы), 14 союзов и 17 частиц. В качестве теста, разумеется, был проверен "Тихий Дон" и показано, что автор второй половины романа (с середины 6-й части) совпадает с Шолоховым (по другим его текстам), тогда как автор первой половины от него отличается (статистически достаточного количества текстов Крюкова в распоряжении Фоменко не было).
Аборигенам Интернета это исследование, вероятно, напомнит так называемый "Штампомер Делицына" нехитрое приспособление, отслеживающее повторяющиеся последовательности слов (предполагается, что частотность таких последовательностей индивидуальна для автора, при этом наиболее частотными оказываются, разумеется, последовательности типа "потому что", "и не" и "на самом деле"). На мой, сугубо гуманитарный вкус, господа Фоменко куда убедительней: во-первых, потому, что они свой список служебных слов задают изначально, во-вторых, потому, что делицынская склонность одного автора к "и не", а другого к "потому что" легко коррелирует с логическими и психологическими особенностями субъекта наррации (склонного, соответственно, к противительно-уступительным или причинным конструкциям) и потому может быть построена и съимитирована, тогда как (и об этом у самих Фоменко вскользь говорится) частотность служебных слов вообще характеристика настолько общая и абстрактная, что ее не то что симулировать, но и осознать-то в процессе письма невозможно.
Александр Привалов
|