Иосиф Ольшаницкий
«6 букв…» и закон Зипфа
Этот закон, конечно же, имеет отношение и к моей теме.
Составитель и переводчик Рафаил НУДЕЛЬМАН.
Израильская газета ''Окна'' в приложении к газете ''ВЕСТИ'', от 29 сентября 2005 года. Рубрика: 4-е измерение.
Цитирую эту публикацию полностью. Она мне особо интересна в связи с моей серией «6 букв вместо 34-х», где я предлагаю, используя возможности персонального компьютера, графически существенно упростить пока только русское письмо и его чтение заменой в нём каждой буквы русского алфавита лишь одной или иногда двумя точками в строках, состоящих из двух рядов этих точек.
«ЯЗЫК. Происхождение языка отделено от нас завесой веков, и заглянуть за неё науке, видимо, никогда не удастся. Поэтому споры о том, как возник язык, будут, надо думать, продолжаться вечно. Острые умы будут придумывать всё новые и новые гипотезы, а популяризаторы науки – всё новые и новые способы доносить их до широких интересующихся читательских масс.
На нынешний день таких гипотез предложено уже несколько. Одни говорят, что язык произошёл из жестов, другие, – что из призывных и остерегающих возгласов, третьи, – что из примитивных ритмических напевов, четвёртые, – что из щёлканья, и так далее и так далее. Вы и сами можете на досуге поупражняться в таких догадках, разве что вам не так легко будет подкрепить их фактическим материалом, как то в ходу у учёных.
Обо всём этом говорено уже не раз, в том числе и на этих страницах, и потому сегодня мы не будем множить сущности без надобности, а, взяв быка за хвост и смело глянув ему в глаза, спросим: как произошло становление языка? Одну из гипотез на сей счёт предложили недавно барселонские учёные Канчо и Соле. Она резко порывает с тем, что обычно думают по данному вопросу. Обычно по данному вопросу думают, что становление языка происходило постепенно. А Канчо и Соле думают иначе. Вот ход их размышлений.
Самый точный, однозначный язык, говорят барселонские авторы, должен был бы иметь по одному слову на каждое понятие, каждую вещь или каждое действие. Это был бы идеальный язык, но число слов в нём было бы огромно. Подумайте сами, – сколько оттенков есть у каждого цвета, сколько нюансов у каждого действия, сколькими тончайшими признаками отличается одна вещь от другой такой же?! Идеальным такой язык был бы разве что для слушателя, но говорящему пришлось бы прилагать колоссальные усилия, каждый раз выискивая единственное, точное слово из миллионов. Для говорящего выгоднее был бы язык противоположного типа, – состоящий из немногих слов, даже отдельных простых звуков, каждый из которых мог бы одновременно выполнять много разных функций. А в идеале он бы, наверно, предпочёл бы говорить на языке, состоящем из одного-единственного звука, который означал бы всё, что потребуется впредь. (Примерно так говорят наши младенцы, – кряхтят или вопят, выражая этим всю гамму своих эмоций и пожеланий. Иными словами, соображения экономии сил толкают говорящего и слушателя в противоположные стороны: одному подай язык из минимального количества разных слов, другому – из максимального. А всё потому, что говорящий знает, что он хочет сообщить, его задача – выразить это словами, и его интерес – как это сделать, затратив как можно меньше усилий. А задача слушателя – понять сказанное, и его интересует, как это сделать, тоже приложив как можно меньше усилий. Интересы у каждого, как видим, разные, но принцип, из которого они исходят, - одинаковый, в науке он издавна называется принципом наименьшего действия.
То же самое можно выразить и иначе: при пользовании языком сталкиваются силы, толкающие к однообразию, и силы, толкающие к многообразию. Легко понять, что язык, формируясь под давлением этих разнонаправленных сил, обретает в результате признаки компромисса, некой равнодействующей. Наши барселонцы придумали, как выразить эти конфликтные предпочтения говорящего и слушающего на языке математики – так, чтобы пользование языком (усилия, необходимые для языкового общения) было максимально выгодным (и минимально невыгодным) обеим сторонам. И эта математика показала, что при постепенном переходе от одной крайности к другой, т. е. от языка, состоящего из одного слова, к языку, состоящему из мириад слов, имеет место любопытное явление, – при каком-то определённом количестве слов в языке и определённых частотах появления тех или иных слов затраты на общение резко уменьшаются. Человеческие языки имеют как раз такие частоты для различных слов, которые соответствуют этому пику взаимовыгодности. По обе стороны от этого пика свойства языка таковы, что кому-то невыгодно им пользоваться. А поскольку каждому общающемуся приходится быть то слушателем, то говорящим, то невыгодно становится всем. И такой язык попросту не возникает. «Языки, промежуточные между сигнальными жестами животных и современными человеческими языками, попросту не могли существовать» – к такому радикальному выводу приходят барселонские авторы. Иными словами, язык формировался не постепенно, не путём медленного накопления всё новых слов, а каким-то иным, более похожим на взрыв, путём. Каким в точности – на этот вопрос Канчо и Соле не отвечают. Тем более не можем ответить и мы. То есть мы, конечно, можем напомнить, что дети, бывает, не говорят лет до 3-4, чем страшно пугают родителей, а потом вдруг открывают рот, и оказывается, что он у них полон слов, правильных и разных. Но дети растут в уже существующей языковой среде, а вот представить себе в их роли наших древних предков как-то затруднительно.
Однако вот что любопытно (и отчасти подтверждает, что в гипотезе Канчо-Сале есть рациональное зерно) – в этом своём математическом анализе свойств воображаемого языка испанские исследователи наткнулись на вполне реальное свойство языков реальных, современных. Как мы уже мельком отметили выше, то (самое взаимовыгодное) распределение частоты употребления разных слов, которое они нашли в результате математических расчётов, действительно характерно для многих существующих человеческих языков. В лингвистике оно называется степенным законом, или ещё законом Зипфа. Мало кто, кроме узких специалистов, знает об этом законе, наверняка ещё меньше – о его авторе, поэтому тут будет уместно сделать небольшое отступление и сказать несколько слов. Тем более что это любопытная история сама по себе.
Джорж Кингсли Зипф прожил короткую жизнь – с 1902 по 1950 год. Он был лингвистом и филологом и 20 лет преподавал немецкий язык в Гарвардском университете, параллельно увлекаясь китайским. Как пишет о нём знаменитый математик Бенуа Мандельброт (о котором ниже), Зипф называл себя специалистом по статистической социальной экологии. Он искал общие законы социологии, прилагая физические идеи и статистические методы к социальным явлениям. Он был убеждён, что все социальные явления определяются двумя противоборствующими силами – выше мы назвали их силой, толкающей к однообразию, и силой, толкающей к многообразию, и это как раз были термины Зипфа, - а результат такого противоборства диктуется принципом наименьшего действия. Эти свои идеи он изложил в книге, которую так и назвал: «Человеческое поведение и принцип наименьшего действия» – и которую издал незадолго до смерти, кажется, на собственные деньги.
Миндельброт так пишет об этой книге: «То было одно из тех сочинений, в которых проблески гениальности, вспыхивающие в самых разных направлениях, почти заслоняются кучей совершенно взболмошенных и экстравагантных идей. С одной стороны, автор обсуждает форму половых органов с точки зрения экономии затрат и оправдывает включение (аншлюс) Австрии в нацистскую Германию тем, что улучшает приложимость некой математической формулы. С другой стороны, он наполняет страницы графиками и таблицами, которые неутомимо бьют в одну точку, доказывая, что социальная статистика лучше всего объясняется одними и теми же степенными законами. Физики и астрономы легко могут узнать в этих формулах Зипфа некоторые хорошо известные им законы своих наук. Поэтому им трудно будет понять, чем было продиктовано то яростное сопротивление, с которым было встречено применение Зипфом тех же законов к наукам социальным.
А вот как лауреат Нобелевской премии физик Гелл-Манн объясняет простейший закон Зипфа: “Положим, ма откроем статистический справочник и найдём там список крупнейших городов США, расположенных по порядку убывания населения, причём каждому городу будет приписан его ранг: первый – для самого большого, второй – для следующего и так далее. Существует ли какой-нибудь общий закон, показывающий, как убывает население города по мере увеличения его ранга? Грубо говоря, да. С достаточной точностью население города обратно пропорционально его рангу: если население первого принять за единицу, то население второго – 1/2, третьего – 1/3 и так далее. Глянем теперь на список фирм, расположенных в порядке убывания их оборота. Существует ли здесь какой-либо приблизительный закон, связывающий объём оборота с рангом фирмы? Да, и это тот же закон, что для населения: оборот фирмы обратно пропорционален его рангу. А как насчёт экспорта из данной страны в порядке его убывания? Оказывается, и тут ситуация хорошо описывается тем же законом. Тогда отложим в сторону статистический справочник и возьмём в руки руководство по кодам, в котором имеется список самых распространённых английских слов в порядке убывания частоты их встречаемости в произвольном английском тексте. Мы опять увидим тот же закон обратной пропорциональности – он так же хорошо работает в языке, причём не только в английском».
Это последнее применение степенного закона – к языку – как раз и имеют чаще всего в виду, когда говорят о законе Зипфа. На графике он изображается известной школьной кривой – гиперболой. Эта кривая отражает тот общепонятный факт, что некоторые немногие английские слова (в первую очередь – THE, OF, TU, A, AND, IN, THAT, FOR, WAS, WITH, HIS, IS) встречаются очень часто (левая часть графика), подавляющее большинство слов встречается со средней частотой (средняя часть графика) и есть небольшое количество слов (очень длинных, – например, эксгибиционизм), которые встречаются очень редко. Что гораздо менее очевидно – так это то, что если расположить их по частоте встречаемости (что и будет их рангом), то частота встречаемости слова с рангом n будет 1/n. Таково математическое выражение того же закона, и именно эту особенность нашли Канчо и Соле. Поэтому множество слов, появившееся из их компьютера, как Афина из головы Зевса, действительно заслуживает звание языка. Вообще, всё, что является осмысленным языком, скорее всего, должно подчиняться закону Зипфа: например, известный современный исследователь Руссо вместе со своими китайскими коллегами показал применимость этого закона к языку «мандарин»; существуют работы, доказывающие его применимость к польскому и чешскому; русские исследователи подтвердили его применимость к «великому и могучему», который оказался таким же несвободным от закономерностей, как его иноязычные коллеги ( в русском языке первую по рангу ширенгу образуют слова: И, В, НЕ, НА, ЧТО, Я, С, МЫ, У, ОН, ПО, БЫЛО), - и из всего этого следует, что при встрече с каким-то закодированным текстом простейший способ выяснить, осмысленный это текст или просто набор случайно используемых значков, - это проверить частотность знаков этого текста на закон Зипфа.
Итак, всё, что язык, подчиняется закону Зипфа – но обратное неверно: не всякое множество, в котором выполняется закон Зипфа, - это язык. Дело в том, что открытие Зипфа имело массу продолжений в самых неожиданных направлениях, и, например, уже в наше время показано, что то же (обратно пропорциональное) соотношение между частотой и рангом выполняется при поиске сайтов в Интернете (число запросов для второго по популярности сайта вдвое меньше числа запросов для первого и т. д.), в области цитирования научных трудов, по отношению к запросу самых ходовых книг в публичной библиотеке и во многих других неожиданных областях социальной деятельности людей. Но выполняется он с отклонениями, порой даже значительными, и анализ этих отклонений привёл уже упомянутого Бенуа Мандельброта к открытию чего-то вроде обобщённого закона Зипфа.
Мандельброт показал, что формула Зипфа будет лучше согласовываться с реальными данными, если внести в неё два исправления: частота обратно пропорциональна не просто рангу, а рангу плюс некоторая постоянная, причём для одних явлений это будет ранг плюс постоянная в первой степени, как у самого Зипфа, для других – ранг плюс постоянная в квадрате или в кубе. А развивая это направление исследований, Мандельброт в конечном счёте пришёл к одному из самых громких открытий второй половины двадцатого века – к открытию так называемых фракталов, ещё более, быть может, вездесущих в природе, нежели закон Зипфа. Вот такая история.
Михаил ВАРТБУРГ»
* * *
Иностранный язык, очевидно, стоит учить по частотному словарю.
К моей теме с уже давно устаревшим названием: «6 букв вместо 34-х» закон Зипфа имеет отношение самое непосредственное.
То, что относится к словам и буквам, относится и к частоте встречаемых обозначений букв в «ольшанице», и к типичным сочетаниям этих обозначений, - причём как вплотную друг к другу, так и в грамматических взаимосвязях слов.
Закон Зипфа хорошо иллюстрирует то, как совсем не сложно научиться ''точечному письму''.
Самые короткие слова относятся к первой по рангу шеренге слов, чуть более длинные – ко второй по рангу шеренге слов, ещё чуть более длинные слова – к третьей по рангу шеренге слов и так далее. Очень длинные слова соответственно шеренге своего ранга встречаются очень редко. Слишком длинные слова в обычном шрифте читаются с трудом, но зашифрованные ''ольшаницей'' такие слова, обязательно упомянутые сначала в явных буквах обычного шрифта, в дальнейшем легко угадываются всего лишь по двум-трем точкам, расположенным в местах, характерных именно для данного слова.
В русском языке имеется много разных приставок, суффиксов и окончаний, и не так уж много корней. Но лексика русского языка богаче других, например, европейских языков. Ведь из одного короткого корня за счет комбинаций его со всякими приставками, суффиксами и окончаниями можно произвести почти неограниченное число слов с разными смысловыми оттенками. Во сколько раз сожмётся орфографический словарь русского языка, если оставить в нём только корни слов, а потом еще отбросить корни слов, этимологически производные от корней исходных. Ядро основного фонда словарного состава русского языка ничтожно мало. Но весь словарный состав русского языка, производный от этого ядра, пожалуй, богаче, чем словарный состав любого другого языка в мире.
Не так уж много имеется в русском языке таких сочетаний из букв его алфавита, которые являются существующими в русском языке корнями, приставками, суффиксами и окончаниями. Эти сочетания букв, зашифрованные неявными их обозначениями в ''ольшанице'', дают во много раз меньше сочетаний таких обозначений. Расшифровка сочетаний этих обозначений в сочетания букв алфавита связана со свойствами русского языка, которые позволяют с помощью компьютера мгновенно зашифровать, расшифровать и перешифровать русский текст, используя не 33 буквенных знака, а значительно меньшее число знаков, желательно не таких, как в обычном шрифте. В английском языке букв значительно меньше, чем в русском, а звуков значительно больше. Комбинацией букв обозначают часть английских или иноязычных звуков. При этом используются специфические обстоятельства и особенности английского языка. Одни и те же буквы, особенно в комбинациях с другими буквами, читаются по-разному в разных обстоятельствах. Иногда требуется просто запоминание, и объяснить написание слова вообще невозможно.
Шифрование ''ольшаницей'' позволяет сократить разнообразие буквенных знаков письма вплоть до двух. Один из них является всего лишь точкой на верхнем уровне строки, другой – точкой на нижнем уровне строки. Между этими уровнями достаточно лишь такое расстояние, чтобы можно было отличить верхнюю точку от точки нижней. Иначе говоря, точки в строке достаточно располагать с едва различимым отклонением этих точек от оси строки. Почти на каждую букву алфавита в таком письме достаточно лишь одной точки, верхней или нижней. Лишь нескольким из букв алфавита потребуется в обозначении и верхняя, и нижняя точка. Эти точки должны отличаться чем-нибудь от точек знаков препинания, например, высотой расположения в строке или тем, что точки знаков препинания мы будем подчёркивать.
Как читать такое письмо, где «в каждой строчке только точки»? Вникнем, зачем нужно такое письмо.
Длинные слова читать утомительно. Когда сокращают некоторые хорошо знакомые слова до одной-двух букв (и т. д., и т. п.), то это не затрудняет чтение, а наоборот, облегчает. Отгадывать некоторые слова менее утомительно, чем вглядываться во все их буквы. В энциклопедическом словаре применяют очень много сокращений. До каких пределов удобно сокращение всё большей части слов?
Прополку строк мы начали с повторения пройденного. Мы, как и большевики, заменили твёрдый знак – Ъ – маленьким, но более заметным в строке значком ', называемым словом «апостроф». Сразу стало понятно всегда известное, - что и мягкий знак Ь можно заменить тем же апострофом, и проблем с правильным прочтением слова не возникнет. Далее проясняется тоже давно известное, что букву Й (которая представляет собой графическую комбинацию из трёх еврейских букв, да ещё с четвёртым штрихом, соединяющим две старорусские «И-же») тоже можно заменить тем же более заметным в строке значком апостроф. Ведь Й всегда стоит после гласной, а Ъ или Ь только после согласной. Тогда возникает соблазн устранить ещё 4 излишние буквы алфавита: Ю, Ё, Я, Е их естественными значениями: ЬУ, ЙУ, ЬО, ЙО, ЬА, ЙА, ЬЭ, ЙЭ, заменяя в них и Ь, и Й всё тем же так заметно торчащим из строки апострофом.
Присмотревшись к литерам Ы и И, вникая в сумбурную историю их начертаний, удивишься нынешнему бессмысленному использованию двух букв в каждом из этих обозначений и очень скоро сообразишь, что и эти две литеры можно заменить всё тем же апострофом, лишь упростив не только начертание, но и чтение. К примеру, слово 'н'ц'ат'вн'' читать в таком виде лишь поначалу непривычно, но каждая буква в нём всё же стала заметнее. При чтении апострофов сначала предполагается звук «И» в значении каждого из них. Не позже, чем расстановка в словах фразы неуказанных ударений прояснится правильное прочтение каждого апострофа. Почему это так, я в свое время показал. Можно, например, цветом фона или самого апострофа показывать его конкретное буквенное значение, но это – дело излишнее и, в принципе, ненужное. Наша цель – не считывать по одной буквы слова и не складывать их звуки в звукосочетания, а предугадывать слова до прохождения по ним фокусированного взгляда.
Применяя апостроф, мы избавились от необходимости применять 9 из 33-х букв алфавита. Апостроф стал одним из заметных ориентиров во многих словах, - той удобной зацепкой в строке, по расположению которой в словах разной длины, ранее упомянутых, можно легче отгадывать эти слова без их тщательного разглядывания. Разумеется, теперь хочется найти в алфавите ещё хотя бы одну букву, без применения которой в письме можно обойтись. Есть такая буква. Это – Щ, естественным значением которой является буквосочетание ШЧ. Таким образом, из 33-х букв алфавита нам вполне достаточно 23-х. То было только первой целью. Проблема лишь в инерции привычек. Печатать уже становится удобнее.
Интерлитерация русского текста латинскими буквами упрощается. На каждую русскую букву в таком тексте, теперь достаточно лишь по одной латинской букве. Читать русский текст в латинских буквах становится не так изнурительно.
Открываются дальнейшие перспективы графического упрощения письма и всего, что с этим связано. Титулованным специалистам все эти перспективы действуют на нервы, вызывая нездоровые страсти, но этих дядек переплюнут школяры младших классов, развлекаясь на компьютере обменом посланий ( м'л'м' пр'в'чн'м' п'с'м.м' ' с н'м' вс'.в.зм.жн'м' с'л'н'м' ' с.м'м' пр'м'т'вн'м' 'л' л'чн'м' н'. сл'шк.м 'х'тр'м' ш'фр.м' ).
Под впечатлением от моей серии публикаций сам дохтор Б.Подольский вспомнил, как, будучи студентом МГУ, он придумал для себя удобный способ скорописи. Гласные буквы он оставлял лишь в начале и в конце слов. Те, кому он показывал свои тетради с конспектами, после первых мгновений неудобства в непривычном чтении слов с пропущенными гласными, тут же приноравливались к таким записям и уже не испытывали никаких трудностей в чтении его конспектов. Учтём этот опыт. Но мы поступим чуть иначе. Наличие каждой из 4-х гласных: У, О, А, Э мы обозначим нижней точкой, но сначала любое слово при первом его упоминании мы будем показывать обычным шрифтом от первой буквы до буквы последней. При каждом очередном упоминании слова будем его как бы сокращать с конца, подставляя апострофы вместо букв Ъ, Ь, Й, Ы, И, потом будем подставлять апостроф вместо Ь и Й как бы в замещениях букв Ю, Ё, Я, Е их естественными значениями: ЬЮ, ЙЮ, ЬО, ЙО, ЬА, ЙА, ЬЭ, ЙЭ, а затем будем ставить нижнюю точку вместо очередной гласной из группы: У, О, А, Э. Поначалу можно подкрашивать фон каждого апострофа и каждой точки для точного указания буквенного значения каждого такого знака. Потом будем убирать эти подцветки в последовательности замены букв обычного шрифта нашими апострофами и точками.
После шифрования гласных в каждом слове начинается шифрование согласных букв аналогичным образом, - знаками их обозначения в шифровке ольшаницей. При этом согласные корня стоит шифровать в последнюю очередь.
До полной зашифровки слова знаками ольшаницы при таком способе шифрования это слово должно быть упомянуто в два раза большее число раз, чем число букв в этом слове. Понятно, что слова очень короткие, к тому же упоминаемые, согласно закону Зипфа, очень часто, гораздо раньше более длинных слов будут зашифрованы знаками ольшаницы полностью.
Длинные слова будут сравнительно долго торчать в строках незашифрованными. Но эти длинные слова, вообще-то трудно читаемые в обычном шрифте из-за их длины, в шифруемом тексте вследствие прополки строк будет легче предугадывать. Во-первых, это потому так, что слово, уже упомянутое, после второго и очередного упоминания имеет очередную метку того, что это именно то слово, о котором идёт речь; во-вторых, на фоне зашифрованных слов, в длинном слове становятся всё заметнее многие именно его комбинации именно его отличительных особенностей в графическом изображении именно данного слова. Необходимость читать даже по явным буквам довольно длинное слово отпадёт весьма рано. Оно будет отгадано по малейшим двум-трём подсознательно контрольным признакам, причём не только из признаков только этого слова, но и по контексту, и по соответствию отдельных, выборочно «контрольных» признаков в других, взаимосвязанных словах.
Самые короткие слова состоят из одной буквы:
А, Б, В, Ж, И, К, О, С, У, Э, Я.
Местоимение Я требует вполне определённые окончания глаголов: Я пиЛ, пьЮ и будУ пиТЬ. Буква Я обозначается в ольшанице точно так же как буквы Ю, Е, Ё, но лишь буква Я может быть словом. Разночтений быть не может.
Междометия: Э, У, О, А опознаются по знакам препинания. Поскольку все эти буквы шифруются одинаково, то читать такое междометие следует в том варианте, который уже упоминался последним явной буквой обычного шрифта.
Предлоги У, О шифруются одинаково, но распознаются по различию в падежных окончаниях последующих слов. Если возможны разночтения (О НЕЙ и У НЕЙ), и, что весьма маловероятно, из контекста не ясен смысл, то сам компьютер оставит метку цветом фона буквы или точечкой около неё в качестве указания конкретного, правильного прочтения буквы.
Союз И, обозначенный опострофом, невозможно прочесть иначе.
Союз А опознаётся хотя бы уже по запятой перед ним, что уже отличает его от предлогов О и У.
Предлоги С и К распознаются по различию в падежных окончаниях последующих слов и просто потому, что обозначены по разному.
Предлог В – это в отличие от предлогов С и К буква звонкая, которая обозначена иначе. Кроме того предлог В требует иных окончаний в последующих словах. Шифровки различных окончаний выглядят почти всегда по-разному.
Частицы Ж и Б, в отличие от предлога В, стоят позади слова, к которому они относится, и это видно хотя бы по согласованиям окончаний в словах. Кроме того, буквы Ж и Б различаются обозначениями.
В русском языке слов из двух букв очень мало. Их все можно выписать из орфографического словаря, разместив всего на двух-трёх строчках. К этим словам относятся прежде всего местоимения. Они встречаются в тексте исключительно часто. Местоимения, – эти древнейшие, самые короткие слова русской речи, являются производными от еврейских слов и частей слов . Они и окончания прочих местоимений, особенно в косвенных падежах (ЕЕ, ЕЙ, ЕЮ, ЕГО, ЕМУ, ИМ, о нЕМ, ИХ, ИМ, ИМИ, тА, тО, тУ, тЕ, тЫ, тОЙ, тОГО, тЕМИ, тЕХ, такОВ, такОВА, такОВЫ, экИЙ, экАЯ, экОЕ, всЕ, всЯ, всЮ, весЬ), стали окончаниями большинства более длинных слов.
Эти окончания встречаются в тексте чаще, чем через каждое слово. Уже на первой же странице, почти все окончания, почти все такие же местоимения и подобные окончания более длинных слов окажутся зашифрованными ольшаницей.
Шифровки всех, - не так уж многих, - окончаний и суффиксов запомнятся быстро, возможно, что даже легче, чем обозначения букв и цифр в азбуке Морзе.
То же самое относится почти ко всем предлогам, особенно к предлогам коротким, и затем к таким же приставкам. О том, как легко опознаётся без складывания по буквам любой предлог, любая приставка и почти любое наречие в их обозначениях всего лишь даже только двумя разновидностями знаков – верхний знак и нижний знак – мы как-то уже разбирали.
Это же касается прочих коротких слов, особенно служебных, - таких как частицы, союзы, междометия, наречия, а так же короткие и, следовательно, – по закону Зипфа – наиболее употребительные имена прилагательные, существительные, числительные и глаголы. Эти очень немногие, столь короткие слова русского языка – наиболее древние в нём. Они составляют ядро основного фонда словарного состава русского языка.
Происходят они по большей своей части из слов языка
древнееврейского. Такое заявление противоречит основам основ всех официальных – в главном своём принципе изначально и по сей день ЮДОФОБСКИХ – установок в лингвистике и во всех неисчислимых науках, с нею связанных.
Используем для обозначения 33-х букв алфавита пока все 4 знака (ВШ, НШ, НТ и ВТ), дающих нам 8 обозначений – не более, чем по два знака на каждую букву (буквенную позицию). Так мы легко научимся читать шифрованные слова, не складывая их по буквам, а распознавая каждое слово именно целиком, как лица людей. Будем лишь мельком, скользящим взглядом и боковым зрением подсознательно подмечать только некоторые отличительные приметы в зрительном образе каждого слова из всего неисчислимого множества таких его примет. Мы и обычный текст читаем в привычном шрифте именно таким образом, вследствие чего читаем русский текст быстрее, чем текст, на языке, с которым знакомы менее. Существенное упрощение графики письма делает нагляднее отличительные признаки в образах напечатанных слов. Это требуется осознать как можно лучше.
Следующий, промежуточный этап упрощения письма – использование пока всего лишь 3-х знаков – ВШ, НТ и ВТ – из вышеупомянутых 4- х. Это оставляет нам 5 из 8-ми ранее упомянутых обозначений на 33 буквы алфавита, в частности, 3 из 6-ти обозначений на все 20 согласных букв.
Распределим 13 букв алфавита во всё те же группы:
• Ъ, Ь, Й, Ы, И [2,5]
• У [2,5], О [7, 5], А [3], Э [0,1]
• Ю [0,1], Ё [0,1], Я [0,3], Е [0,2].
В квадратных скобках около буквы показан процент числа слов в орфографическом словаре, начинающихся с этой буквы.
Теперь я рекомендую распределение 20-ти согласных лишь по 3-м обозначениям в шифре ''ольшаница''.
В квадратных скобках около каждой согласной буквы алфавита проставлен процент слов, которые начинаются с этой буквы в орфографическом словаре. Этот процент, однако, вовсе не соответствует частоте этих слов в типичном тексте.
• Б [3], В [7], Г [2,5], Д [4], З [4], Л [1,5]
• Ж [0,5], М [4], Н [6,5], Р [5], К [5,5], П [19]
• С [9], Т [3], Ф [1], Х [1], Ц [0,4], Ч [1], Ш [1,5], Щ [0,1]
При таком распределении легче расшифровывать в тексте одинаково обозначенные буквы. Слова, состоящие только из одной буквы: Б, В, Ж, С, К получаются более различимыми. Предлоги В, К, С обозначены по-разному, как и частицы Б и Ж. Эти предлоги от этих частиц отличаются тем, как они связаны с соседними словами. В словах после предлогом имеются соответствующие окончания, а упомянутые частицы стоят после слова, с которым такая частица связана по смыслу. Эта частица не требует в последующем слове соответствующего ей падежного окончания. Смысл такого слова – Б или Ж – понятен из текста. Кроме того, чаще употребляют частицы БЫ и ЖЕ, а их гласные – Ы или Е – шифруются по-разному: Ы – одним знаком, а Е – двумя.
В окончаниях:
• [сн]ОВ, [соловЬ]ЁВ, [деревЬ]ЕВ
• [т]ОГО, [н]ЕГО
• [т]ОМУ, ЕМУ
• [дв]УХ, [т]ЕХ, [тр]ЁХ, [с]ИХ, [зл]ЫХ, [век]АХ
согласная опознаётся по отличию именно её шифровки, но более в знакомой комбинации с отличиями соседних с ней гласных букв в их шифровках, а главное, по тому, какое окончание само напрашивается в тексте.
Эти окончания, всегда содержащие не более чем одну согласную, в основном, совпадают с личными местоимениями в их косвенных падежах.
Аналогичным образом распознаются предлоги и приставки:
БеЗ, БеЗо, В, Во, ДЛя, До, За, иЗ, иЗо, иЗ-За, иЗ-ПоД, иС, К, Ко, КРоМе, МеЖ, МеЖДу, На, НаД, НаДо, о, оБ, оБо, оТ, оТо, ПеРеД, ПеРеДо, ПРеД, ПРеДо, По, ПоД, ПоДо, ПРа, ПРе, ПРи, ПРо, ПСеВДо, РаДи, РаЗ, РаС, С, Со, у, ЧеРеЗ, ЧеРеЗо.
Пометим соответствующим цветом буквы одинаково обозначенные и таким образом увидим, что
из всех перечисленных здесь предлогов и приставок одинаково зашифрованными оказываются, пожалуй, лишь: 1. ВО как ДО
2. НА, НАД, НАДО как ПО, ПОД, ПОДО.
Это терпимо, хотя для различий можно и пометить иногда знак обозначения какой-нибудь буквы, например, букву Д или А.
Вообще-то прочтение повторяющегося слова должно быть понятно из текста.
Большая наглядность соответствия мест наиболее приметных точек ожидаемым их местам в обозначениях букв каждого шифрованного слова обеспечивается лишь для того, чтобы подсознательно (то есть без словесных рассуждений) было легче подмечать ожидаемые взаимосвязи более наглядных признаков знакомых слов.
Шифрование букв и слов ольшаницей предназначено для того, чтобы исключать последовательное распознавание букв. Нужно облегчить подсознанию мгновенное, лишь частичное подтверждение догадок слов, - целиком, в их взаимосвязи. При чтении обычных текстов мы тоже кое-что отгадываем, не вглядываясь в каждую букву, но с несопоставимо большими трудностями.
И в обычном шрифте встречаются слова, написанные и даже читаемые одинаково, но имеющие различный смысл, а иногда и различие в ударении. В иврите таких случаев много больше, чем в русском. Вне текста еврейское слово, если оно написано без простановок знаков огласовки согласных, вообще-то не обязано быть понятным (как оно читается и что означает). Однако при этом «почему-то» неогласованный текст читать несравнимо удобнее.
В русском языке, особенно с использованием возможностей персонального компьютера, эту концепцию можно углубить очень значительно. Если в тексте оставить в обычном шрифте все согласные, то это уже только половина букв текста.
Если оставить согласные обычного шрифта лишь только в корнях, да и то не во всех словах, то в тексте останется не более, чем несколько процентов букв обычного шрифта. Один мгновенный взгляд на страницу такого текста уже даёт какое-то представление о сути его содержания. Далее можно вникать или не вникать во всякие подробности – лишь по мере имеющегося интереса к ним.
Буква П в начале слова чаще всего относится к приставке (ПО, ПОД, ПОДО, ПРО, ПРА, ПРЕ, ПРИ, ПРЕД, ПРЕДО, ПЕРЕ, ПЕРЕД, ПЕРЕДО, ПСЕВДО). Каждую приставку целиком легко опознать по ёё характерным приметам именно её комбинации расположения знаков в её шифровке.
Из группы букв: С, Т, Ф, Х Ц, Ч, Ш, Щ в начале слов типична только С. (9 % слов в орфографическом словаре). Не более 1% слов в орфографическом словаре начинается с любой другой из этих букв. Так, например, с буквы Щ начинается лишь 0,15 % слов, но эта буква входит в очень типичный суффикс причастия, который встречается в тексте довольно часто. Эта буква в суффиксе, зашифрованная ольшаницей, является очень заметным ориентиром для мгновенного, подсознательного определения порядка слов в предложении и расположения в нем членов этого предложения. Это подсказывает, какими частями речи они являются, из каких частей слова они состоят, и как они взаимно согласуются соответственно своим окончаниям и предлогам.
Буквы Ю, Ё, Я, Е заменены у нас буквосочетаниями, то есть, выведены из употребления в шифрованном тексте. Те наши обозначения букв русского алфавита, что занимают только одну буквенную позицию можно считать ''буквами'' шифра ''ольшаница''. Что касается 34-й буквы для звука h, которую стоило бы (лишь при желании) добавить, а точнее вернуть в строй русских букв для способности по-русски писать очень многие имена собственные и нарицательные иноязычного происхождения, то эту букву можно отнести к последней группе из тех, что перечислены выше.
Компьютер в нашем письме шифрует все слова последовательно, по одной букве, в основном, с конца слова, как бы постепенно сокращая его, но по определённым правилам. Это позволяет легко запоминать эти временные сокращения. В отличие от орфографического словаря обычные тексты содержат очень много весьма часто повторяющихся коротких слов. Окончания, суффиксы и приставки, шифруемые независимо от корней слов, повторяются ещё чаще во много раз. Поэтому с первых же строк и, уж конечно же, с первой страницы текста большая часть обычного шрифта букв русского алфавита в нём окажется заменённой обозначениями шифра ''ольшаница'', - сначала с конкретизирующими прочтение буквы пометками, а потом и без них. Пометкой может быть цвет буквы или её фона. Пометкой может быть точечка под и/или над строкой около обозначения буквы. Пометкой может быть разный вид точки или штриха. Очень важно убрать эти пометки, чтобы распознавать слова и обороты слов не буква за буквой, а разом – по знакомой совокупности лишь некоторых признаков, подсказывающих целиком всё слово и даже типичные взаимосвязи в цепочках слов.
Если учесть, что для большинства слов ранг слова связан с числом букв в нём, то понятно, что, в общем, частота такого полного шифрования слов при этом обратно пропорциональна удвоенному квадрату ранга слова, а не просто рангу слова, как в простом выражении закона Зипфа.
Прополка строк ольшаницей очень быстро делает длинные слова в обычном шрифте их букв очень заметно торчащими в строках, выделяя, таким образом, более наглядно эту суть предложения. Длинные слова вообще-то трудно читать. Но если такое слово торчит в строке после ее прополки, и видно по буквам, замещённым нашими обозначениями, что это именно то сравнительно редкое слово, которое упоминается уже не первый раз, то читать это слово, считывая в нём букву за буквой даже обычного шрифта, просто не понадобится. Слово это опознаётся целиком. Подсознанию, для того, чтобы убедится в том, что это именно подразумеваемое слово, достаточно приметить в нём лишь один-два штриха, торчащих на ожидаемых в нём местах за габариты большинства обычных букв.
Представим себе уже очень полно зашифрованный текст, в котором после первых двух трёх страниц книги (на экране компьютера) в строках почти не осталось букв обычного шрифта. Допустим, что даже относительно длинных слов в полностью или почти полностью зашифрованном виде в тексте накопится так много, что придётся из многих упомянутых не единожды таких слов опознать то, что зашифровано. Каждое обозначение буквы в нём имеет вообще-то несколько значений, но в данном случае только одно из них. Читать такое слово, складывая в нём букву за буквой, пусть будет невозможно. (Это было бы идеально по самому принципу чтения текстов, шифрованных ольшаницей). Но имеется бесконечное множество приёмов подсознательно распознавать знакомое слово, причём легче и быстрее, чем в буквах обычного шрифта. И обычный текст мы читаем именно так, опознавая слова не вглядываясь в их буквы. Мы и лица людей мгновенно опознаём точно так же,
Подсознательно, по совокупности каких-то примет, которые мы словами не можем описать, мы каким-то непонятным образом всё же мгновенно узнаём знакомого человека, причём не только именно в лицо, но и со спины, даже в мешковатой зимней одежде. Распознавание зрительных образов – проблема для науки пока ещё неприступная. Но куда более наглядны отличительные особенности слов и их взаимосвязей в тексте, в котором вместо рисунков обычных букв имеется всего лишь по одной, реже по две точки, каждая из которых находится только в одном из двух для неё возможных мест.
Из неисчислимого многообразия всевозможных приёмов подсознательного распознавания знакомых образов слов, записанных ольшаницей, ничтожную их часть всё же можно осознать и пытаться объяснить, но всё же лишь с помощью многих слов. Это, однако, проще, чем объяснять правила иностранного языка.
Попробуем подметить некоторые приёмы распознавания слов, зашифрованных ольшаницей.
О распознавании предлогов, приставок и наречий, зашифрованных всего лишь только апострофами и нижними точками, мы уже излагали. Теперь обратим внимание на короткие местоимения и такие же окончания. Их не так уж много.
В любом падежном окончании возможна лишь одна согласная только из букв: В, Г, М, Х, а может и вовсе не быть никакой согласной. Даже, если бы все эти 4 согласные обозначались в шифровке ольшаницей одинаково, их всё равно можно было бы распознать в окончаниях слов по множеству косвенных признаков.
Даже ещё не принимая во внимание согласования слов во фразе по их падежным окончаниям, уже только лишь по длине окончания и по месту каждой какой-то гласной в нём можно, перебирая варианты, допустить или отмести каждую из всех этих всего только 4-х этих упомянутых согласных. Гласные в этих местоимениях могут быть не любые. Из гласных Ю, Ё, Я, Е, обозначаемых одинаково, как и из гласных У, О, А тоже одинаково обозначенных, так же как из букв Ь, Й, Ы, И, обозначенных тоже одинаково, существует совсем не так уж много разных комбинаций в окончаниях слов. Их не трудно запомнить даже надолго. Каждая такая комбинация, если и допускает разночтения, то выбор подходящего варианта диктуется обстоятельствами согласования слов в предложении. В своё время мы уже рассматривали то, почему возможно без разночтений и даже легче читать текст без 9-ти из 33 букв алфавита, если применять апостроф в обозначениях этих 9-ти букв.
Даже, если бы все 20 согласных букв алфавита обозначать одинаково, буквы: Ъ, Ь, Й, Ы, И тоже одинаково (без метки) и буквы: У, О, А, Э также без отличий между ними, все окончания и такие же местоимения, все приставки и такие же предлоги, а так же многие из наречий легко распознаются целиком по знакомой, - легче запоминаемой зрительно - совокупности графически столь упрощённых обозначений, - легче, чем узнаются, например, лица людей.
Это же относится и к суффиксам.
Это же относится и к очень коротким, особенно, служебным словам: союзам, частицам, междометиям, а также к некоторым числительным, прилагательным, существительным и глаголам.
Разнообразие окончаний у глаголов тоже невелико. Их все можно перечислить, заняв не более двух строк.
Каждое ''расшифрованное'' слово является ориентиром для подсознательной, мгновенной ''дешифровки'' прочих слов в предложении и в контексте.
Корни весьма многих длинных слов очень коротки. Число согласных букв в большинстве русских корней, пожалуй, всего-то не более 3-х, как и в языках семитских. В языке Пушкина усердные исследователи насчитали 20 тыс. слов, в языке Ленина – ещё больше. Число русских слов (или словоформ?), которые можно образовать или встретить, невозможно подсчитать даже в принципе. Великий и могучий русский язык имеет довольно много всяких приставок, суффиксов и окончаний, которых бывает и по три в одном слове. Поэтому из каждого корня, можно образовать сколько угодно сотен производных слов. Но от одного корня, бывает, образуются немало производных корней: СЯДь, САДи, СИДи, СУДи, САЖай, СЕДло, СёДла, СУЖдение, СЕЛи, СёЛа, СЕв, СЕСть, СЕМь, СЕДЬМой [от др.-евр. слова ШеВ (корень:Шин – Бэт {Вэт}) “сиди” в ШаБат “СУББота” – СЕДЬМой, то есть сидячий, - день отдыха – после шести дней творения мира, включая Адама].
{Человек на иврите “АДАМ” и его красная “АДОМ” кровь “ДАМ” уходит в землю “АДАМА”, из которой он сотворён, а кровь, сказано в Писании, есть душа. На Ближнем Востоке земля чаще всего имеет типично красноватый цвет.
Между прочим, напомню, что и русские слова: КРОВь , КРОВ, КРОВля, поКРОВ, КРОВать, КОРОБ[ушка], КОРОВ[ушка] происходят от древнееврейского слова К-Р-В “близ-ко” - ещё со времён первых хазар, - от евреев рахдонитов в Восточной Европе.}
Если зашифрованное слово допускает разночтение (напр., ЖИЛ, БЫЛ, БИЛ, ЛИЛ, ПИЛ, ПЫЛ, ВЫЛ, МЫЛ, МИЛ, НЫЛ, НИЛ, РЫЛ, ТЫЛ, нет СИЛ, ШИЛ) вне связи с контекстом, то в тексте разночтение устраняется тем, что, подразумевают либо осмысленный вариант, либо формально упорядоченный вариант, например, по последнему упоминанию такого слова. Что-либо может быть конкретизировано меткой, - напр., цветом знака или/и его фона в обозначении одной-двух букв в таком слове, или дополнительной точечкой под и/или над строкой около обозначения буквы.
* * *
|