А она оказалась не простой. Обычно, я не обращаю на такое внимание, но в этот сразу нашёл некоторые закономерности:
Первое. Вершина айсберга Почему текст не бред: Буквы расставлены не хаотично, а в некотором порядке, причём не все, а только "А" и "D" D повторяется с определённой периодичностью, которая не могла возникнуть случайно. Это меня заинтересовало, но я не смог сходу вспомнить ни одного подобного шифра. Это не связано с моей работой(анализ FASTA) и не является элементарным шифром вроде Шифра Цезаря, ROT32, шифра Виженера. И поэтому было решено копать. Известно лишь то, что шифрование работает в обе стороны и поэтому теоретически можно восстановить исходный текст.
Второе. Подножье айсберга:
Первое, что приходит в голову, зная, что "D" единственная одиночная буква, которая повторяется, нетрудно предположить, что "D" разделяет элементы текста аки пробелы. Довольно интересная картина будет при разделении текста после каждого DA. Каждая строка содержит, ЕМНИП: 44, 33, 66, 66, 66, 66, 66, 66, 33, 33, 65 символов. Выглядит красиво, но это мне ничего не дало. Вряд ли тут есть какая-то сильная зацепка или высший замысел. Так что на OEIS.org* искать последовательность не имеет смысла
Некоторые элементы выделяются своей необычностью: Mg, Ng, DI, w и так далее. Беглый гуглёж показал следующий сайт: https://elwo.ru/smd.html
Есть что-то общее(хахаха). Но связь абсолютно надуманная, а потому вероятность успеха (разгадки текста) около нуля.
Длина текста 620 символов и ни одного пробела или иного явного начала новой строки. 620 - не полупростое и не является потенциальной картинкой Аресибо**. С 620 не связно никаких последовательностей или культурных отсылок, поэтому предположу, что текст попросту не фиксирован по длине и его длина коррелирует с длиной зашифрованного текста. И его длина не имеет смысла.
Однако, нельзя сказать, что разбиение было бессмысленно. Как не трудно увидеть, текст прекрасно разбивается на отдельные элементы, многие из которых повторяются.
Вот они:
AAAA0AAAA2AAAA3AAAADcAAAADIAAAADMAAAADQAAAADUAAAADYAAAAMAAAAMgAAAAMQAAAAMwAAAANAAAANgAAAANQAAAANwAAAAOQAAAAwAAAAyAAAAYQAAAAzAAAAZgAAABjAAABkAAABlAAABmAAADAAAADDAAAADEAAADgAAADIAAADUAAADYAAAGUAAAGY
Уникальных 36, хотя не обязательно что их не больше (Например, АААА1, которого нет в тексте). А всего получается разбить 620 символов на 116 элементов. Википедия конечно, говорит, что 116 в древнеинийской мифологии имеет сакральный смысл и символизирует длину человеческой жизни, а в каббалистической трактовке 116 - одно из имён Б-га, но вряд ли моя криптография с этим связано. Так говорит здравый смысл.
36... из них 3 не оканчиваются на буквы (AAAA0 AAAA2 AAAA3). Если считать, что это какие-то цифры или спец символы, то всего будет 33 уникальных элемента. Логично было предположить, что каждый уникальный элемент можно заменить русской буквой. Для этого есть частотный анализ:
Что-то разумное есть, конечно, но во-первых 116 символов слишком мало для того, чтобы сработала статистика, а во-вторых "D" - не забываем, повторяется с определённым периодом. Значит всё таки не всё так просто и просто соотнести нужные элементы с алфавитом, а затем постепенно подгонять с частотой и контекстом не получится. Шифр мудрёнее чем просто замена отдельных букв на комбинации символов. Например, ниже приведённый текст довольно разумный, но по частоте ничего не выйдет проанализировать
Мороз и солнце; день чудесный!
Еще ты дремлешь, друг прелестный —
Пора, красавица, проснись:
Открой сомкнуты
Четвёртое. Погружение.
Дальнейшие размышления привели к совершенно неожиданной идее перевести AAAA0 и подобные в Hex. А затем разноцветную полоску перевести в Картинку. Сначала Excel даже что-то разумное сделал:
Но уже дальше был облом. Прошло пару часов и я решил признать, что достиг уровня своей некомпетентности: ни гугл, ни смекалка не помогли найти ответы. Почему сразу не спросил коллегу? Для начала, это скучно, а во-вторых хотелось узнать как далеко мне удастся приблизиться к правильному решению, если кто-то знающий отгадает задумку, и тем самым популяризирует криптографию, хаха.
Примечания:
*Сайт, узнающий закономерность, по которой действует целочисленная последовательность, если таковой есть в базе.
** Посла́ние Ареси́бо[1] — это радиосигнал, который был послан 16 ноября 1974 года из обсерватории Аресибо (Пуэрто-Рико) в направлении шарового звёздного скопления М13, находящегося на расстоянии 25 000 световых лет в созвездии Геркулеса. Сообщение длилось 169 секунд, длина волны — 12,6 см[2]. Это было сделано в честь открытия мощного радиотелескопа[2].
Само сообщение было составлено Фрэнком Дрейком и Карлом Саганом[3]. Его длина — 1679 цифр. 1679 — число полупростое, то есть является произведением двух простых чисел 23 и 73, и поэтому сообщение можно расположить в виде прямоугольника только двумя способами. При правильном расположении сообщения плотность чисел непостоянна (система упорядочена), при неправильном — плотность чисел почти постоянна (система хаотична). Учитывая тот факт, что количество информации определяется степенью упорядоченности системы, можно сказать, что вероятность того, что первый вариант содержит информацию, на порядок выше того, что информация содержится во втором варианте. Исходя из этих соображений, предполагается, что получатель правильно выберет ширину и высоту прямоугольника.
Оставляю исходный текст для тех, кто не узнал шифр, но хочет поэкспериментировать:
https://pastebin.com/Na3YV6yj