facebook_pixel
  • 29 января 2018, 18:56

    Код Войнича: как нейросеть взломала самый известный шифр в истории

    Обнаженные женские тела, не растущие нигде в мире растения и карты несуществующих островов — все это лишь иллюстрации к тексту, в котором непонятны не только слова, но и буквы. Только искусственный интеллект смог проникнуть в секреты древней книги, не расшифрованной даже взломщиками сверхсекретных кодов нацистов. Сайт «360» рассказывает подробности этой истории.

    Код Войнича: как нейросеть взломала самый известный шифр в истории | Изображение 1

    Канадские лингвисты уверяют, что им удалось обставить лучших криптологов в мире от аналитиков ЦРУ и АНБ до «звезд» прошлых поколений — специалистов британской и американской военных разведок. Команда ученых из университета Альберты частично расшифровала рукопись Войнича. Написанная примерно 600 лет назад, книга использует язык не встречающейся ни в одном другом тексте созданным человечеством за всю его долгую историю — уникален даже его алфавит.

    За последние 100 лет, манускрипт превратился в «священный Грааль» любителей неразрешимых загадок. Несмотря на многочисленные попытки математиков, лингвистов и экспертов по шифрам, понять язык так и не удалось. До недавнего времени, его структура оставались несокрушимой крепостью, о стены которой сломали копья многие талантливые исследователи.

    Тайна книги

    Канадцы отказались от попыток разгадать головоломку обычными средствами, в своем исследовании древнего манускрипта они положились на алгоритмы нейросетей. Ранее программа с точностью в 97% определяла каждый из 300 языков, на который переведена Всеобщая декларация прав человека. Теперь она смогла прочитать нечитаемое.

    «Войничевский» язык исследован вдоль и поперек — известно, что около 35 тысяч слов рукописи имеют некоторые характерные признаки европейских языков, но в то же время могут быть частью конструкций, напоминающих об арабском или греческом. Ряд экспертиз помогли определить даже точный состав чернил и примерную датировку книги — начало XV столетия. На одном из рисунков видна замковая крепость, чьи зубцы указывают на ту же эпоху и на конкретное место — север современной Италии. Но все эти данные не помогли прочесть хотя бы одно слово текста.

    Некоторые исследователи в отчаянии предполагали, что книга написана на выдуманном языке не имеющим смысла — якобы это подделка, которая помогала шарлатанам, выдававшим себя за астрологов и лекарей, выманивать деньги у дворян и богатых торговцев.

    Но канадские ученые считают, что книга написана на настоящем и хорошо известном языке. После анализа текста нейросетью, та выдала однозначный ответ — это иврит. Только в каждом слове буквы поменяли местами, а гласные и вовсе отбросили. Это затруднило работу, но некоторые слова все-таки удалось перевести. В рукописи часто встречаются «фермер», «свет», «воздух» и «огонь». Также расшифровано самое первое предложение.

    Она дала советы священнику, главе дома, мне и людям

    — первое предложение манускрипта Войнича.

    Магия слова

    Код Войнича: как нейросеть взломала самый известный шифр в истории | Изображение 2

    В учебниках по криптографии эту рукопись приводят как пример идеального кода, чей секрет не открылся лучшим умам ХХ века — манускрипт Войнича неоднократно признавался самой загадочной книгой в мире.

    В 1912 году антиквар Вильфрид Войнич обнаружил ее в библиотеке дворца иезуитов в Риме. Его фамилия сегодня известна по двум причинам: благодаря литературным успехам жены антиквара Этель Лилиан (в частности, написавшей роман «Овод») и рукописи Войнича. Причина, почему книгу стали называть по имени одного из владельцев, проста — автор и ее настоящее название никому неизвестны.

    На обложке старинного труда нет никаких надписей или рисунков, зато внутри, почти на каждой из 240 страниц, есть красочные иллюстрации экзотических растений, звездного неба и человеческих фигур. Местами анатомический атлас с довольно подробными изображениями женщин и мужчин без одежды, местами справочник по ботанике, в котором известные современной науке травы соседствуют с невиданными цветами, книга больше всего напоминает средневековый гримуар — собрание заклинаний и колдовских рецептов.

    Несмотря на страшные кары для колдунов, в Средние века было создано немало книг посвященных магии и заклинаниям. Дошедшие до нас рукописи часто написаны на «мертвых» языках и насыщены загадками, но их, по крайней мере, можно прочесть. Рукопись Войнича до недавнего времени не поддавалась даже самым изощренным экспертам в тайных шифрах.

    Во время Второй мировой за текст взялась команда британских криптоаналитиков Блетчли-парка, закаленных работой с кодами нацистской шифровальной машины «Энигма», напоминает«Би-би-си». Они упорно старались найти смысл строк на желтых страницах манускрипта, но в итоге отступили и признали свое поражение.

    На этом фоне, успех нейросети выглядит поразительным, но Грег Кондрак, ответственный за компьютерные алгоритмы предупреждает — до полной разгадки еще далеко. Искусственный интеллект не способен понять меняющийся в зависимости от контекста смысл слов, не говоря уже об аллегориях и ребусах, которым могут скрываться за простыми на вид фразами. По словам ученого, понадобится человек, прекрасно понимающий иврит и хорошо разбирающийся в истории — такой специалист сможет дать верный анализ полученным данным.

    Можем ли мы внимательно, словно детективы, взглянуть на текст и понять что за послание в нем зашифровано?

    — Грег Кондрак, цитата по DailyMail.

    Пока все секреты рукописи Войнича еще не стали известны нейросетям, в них можно покопаться самостоятельно. Правда, только если у вас найдется семь-восемь тысяч евро. Такова примерная цена копий книги, которые будут напечатаны небольшим испанским издательством. Всего будет выпущено 898 экземпляров в точности напоминающих оригинал.