Передача больших массивов информации требует эффективного шифрования, которое невозможно без надежных и быстрых генераторов случайных чисел. Для генерации обычно используют различные физические явления, например дробовой шум резистора, радиоактивный распад либо изощренные математические алгоритмы создания псевдослучайных последовательностей. Последние не дают идеального результата и в принципе могут быть взломаны. Это сегодня может коснуться буквально каждого. Банковские системы безналичных расчетов, например, не могут обойтись без генераторов случайных чисел.
Прорыв в получении истинно случайных чисел недавно совершила группа ученых под руководством Роберта Грасса из Высшей технической школы Цюриха. Они приспособили для этого стандартный, но слегка модифицированный процесс синтеза ДНК. По заявке ученых две коммерческие фирмы из смеси четырех нуклеотидов синтезировали цепочки в 105 нуклеотидов; они содержали в себе затравочные последовательности (праймеры) и полностью случайные участки из 64 нуклеотидов. Поскольку каждому нуклеотиду можно приписать цифру, получались совершенно случайные числа из
64 разрядов. Исследователи получили три заказанные порции сухого вещества по две десятых миллиграмма каждая и стандартным образом секвенировали молекулы этих порций, то есть прочитали нужные им последовательности нуклеотидов.
Оказалось, что средние содержания разных нуклеотидов в цепочках разных порций слегка различны. Были обнаружены и другие слабые, но систематические отклонения от стохастичности; видимо, они связаны с особенностями технологий и методов проведения реакций синтеза. После преобразования нуклеотидной последовательности в ряды нулей и единиц к ним был применен алгоритм сжатия фон Неймана, который устранил слабые отклонения. Полученные двоичные последовательности, подвергли анализу на случайность с помощью общепринятого пакета программ, реализующего пятнадцать различных тестов для анализа статистических свойств таких последовательностей.
Результат оказался блестящим. Новый метод позволяет получать в одном синтезе семь миллионов гигабайт случайных чисел, которые могут быть прочитаны стандартными технологиями со скоростью триста килобит в секунду. Уже единичный синтез дает рекордный запас сравнительно быстро извлекаемых истинно случайных чисел. Емкость с молекулами можно долго хранить, так как молекула ДНК очень устойчива. «Миллиграммы» чисел, которые нельзя воспроизвести, занимают минимальный по сравнению с другими методами объем. Изначально ученые планировали лишь изучить принципы нового биохимического формированию массивов случайных чисел из нуклеотидных последовательностей. Однако оказалось, что уже сейчас его можно применять на практике.
(Nature Communications, 11(1), 2020)