Революция в хранении данных: запись информации на ДНК выходит на новый уровень

rinnНоя 4, 2024

Идея использовать ДНК для хранения данных, впервые предложенная Ричардом Фейнманом еще в 1950-х, наконец обретает практические очертания. В природе ДНК хранит генетическую информацию с невероятной плотностью (один грамм может вместить более 200 петабайт) и долговечностью (тысячи лет). Предыдущие эксперименты, такие как запись книги в ДНК (2012 г.), всей Википедии (2019 г.) и эпизода сериала «Биохакеры» (2020 г.), подтвердили потенциал этой технологии, но столкнулись с ограничениями в скорости и стоимости записи.

s41586-024-08040-5 Скачать

Прорыв совершила команда ученых из Пекинского университета, разработав метод параллельной записи и чтения информации на ДНК. Опубликованная в Nature статья описывает технологию, которая не только ускоряет процесс, но и делает его значительно более доступным, даже с привлечением больших языковых моделей (LLM) для коррекции ошибок.

В чем суть инновации?

Прежние методы записи данных на ДНК основывались на синтезе — последовательном добавлении нуклеотидов (A, T, C, G) к цепочке ДНК. Этот процесс был медленным, дорогим и требовал участия квалифицированных специалистов. За один раз записывался всего один бит информации.

Новый метод использует шаблоны ДНК, аналогичные тем, что существуют в живых клетках. Информация записывается путем добавления метильных групп к определенным участкам ДНК. Этот процесс, напоминающий «молекулярную печатную машинку», позволяет записывать до 350 бит за один раз, значительно увеличивая скорость и снижая стоимость.

Как это работает?

Подготовка: Создается набор «подвижных типов» – коротких фрагментов ДНК, содержащих участки для метилирования.
Набор текста: Нужная информация кодируется путем выбора определенных «подвижных типов» и их присоединения к шаблону ДНК.
Запись: Фермент DNMT1 добавляет метильные группы к выбранным участкам ДНК, записывая информацию.
Чтение: Информация считывается с помощью нанопорового секвенирования, которое определяет наличие метильных групп.

Эксперименты и результаты:

Изображения: С помощью нового метода ученые успешно закодировали и декодировали сложные изображения, включая изображение тигра династии Хань и фотографию панды.
Участие студентов: 60 студентов без специальной подготовки смогли закодировать и записать на ДНК тексты по своему выбору, подтвердив доступность метода. Средняя ошибка чтения составила всего 1.4%, и она была полностью исправлена с помощью LLM.

Перспективы:

Новая технология открывает огромные перспективы для долговременного архивирования больших объемов данных, таких как медицинские карты, финансовые отчеты и научные данные. Хотя метод пока дороже традиционных, его потенциал для масштабирования и снижения стоимости огромен. Автоматизация процесса и дальнейшее совершенствование технологии чтения могут сделать ДНК-хранилища данных реальностью в ближайшем будущем.