Революция в хранении данных: запись информации на ДНК выходит на новый уровень
Идея использовать ДНК для хранения данных, впервые предложенная Ричардом Фейнманом еще в 1950-х, наконец обретает практические очертания. В природе ДНК хранит генетическую информацию с невероятной плотностью (один грамм может вместить более 200 петабайт) и долговечностью (тысячи лет). Предыдущие эксперименты, такие как запись книги в ДНК (2012 г.), всей Википедии (2019 г.) и эпизода сериала «Биохакеры» (2020 г.), подтвердили потенциал этой технологии, но столкнулись с ограничениями в скорости и стоимости записи.
Прорыв совершила команда ученых из Пекинского университета, разработав метод параллельной записи и чтения информации на ДНК. Опубликованная в Nature статья описывает технологию, которая не только ускоряет процесс, но и делает его значительно более доступным, даже с привлечением больших языковых моделей (LLM) для коррекции ошибок.
В чем суть инновации?
Прежние методы записи данных на ДНК основывались на синтезе — последовательном добавлении нуклеотидов (A, T, C, G) к цепочке ДНК. Этот процесс был медленным, дорогим и требовал участия квалифицированных специалистов. За один раз записывался всего один бит информации.
Новый метод использует шаблоны ДНК, аналогичные тем, что существуют в живых клетках. Информация записывается путем добавления метильных групп к определенным участкам ДНК. Этот процесс, напоминающий «молекулярную печатную машинку», позволяет записывать до 350 бит за один раз, значительно увеличивая скорость и снижая стоимость.
Как это работает?
- Подготовка: Создается набор «подвижных типов» – коротких фрагментов ДНК, содержащих участки для метилирования.
- Набор текста: Нужная информация кодируется путем выбора определенных «подвижных типов» и их присоединения к шаблону ДНК.
- Запись: Фермент DNMT1 добавляет метильные группы к выбранным участкам ДНК, записывая информацию.
- Чтение: Информация считывается с помощью нанопорового секвенирования, которое определяет наличие метильных групп.
Эксперименты и результаты:
- Изображения: С помощью нового метода ученые успешно закодировали и декодировали сложные изображения, включая изображение тигра династии Хань и фотографию панды.
- Участие студентов: 60 студентов без специальной подготовки смогли закодировать и записать на ДНК тексты по своему выбору, подтвердив доступность метода. Средняя ошибка чтения составила всего 1.4%, и она была полностью исправлена с помощью LLM.
Перспективы:
Новая технология открывает огромные перспективы для долговременного архивирования больших объемов данных, таких как медицинские карты, финансовые отчеты и научные данные. Хотя метод пока дороже традиционных, его потенциал для масштабирования и снижения стоимости огромен. Автоматизация процесса и дальнейшее совершенствование технологии чтения могут сделать ДНК-хранилища данных реальностью в ближайшем будущем.