Биохимики предложили новый метод записи информации на естественные молекулы ДНК, в котором кодирование происходит за счет положения места одноцепочечного разрыва. Запись информации в такую ячейку память застрахована от ошибок при кодировании и происходит гораздо быстрее, чем синтетическое кодирование нуклеотидами, однако пока что новый способ проигрывает в плотности записи. Статья опубликована в журнале Nature Communications.
Впервые идею о хранении цифровой информации в молекуле ДНК затронул в 1959 году американский физик Ричард Фейнман в своей лекции под названием «Внизу полным-полно места: приглашение в новый мир физики». Хранение информации на молекулах ДНК интересно за счет своей колоссальной информационной емкости — в прошлом году ученые записали 16 гигабайт текста английской версии Википедии в одной молекуле ДНК. Кодирование в таких системах происходит за счет синтеза молекулы из определенной последовательности нуклеотидов: аденина, тимина, цитозина и гуанина. Однако у этого подхода есть много ограничений и неудобств. За один цикл к молекуле ДНК добавляется только один нуклеотид, а потому процесс протекает значительное время и требует больших затрат относительно распространенных оптических и магнитных средств записи. Более того сам синтез подвержен ошибкам и даже при оптимальном процессе количество ошибок может достигать 21 процента.
Ольгица Миленкович (Olgica Milenkovic) со своими коллегами предложила новый способ записи информации на молекулы ДНК, полученные из живых организмов, основанный на одноцепочечном разрыве молекулы ДНК с помощью фермента. Ученые таким образом записали и считали информацию на ДНК бактерии кишечной палочки (Escherichia coli) Геттисбергскую речь Линкольна (0,4 килобайта) и фотографию мемориала Линкольна (14 килобайт).
Процесс записи , хранения и чтения информации на разрывах молекул ДНК
Olgica Milenkovic et al. / Nature Communications, 2020
Поделиться
Известные разрывные ферменты — никазы — способны распознавать и связывать только определенные последовательности в цепи ДНК, которые сильно ограничены их окружением. Например, разрывные эндонуклеазы признают только специфические последовательности длиной в шесть пар нуклеотидов, что ограничивает их использование для масштабной записи. Никаза SpCas9n пиогенного стрептококка (Streptococcus pyogenes) часто используется в генной инженерии, но для ее работы требуется два гуанина в цепи подряд, что ограничивает емкость в 16 раз. В качестве такого фермента биофизики предложили использовать фермент пирококка (Pyrococcus furiosus) PfAgo — высокоточный искусственный ограничительный фермент с возможностью расщепления на произвольных частях цепи ДНК. Этот фермент за время своего действия способен совершить сотни разрывов в отличие от SpCas9n и ранее уже использовался для сборки генома и распознавании цепи ДНК.
Кодирование информации с помощью фермента PfAgo
В качестве основы для записи ученые выделили ДНК бактерии кишечной палочки штамма K12 MG1655. При выборе длины цепочки в 450 пар азотистых оснований они руководствовались двумя ограничениями: не менее десяти позиций обрыва с промежутками не менее 25 нуклеотидов и отсутствие диссоциации между участками обрыва.
Для проверки качества записи биофизики закодировали Геттисбергскую речь Авраама Линкольна и фотографию мемориала Линкольна в двоичную последовательность из десятибитовых строк, в которой единица — наличие разрыва, а ноль — его отсутствие в возможном месте разрыва. Затем полученные строки переводили в позиционную систему для сжатия информации вдвое. Чтобы достичь быстрой и эффективной записи данных ученые для каждого регистра создавали библиотеку возможных направляющих фрагментов ДНК для фермента автоматизированной комбинацией вариантов.
Биофизики для хранения информации поместили регистры в сеть микропланшетов, которые обеспечивают произвольный доступ к регистрам и организуют доступ к данным, аналогично дорожкам на CD-дисках и магнитных лентах. Однако авторы признают, что такой метод хранения не годится для масштабируемого производства, тем не менее они надеются на разработку масштабируемых систем позиционного хранения данных с использованием МАЛДИ-пластин или микрофлюидных устройств. Чтобы своими силами улучшить емкостную способность позиционного хранения ученые предложили три варианта улучшения: использование в одной ячейке нескольких регистров, в которых крайне мало пересечение в последовательностях, введение специфичного разрыва в зависимости от цепи — увеличение емкости одного разрыва на 58 процентов, комбинаторное смешивание молекул одного регистра по специальным схемам.
Для считывания информации биофизики подвергали цепь ДНК денатурации и получали одноцепочечные молекулы ДНК с разной длиной в зависимости от положения разрыва. Эти последовательности они сравнивали с известной последовательностью регистра и выстраивали цепочку, определяли возможные позиции разрывов и присваивали ноль, если разрыв в этом потенциальном месте отсутствовал. В качестве неразрушающего метода считывания информации авторы рассмотрели два варианта: внедрение в разрыв флуоресцентного гена или прохождение молекулы ДНК сквозь двумерную нанопористую мембрану дисульфида молибдена — на зависимости ионного тока от времени отчетливо заметно положение одноцепочечного разрыва. А для подтверждения своей гипотезы они смоделировали прохождение молекулы ДНК через нанопору.
Схема прикрепления в место разрыва зацепки с флуорисцирующим компонентом
Измерения ионного тока и проводимости мембраны в процессе прохождения молекулы ДНК через нанопору, t_dna — время прохождения всей молекулы, t_n — время прохождения разрыва
1/2
ДНК уже несколько лет используется в качестве экзотического средства записи. Два года назад группа Massive Attack к 20-летнему юбилею своего альбома «Mezzanine» записала его в ДНК.
Артем Моськин
https://nplus1.ru/