А.В.Никитин

Триплеты в ДНК

Что-то много вопросов возникает. Надо бы еще раз вернуться к ДНК и генетическому коду. К несоответствию того, что уже мной написано в [1] с тем, что мы читаем в уважаемых источниках.

Свойства генетического кода по Википедиии [5]:

1. Триплетность — значащей единицей кода является сочетание трёх нуклеотидов (триплет, или кодон).

2. Непрерывность — между триплетами нет знаков препинания, то есть информация считывается непрерывно.

3. Неперекрываемость — один и тот же нуклеотид не может входить одновременно в состав двух или более триплетов. (Не соблюдается для некоторых перекрывающихся генов вирусов, митохондрий и бактерий, которые кодируют несколько белков, считывающихся со сдвигом рамки).

4. Однозначность (специфичность) — определённый кодон соответствует только одной аминокислоте. (Свойство не является универсальным. Кодон UGA у Euplotes crassus кодирует две аминокислоты — цистеин и селеноцистеин)^[1]

5. Вырожденность (избыточность) — одной и той же аминокислоте может соответствовать несколько кодонов.

6. Универсальность — генетический код работает одинаково в организмах разного уровня сложности — от вирусов до человека (на этом основаны методы генной инженерии) (Из этого свойства также есть ряд исключений, см. таблицу в разделе «Вариации стандартного генетического кода» в данной статье).

7. Помехоустойчивость — мутации замен нуклеотидов не приводящие к смене класса кодируемой аминокислоты, называют консервативными. Мутации замен нуклеотидов, приводящие к смене класса кодируемой аминокислоты, называют радикальными.

У меня лично вызывают особое уважение пункты 3 и 6.

Если пункт 3 верен, то неверен пункт 6, и наоборот. Почему так? Потому, что они говорят о разных ДНК. Неперекрываемость триплетов при считывании информации означают их параллельное или независимое считывание, а единство ДНК от вируса до человека должно подразумевать и последовательное перекрываемое считывание информации с триплетов. Скакать через три ступеньки аппарат считывания ДНК не умеет. Значит, ДНК – разные?

В одной ДНК, как мы знаем, запись сделана парами А-Т и Ц-Г, а в другой – видимо, сразу триплетами, которые и образуют единицу считывания информации. Как иначе понять пункт 3 и пункт 6?

Описание из Википедии [4]: «В зависимости от концентрации ионов и нуклеотидного состава молекулы, двойная спираль ДНК в живых организмах существует в разных формах. На рис. 1. представлены формы A, B и Z (слева направо)».

800px-A-DNA,_B-DNA_and_Z-DNA

Рис.1. Виды ДНК.

Что и где тут принять за триплет считывания? Связи А-Т и Г-Ц видны, так или иначе, но как определить, где начинается один триплет и заканчивается другой? Для автомата считывания триплетов это должно быть четким «якорем», точкой фиксации. Форма В имеет четкую структурную периодичность, но и тут нет места фиксации для надежного считывания триплетов.

Автомат считывания триплетов почти не дает сбоев в работе. Как он «умудряется» делать эту работу на цепях длиной в миллионы единиц считывания?

Ладно, смотрим процесс репликации ДНК по Википедии [8]. Это на рис.2.:

Рис.2. Схематическое изображение процесса репликации, цифрами отмечены: (1) запаздывающая нить, (2) лидирующая нить, (3) ДНК полимераза (Polα), (4) ДНК лигаза, (5) РНК праймер, (6) ДНК праймаза, (7) фрагмент Оказаки, (8) ДНК полимераза (Polδ), (9) хеликаза, (10) одиночная нить со связанными белками, (11) топоизомераза

Правда, тут оцифровка объектов не соответствует направлению процесса. На самом деле он идет тут справа налево, но это мелочи. Копирование есть, а триплетов что-то не видно…

Хорошо, заглянем в синтез белка рис.3. [9]. А вот тут считывание, видимо, идет даже двух кодонов сразу. Так, по крайней мере, это выглядит. С мРНК, что на рис.4. [10]. К ней мы еще вернемся. Пока посмотрим на рис.3. Триплеты четко показаны, и место фиксации есть, но это лишь схема. Рибосома - автомат считывания кодонов и сборки белка по рисунку имеет два участка работы с тРНК. На участке А происходит захват нужной тРНК, имеющей нужный код и аминокислоту на «хвосте», на участке Р происходит собственно сборка белка. Аминокислота снимается с тРНК и присоединяется к цепочке белка. Отработанная тРНК покидает зону…

Верхняя и нижняя части рибосомы на рисунке названы малой и большой субъединицами.

Рис.3.Схема синтеза белка рибосомой

Рис.4.Основные этапы жизненного цикла мРНК эукариот.

Есть в рисунке одна сложность. Если процесс работы на участках А и Р последовательный, т.е. на одном участке идет опознавание кода, а на другом сборка, то рибосома должна после считывания кода перебрасывать нужную тРНК с участка А на участок Р и сдвигаться по мРНК на один триплет. И очевидно, автор рисунка полагает, что для СТОП-кодона существует и тРНК без аминокислоты. Она обрывает сборку белка. Но, это к специалистам…

Вот теперь к рис.4. Никакие схемы и рисунки не показывают отдельные триплеты и места фиксации, наоборот, везде подчеркивается, что основания мРНК полностью повторяют ДНК и идут непрерывной линией. Вопрос о триплетах опять повис в воздухе….

Пункт 2 свойств генетического кода ДНК справедливо указывает на непрерывность оснований в цепочке ДНК. А счет, все же, идет кодонами. Каким образом?

Почему триплетов из двух пар нуклеотидов - 64, а аминокислот, которые триплеты кодируют в ДНК - 20? И, чтобы "воткнуть" 21-ую аминокислоту в этот список, клетке понадобилось не только "отменить" триплет "СТОП" частично, но и изменить головки считывания триплетов в ДНК. И при этом все биологи, да и математики говорят об "избыточности" кодирования, ссылаясь на то, что 4³ =64 комбинации?

Если из 64 комбинаций занято реально только 21, то в чем сложности использования еще 43 "свободных" номеров?

Я уже показывал [1], что никакой "избыточности" нет, есть жесткая недостаточность триплетов кодирования. Она возникает от способа считывания. Не может клетка считать триплетами. Нет у неё такого счетного механизма. Только по одному нуклеотиду.

Считывающее устройство двигается на РНК как замочек на молнии. Каждый раз только на 1 зубчик. Вот это важно. А учитывает считывающее устройство тот "зубчик", на котором находится, а также тот, что слева и тот, что - справа. Вот и получается - триплет считывания. При таком считывания только каждый третий триплет - независимый, может иметь любой код, а остальные - переходные. Вот и получается 64/3=21 триплет. 20 аминокислот и "СТОП". Никакой избыточности.

20 аминокислот, в общем случае пока больше нет, а возможных кодов - 64. Пропуски в ходе сборки белка невозможны. Значит должны быть задействованы все возможные комбинации.

Вот тут и возникают дополнительные коды из оставшихся 43 зависимых комбинаций для одной и той же аминокислоты. Теперь уже и в зависимости от частоты её применения. Часто применяемые аминокислоты получили до 6 дополнительных кодов, а какой-то редкой и одного "за глаза"...

Здесь начинаются сложности для исследователей. Какой код - главный, а какие - дополнительные? Но, пока не до этого, видимо. Биологи пока просто пересчитали все коды для каждой аминокислоты, сложили в таблицу и пользуются. Эта таблица кодов в каждом учебнике биологии имеется. АТСГ во всех вариациях. Это первые буквы названий четырех оснований ДНК. Они парные А-Т и С-Г.

Они так парами в двойной спирали ДНК и стоят, как гантель. При резке ДНК для начала считывания кодов все гантели и режутся пополам, в цепочке остается одно основание из пары, другое - в другой половинке ДНК. На половину ДНК заходит считывающий автомат ... и начинается процесс.

Но вот незадача: Коды ДНК оказываются и перекрываемые, и зависимые, и вырожденные, и избыточные…

Наши крупные ученые-биологи, кажется, понимают сложность этого вопроса, и о триплетах кодирования на ДНК говорят уклончиво, не вдаваясь в подробности. Как пример, статья С. Г. ИНГЕ-ВЕЧТОМОВА [2]. А остальные пишут о триплетном способе кодирования и чтения, как о давно известном факте, не требующем доказательств и понимания. Например, статья Л.П.Овчинникова [11], где четко показывается линейка кодонов без перекрытия и зависимости… с возможными возникающими отклонениями от этого общепонятного понимания.

Общепринятое понимание такое: триплеты считывания на ДНК выстроены в одну линию, по три основания в каждом триплете. Автомат считывания читает первую тройку оснований, потом переходит ко второй, и далее по порядку…, единицей кода становится кодон.

Так в общем случае, а в частности читаться может только первое и второе основание, а затем сразу четвертое, за пределами этого кодона считывания, а третье основание…, ну да ладно, зачем нам сложности…

При таком понимании триплета оснований каждый код триплета – независим. Потому, что неважно, что было до него и будет после. Какой надо, тот и будет.

Тогда избыточность кодирования аминокислот теряет смысл. Можно просто повторять один и тот же код много раз, в зависимости от частоты применения. Зачем нужны другие коды для одной аминокислоты? Но, если они есть, то … почему?

Общепринятое понимание на этот вопрос не отвечает. Нам, дилетантам, сложно понять, как считают специалисты, возможно, мы упускаем какой-то нюанс в понимании триплетного кодирования ДНК, потому и триплет там найти не можем. Тогда, дайте точное описание этого, в общем, счетного и вполне механического процесса, так, чтобы мы поняли…

Екатеринбург

Август 2010г.

Литература:

1. А.В.Никитин Эволюционный путь саморазвития искусственного интеллекта. http://trinitas.ru/rus/doc/0016/001c/00161450.htm

2. Трансляция как способ существования живых систем, или в чем смысл "бессмысленных" кодонов С. Г. ИНГЕ-ВЕЧТОМОВ Санкт-Петербургский государственный университет http://nature.web.ru/db/msg.html?mid=1157633&s

3. Кодон http://ru.wikipedia.org/?oldid=25897838

4. ДНК http://ru.wikipedia.org/?oldid=26867781

5. Генетический код http://ru.wikipedia.org/?oldid=26587546

6. Мусорная ДНК http://ru.wikipedia.org/?oldid=24025991

7. Биоинформатика http://ru.wikipedia.org/?oldid=25242099

8. Репликация ДНК http://ru.wikipedia.org/?oldid=26760389

9. Биосинтез белка http://ru.wikipedia.org/?oldid=26486757

10. мРНК http://ru.wikipedia.org/?oldid=26748019

11. Что и как закодировано в мРНК Л. П. ОВЧИННИКОВ Московский государственный университет им. М.В. Ломоносова http://nature.web.ru/db/msg.html?mid=1157645&s