Никитин А.В.

Проблемы понимания системы кодирования ДНК

 

Да, надо признать, что я оказался неправ. Волнует биологов кодирование информации ДНК. Даже очень. И технократический подход к этой проблеме есть. Может быть не совсем такой, как хотелось мне, но … есть заинтересованность в нахождении истины. И это главное.

Петр Петрович Гаряев прислал мне свою последнюю монографию для изучения и понимания, за что ему отдельная благодарность.

Но, вместе с новой информацией возникли и новые вопросы. О некоторых из них я и попробую рассказать в этой статье.

 

Два пишем, один - в уме…

Нечеткое следование триплетам при трансляции белка мы уже отмечали [7]. Тот же вопрос исследует и П.П.Гаряев. Вот фиксируется видимое противоречие:

 

«Точность кодирования последовательностей аминокислот белков в этой модели странным образом уживается с двойной вырожденностью предлагаемого “кода” по линиям избытка транспортных РНК (тРНК) по сравнению с числом аминокислот и неоднозначного соответствия кодон-антикодон, когда только двум (а не трем) нуклеотидам триплетов иРНК необходимо точное спаривание c антикодоновой парой нуклеотидов тРНК, а по третьему нуклеотиду природой допускается неверное спаривание, так называемое “воблирование” (от англ. слова “wobble”- качание) по гипотезе Ф.Крика [4]. Это означает, что некоторые антикодоны могут “узнавать” более одного кодона в зависимости от того, какое основание находится в 1-м положении антикодона, соответствующем 3-му положению нуклеотида с учетом их антипараллельного комплементарного взаимодействия. “Узнавание” такого рода “неправильное”, если следовать парадигме генетического кода, поскольку возникают неканонические пары оснований “Аденин-Гуанин”, “Урацил-Цитозин” и другие с энергетически невыгодными водородными связями. “Код”, особенно митохондриальный, становится настолько вырожденным, и логически следующий отсюда произвол включения аминокислот в пептидную цепь столь велик, что как бы исчезает само понятие генетического кодирования». [2]

 

Вопрос поставлен:

 

«Точность белкового синтеза эволюционно консервативна и высока, но может ли она достигаться такого рода “тайнописью”, когда “знак” (кодон) и “обозначаемое” (аминокислота) не всегда изоморфны, не однозначны? Если придерживаться старой догмы генетического кода, логично думать, что две разные аминокислоты, шифруемые двумя одинаковыми (третий не важен) нуклеотидами кодонов иРНК, будут с равной вероятностью включаться в пептидную цепь, т.е. случайно. И таких парных неоднозначностей даже в немитохондриальном коде насчитывается шесть, если не считать еще две по стоповым кодонам (они же “нонсенс” или бессмысленные). Так что же, существует “индульгенция разрешения” частых и случайных замен аминокислот при синтезе белков? Однако, известно, что такие случайные замены в большинстве случаев имеют самые отрицательные последствия для организма (серповидная анемия, талассемии и т.д.). Налицо явное противоречие: нужна точность (однозначность) отношений “знак-обозначаемое” (кодон-аминокислота), а придуманный людьми код ее не обеспечивает». [2]

Объяснения сути противоречий и предложенного варианта решения:

 

«Видно, что пары разных аминокислот шифруются одинаковыми значимыми дублетами кодоновых нуклеотидов (“воблирующие” мало значимые, по Крику [4], и вообще нечитаемые, по Лагерквисту [11], нуклеотиды смещены в индекс). В терминах лингвистики это явление носит название омонимия, когда одни и те же слова имеют разный смысл (например, русские слова “лук”, “коса” или английские “box”, “ring” и т.п.). С другой стороны, избыточные различающиеся кодоны, обозначающие одни и те же аминокислоты, уже давно рассматривают как синонимичные». [4]

«…Для большей иллюстративности мы приводим таблицу генетического кода, представленную Лагерквистом и перегруппированную им по кодоновым семействам с ориентировкой на первые два рабочих нуклеотида:

Табл. 1

UUU Phe

UUC »

UUA Leu

UUG »

 

CUU Leu

CUC »

CUA »

CUG » 

AUU Ile

AUC »

AUA »

AUG Met 

GUU Val

GUC »

GUA »

GUG » 

UCU Ser

UCC »

UCA »

UCG »

 

CCU Pro

CCC »

CCA »

CCG »

 

ACU Thr

ACC »

ACA »

ACG »

 

GCU Ala

GCC »

GCA »

GCG »

 

UAU Tyr

UAC »

UAA Och

UAG Amb

 

CAU His

CAC »

CAA Gln

CAG »

 

AAU Asn

AAC »

AAA Lys

AAG »

 

GAU Asp

GAC »

GAA Glu

GAG »

 

UGU Cys

UGC »

UGA Umb

UGG Trp

 

CGU Arg

CGC »

CGA »

CGG »

 

AGU Ser

AGC »

AGA Arg

AGG »

 

GGU Gly

GGC »

GGA »

GGG »

 

 



Из Табл.1. видно, что одна и та же аминокислота может кодироваться четверками кодоновых семейств. Например, четверка CU-семейства кодирует лейцин. Четверка GU-семейства кодирует валин, UC – серин, CC – пролин, AC – триптофан, GC – аланин, CG –аргинин, GG – глицин. Это лежащий на поверхности, и сразу замеченный, факт вырожденности, т.е. информационной избыточности кода. Если взять взаймы понятия и термины лингвистики для белкового кода, что давно, повсеместно и с легкостью принято, то вырожденность кода можно понимать как синонимию. Это также единогласно принято. Иначе говоря, один и тот же объект, например, аминокислота, имеет несколько шифров — кодонов. Синонимия не таит в себе никаких опасностей для точности биосинтеза белков. Наоборот, такая избыточность хороша, поскольку повышает надежность работы трансляционной рибосомной «машины»». [4]

 

Я внес небольшое цветовое разнообразие в таблицу, чтобы было видно то, о чем мы говорим. Синонимические четверки выделены желтым цветом. Всего таких четверок – 8. Омонимические четверки пришлось разделить на три категории, по степени разнообразия. Далее:

 

«… Однако на Табл.1 видно и другое, фундаментальное, генолингвистическое явление, как бы не замечаемое или игнорируемое. Это явление обнаруживается в том, что в некоторых кодоновых семействах четверки кодонов, точнее, их значащие одинаковые двойки нуклеотидов шифруют не одну, а две различные аминокислоты, а также стоп-кодоны. Так, дублетное UU-семейство кодирует фенилаланин и лейцин, AU – изолейцин и метионин, UA – тирозин, Och и Amb стоп-кодоны, CA – гистидин и глицин, AA – аспарагин и лизин, GA – аспарагиновую и глутаминовую, UG – цистеин, триптофан и Umb стоп-кодон, AG – серин и аргинин. Продолжая лингвистические аналогии, назовем это явление ОМОНИМИЕЙ первых двух кодирующих нуклеотидов в некоторых кодоновых семействах.

В отличие от синонимии, омонимия потенциально опасна, что и отметил Лагерквист, хотя и не ввел термин-понятие «омонимии» в применении к белковому коду. Такая ситуация, вроде бы, действительно должна вести к неоднозначности кодирования аминокислот и стоп-сигналов: один и тот же кодоновый дублет, в пределах некоторых выделенных Лагерквистом семейств, кодирует две разных аминокислоты или является «разностоповым».

Принципиально важно понять: если синонимия кода — это благо (избыток информации), то омонимия — потенциальное зло (неопределенность, неоднозначность информации). Но это мнимое зло, поскольку белок синтезирующий аппарат легко обходит эту трудность, о чем речь пойдет ниже. Если же автоматически следовать таблице (модели) генетического кода, тогда зло становится не мнимым, но реальным. И тогда очевидно, что омонимический вектор кода ведет к ошибкам в синтезе белков, поскольку рибосомный белоксинтезирующий аппарат, каждый раз встречаясь с тем или иным омонимичным дублетом и руководствуясь правилом чтения «два из трех», должен выбрать одну и только одну аминокислоту из двух различных, но кодируемых неоднозначно тождественными дублетами-омонимами.

Следовательно, связки 3’- нуклеотиды в кодонах и спаривающиеся с ними 5’- нуклеотиды в антикодонах, не имеют гено-знакового характера и играют роль «стерических костылей», заполняющих «пустые места» в кодон-антикодоновых парах. Короче говоря, 5’- нуклеотидs в антикодонах случайны, «воблируют» — от английского ‘wobble’ (качание, колебание, виляние). Вот суть Вобл-гипотезы». [4]

 

Суть изложена вполне четко. Перевод не требуется. Проблема понятна.

Cтоп-кодоны и старт-кодон, они в таблице выделены жирным шрифтом, тоже работают не всегда однозначно, а в зависимости от чего-то…, как полагают биологи, от контекста.

Далее я читал очень внимательно:

 

«Продолжим анализ основополагающей работы Крика и Ниренберга, постулирующей понятие генетического кода.

С.142 -143: “ ... до сих пор все опытные данные хорошо согласовывались с общим предположением о том, что информация считывается тройками оснований, начиная с одного конца гена. Однако, мы получили бы те же результаты, если бы информация считывалась группами в четыре или даже более оснований” или “...группами, содержащими кратное трем число оснований”. Это положение почти забыто или не понято, но именно здесь видно сомнение, обязательно ли код триплетный. И не менее важно, что предугадано будущее понимание текстов ДНК и РНК как смысловых фрактальных образований, родственных естественным языкам, что продемонстрировано в наших исследованиях [25,26,29]». [2]

 

При 4 разных основаниях системы кодов ДНК группы считывания могут быть только по 3 или по 4 основания. 4 основания при парном чтении дают только 16 возможных комбинаций. Не хватает. А вот сколько: 3 или 4 основания в группе считывания, математически установить невозможно. Потому, что так или иначе использованы будут все возможные комбинации. Или 64 при триплете, или 256 при тетраплете.

При увеличении зоны считывания кода «группами, содержащими кратное трем число оснований» количество возможных комбинаций кода будет нарастать неограниченно. Только что это нам дает? Если ориентироваться на кодирование аминокислот, то… ничего. А с дублетным подходом биологов это и вообще никак не совмещается.

Но, главное, в этой цитате впервые, хоть и неявно появилась «зона считывания» информации, не соответствующая триплету. Триплет – одно, а зона считывания – другое. И одно может не совпадать с другим. Очень важное замечание.

По сути дела, теория «качания» предлагает считать зоной считывания кодона только первые два основания. Т.е. в данном случае предлагается признать, что зона считывания меньше зоны кодирования.

Теперь рассмотрим и обратный подход:

 

«Некоторые мРНК содержат сигналы на изменение рамки считывания. Некоторые мРНК содержат в транслируемой области терминирующие кодоны, но эти кодоны успешно обходятся за счет изменения рамки считывания перед ними или непосредственно на них. Рамка может сдвигаться на -1, +1 и + 2. Существуют специальные сигналы в мРНК, изменяющие рамку считывания. Так, сдвиг рамки трансляции на -1 на РНК ретровируса происходит на специфической гептануклеотидной последовательности перед шпилечной структурой в мРНК (рис. 5, в). Для сдвига рамки на +1 на мРНК бактериального фактора терминацинации RF-2 важны нуклеотидная последовательность на месте сдвига (кодон UGA), последующий кодон, а также предшествующая им последовательность, комплементарная к 3'-концевой последовательности рибосомной РНК (аналог последовательности Шайна-Дальгарно) (рис. 5, г)». [6].

 

Цитата уже приводилась ранее [7], но теперь посмотрим на её содержание более внимательно. Что понимается под термином – рамка считывания? Это понятие из седой старины вычислительной техники, когда зона считывания информации с перфоленты или перфокарты ограничивалась непрозрачной рамкой, чтобы уменьшить опасность ошибки при считывании информации световым потоком на фотоприемник через отверстия в карте или ленте, выбитые в нужных местах строки разметки. Принцип считывания давно ушел, а термин остался. Так как понятие рамки считывания понятно всем биологам, то видимо оно означает зону считывания только одного основания из триплета. И под «сдвигом рамки считывания» надо понимать, что при +1, читается основание, следующее за последним элементом триплета, а -1, что считывается основание перед первым элементом все того же триплета. Какая пара оснований при этом остается основой в считываемом триплете? Это не уточняется…

Но, похоже, не все понимают рамку считывания, как в данном случае. Если под понятием рамки считывания понимать рамку, ограничивающую 3 основания, то при сдвиге +2 от читаемого триплета остается 1 элемент, а два – из соседнего.

Так о какой рамке считывания все же идет речь? Ну, да, ладно, пусть пока остается неясность…

Но в любом случае, потом эти основания, уже считанные рамкой снова будут читаться, когда рамка вернется на место и рибосома перейдет к чтению следующего триплета…, а как же неперекрываемость кода?

В данном случае, механистический подход биологов к оценке изменения позиций считывания триплета не учитывает реальный размер того, о чем они говорят. Терминология явно вводит в заблуждение. Как они сами в этом потом разбираются – непонятно. Очевидно, что никакая «рамка» никуда не двигается…

Двигается выборка нужных позиций в зоне считывания. И если сложить максимальные приведенные в выше сдвиги «рамки» считывания с длиной читаемого кодона, то получим: 2+3+2 = 7. Таким образом, общая ширина зоны считывания рибосомы составляет уже 7 оснований. Рибосома выбирает триплет из 7 возможных оснований. Как? Это уже другой вопрос…

Но нам важнее другое. Теперь можно реально оценить, что зона считывания информации с РНК может быть больше триплета и составлять 7 и более оснований, при этом, как необходимые позиции считывания, фиксируются только три основания. А что такое, остальные позиции? Возможно, тот самый «контекст», который и меняет варианты считывания триплета. Омонемические, по терминологии П.П.Гаряева.

Конечно, это только один из множества частных случаев понимания многостороннего понятия контекста. Но …, по крайней мере, он позволяет понять кое-что, не прибегая к высшим философским обобщениям. На вполне реальном уровне механистического понимания.

Об алфавите клеточных текстов.

Вопрос, конечно, интересный…

О понимании оснований ДНК, как букв какого-то клеточного алфавита принято биологами на вооружение давно. Отсюда и возникновение понятия смыслового контекста в оценке триплетного кодирования, и поиск осмысленного подхода клетки к этому кодированию, и постепенный переход к Высшему Разуму, написавшему эту книгу Жизни…

Только вот, с точным указанием букв этого алфавита все время возникают разногласия. Что принимать за буквы? Основания (А,Т,С,G), кодоны, составленные из них, или аминокислоты в составе получаемого при трансляции белка?

Оснований – 4, аминокислот – 20, кодонов – 64, что взять за основу?

О необходимости лингвистической оценки последовательностей ДНК, РНК и белковых молекул говорят все, независимо от понимания букв клеточного алфавита. Подходить к информации ДНК, как к смысловому тексту с пониманием контекста применимого для литературной оценки, так требуют понимать биологи. Таким образом, предполагается, что исследуемый язык обладает всеми атрибутами развитого литературного языка и нужен соответствующий подход к оценке его многосмысловой информативности.

Прекрасно. И все же, буквы – где? Чем написан этот литературный текст, требующий такого пристального внимания лингвистов? Пока в рамках того же механистического подхода…

Основания или нуклеотиды? Похоже – нет. С этим соглашается основная масса биологов. Маловато 4-х оснований для создания литературного текста. Да еще при наличии непрерывности последовательности на всем протяжении ДНК.

С кодоном, как буквой этого алфавита трудности возникают сразу. Где он, этот кодон, на ДНК и РНК, как его найти? Это может сделать только рибосома, и то, только при непосредственном контакте. Да и что это за составные буквы такие, из триплетов? Сложно понять. Тем не менее, у этого понимания кодонов, как букв клеточного алфавита, сторонников достаточно.

Принять за буквы алфавита аминокислоты? Да, с этим согласно большинство. Но, тогда Книгой Жизни становится белок, а не ДНК. В белке смысловой контекст есть, а в ДНК, получается, может и не быть? Или будет, но другой, отличный от белкового…

И потому, требование оценки и ДНК, и белка с позиций смыслового контекста есть, а уточнения, что и как все же надо оценивать – нет.

П.П.Гаряев в этой ситуации предложил, в том числе и лингвистически, оценивать не ДНК и белок, а их голографические объемные «портреты». Очень сильная позиция, надо признать. И очень продуктивная…

Но вот с алфавитом клетки при механистическом, привычном уже подходе, тогда совсем непонятно. Есть он, или его нет совсем, и это понятие только аллегория?

Биологи уточнений не дают. Но упорно продолжают применять это понятие. Каждый - в своем понимании…

Об исходной системе кодирования.

Именно об исходной, которая была, возможно, на этапе разделения клеток на прокариоты и эукариоты. Сейчас она скрыта многочисленными наложениями и отклонениями и у тех, и у других. Миллионы лет эволюции бесследно не прошли.

И все же…

Не всегда ДНК была хранилищем информации, раньше эту роль могла исполнять РНК. Она вполне заменяла и белок на каком-то этапе. Об этом говорят многочисленные исследования. И оснований ДНК и РНК не всегда было 4, но мы сейчас не об этом…

Но на каком-то этапе развития появилась система кодирования информации, тогда вполне удовлетворяющая всем требованиям информационной и логической структуры управления процессами клетки.

Та самая классика, на которую все указывают, и тут же начинают опровергать…

Итак.

Информационный массив – ДНК, РНК. Последовательность, состоящая из комбинации 4 нуклеотидов: A,T(U),C,G.

Шаг считывания информации – 1 нуклеотид.

Метод считывания информации – последовательный.

Объем разового считывания – триплет.

 

Ни одна логическая система считать не умеет. Но, вот считать до одного она в состоянии. Это дальше уже - много. И различать разные единицы в двух соседних парах – тоже. И если ось симметрии вещественная, то определять логические состояния соседних позиций относительно такой оси, она вполне в состоянии. Но, вот дальше увеличивать зону чтения без счета на том этапе видимо было очень трудно.

И потому, на том этапе – триплет, это максимально возможная форма единицы информации системы. Разряд на оси симметрии, разряд справа и разряд – слева.

Три разных единицы учета… даже для шагового чтения… это много.

В системе кодирования информации ДНК и РНК применено 4 возможных логических состояния, триплетное считывание. Сложность для клетки – предельная.

Как доказать триплетность кода? Это я уже показывал и не раз. Напишем еще раз: Оснований – 4, аминокислот – 20, кодонов или триплетов – 64.

Математика простая: 64/3 = 21

Такое количество неперекрываемых триплетов возможно получить при шаге фиксации через одно основание. Это 20 триплетов для аминокислот и один СТОП-кодон.

С другой стороны: 43 = 64, это те же 21х3=63, это 60 комбинаций триплетов , 3 стоп кодона и старт-кодон, замыкает вариационное множество. Это просто математика, но... она показывает, что первоначально, действительно считывались три подряд основания - кодон при шаге в 1 основание. Это и обусловило применяемое количество аминокислот - 20. Таким образом, все же - триплет.

В этом случае понятна вырожденность кода аминокислоты в триплете. Она возникла от перекрываемости кода.

Мы неверно понимаем появление вырожденности кодонов. Это не расширение возможностей системы в кодировании информации, а «ошибки её прошлого». Это отголосок исходной системы кодирования…

Информация на тему:

 

«С.153: “ ... одна аминокислота шифруется несколькими кодонами. Такой код называется вырожденным ... такого рода вырождение не говорит о какой-то неопределенности в построении молекулы белка ... оно лишь обозначает, что определенная аминокислота может быть направлена в соответствующее место цепи молекулы белка с помощью нескольких кодовых слов”. [2]

 

Конечно, для кодирования любой аминокислоты в основаниях ДНК достаточно одного кодового триплета. Тем более, при неперекрываемом кодировании. Повторяй один кодон сколько угодно раз, и получай столько молекул нужной аминокислоты в белке. Легко, просто, понятно, и энергозатраты минимальны.

Вырожденность кода триплета – вынужденная мера, впрямую связанная с первоначальным способом считывания кода. Так уж получилось в ходе эволюции.

Механизм появления вырожденности кода выглядит вот так:

При шаге считывания триплетов в 1 основание за каждый шаг меняется только один знак триплета, а два знака триплета остаются постоянными. Только синхронно сдвигается их позиции. При двух шагах неизменной остается информация только одного знака триплета, но она проходит последовательно по всем позициям отображения.

Зачем нам это?

При 3 кодирующих знаках на каждом шаге повторяются 2 знака. И лишь один изменяется. На следующем шаге изменится и второй знак. И один знак останется неизменным на пройденном пути. Полная смена знаков наступит только после третьего шага. Только теперь новая комбинация триплета не будет иметь влияния от предыдущих сочетаний.

При триплетном шаге каждый новый триплет в формировании не зависит от предыдущего, но… такой шаг для такой считывающей системы тогда был невозможен.

И формируемые триплеты ДНК оказывались при чтении зависимыми друг от друга.

Такое плавное перетекание одного триплета в другой приводит к ограничению возможности быстрого использования всех перестановок в триплете. Для возможного использования всех 64 вариантов триплета необходимо 64*3 = 192 единичных шага считывания триплетов ДНК. И наоборот, из 64 шагов считывания возможных комбинаций при последовательном шаговом чтении всех кодонов, от первой до 64-ой, будет 42 повтора, а уникальных будет не более 1/3 = 21 комбинация. И еще 1/3….

Вот и ответ, почему аминокислот только 20. Можно было бы и больше, да система кодирования и считывания информации не позволяет. [3]

Вот и стала клетка использовать дополнительные коды из имеющихся 42 повторов. Иначе она и не могла, потому, что пробелы в трансляции недопустимы. Есть код - любой, и рибосома должна выполнить операцию трансляции. Переходные варианты от одного независимого кода триплета к другому стали быстро заниматься теми же 20-ю аминокислотами, но уже в зависимости от частоты применения. Для одной -6 кодов, а другой и одного хватает. Мы это и регистрируем, как вырожденность кода.

Понятно, что при использовании зависимых кодонов должна была расширяться и база транспортных тРНК. Так и произошло. При полномасштабной системе количество кодонов иРНК должно соответствовать количеству антикодонов на тРНК. Так что, большое количество тРНК говорит только о том, что система изначально формировалась именно таким способом.

Как мы видим, первоначальная или исходная система кодирования на этапе появления 4 нуклеотидов в ДНК хорошо просматривается. Далее уже пошли наслоения поздних эволюционных процессов. И сегодня мы имеем…то, что имеем.

Начальные основные коды аминокислот.

С другой стороны, если следовать по этому пути, то из 64 возможных можно выбрать какие-то 21 комбинаций и применить, как основные. Но, какие?

Как клетка могла выбирать? Самый простой ответ – по максимальной симметрии триплета.

Применим принцип симметричности в поиске нужных сочетаний и проверим, насколько мы правильно поняли путь природного кодирования аминокислот в ДНК. Для этого соберем все варианты симметричных кодов в таблицу 2. Отличный результат…, 15 из 16 возможных аминокислот получили симметричные коды.

Но, осталось еще 5 аминокислот и СТОП.

Видимо Природа шла тем же путем, … и споткнулась на том же месте. Все симметричные варианты использованы, запаса для расширения системы нет, а кодов не хватает. Какой следующий вариант применила она для продолжения поиска кодов?

Теперь повторы и один добавочный элемент…

Есть. CAA, AAC, UGG, и вот он основной Стоп-кодон – UAA.

Осталось найти еще два кодона…

GAC и AUG. Последний и стал Старт-кодоном…

И общее количество основных сочетаний используемых в ДНК и РНК стало – 21. Таблица 2 отражает путь поиска основных кодовых обозначений.

Но и тут эволюционная логика развития показывает интересный пример. До конца и сразу использованы только полные симметрии. Остальные варианты использованы не сразу и не полностью. Например, для аминокислоты Gly использован основной кодон GGG, а потом добавлен GGU, из неиспользованного резерва…

Созданные резервы кодирования работали до последнего. Сегодня все резервы давно использованы и пришло время совмещения функций, где это возможно. Например, для Старт-кодона. Начался поиск новых путей в расширении возможностей триплетного кодирования. аминокислот в РНК. Вот примерно так, возможно, шел отбор основных кодов. По симметрии и простейшим перестановкам…

 

Таблица 2

 

 

Аминокислота

Основной

информационный

код по РНК

1

Phe

UUU

2

Pro

CCC

3

Lys

AAA

4

Gly

GGG

5

Ile

AUA

6

Arg

AGA

7

Thr

ACA

8

Tyr

UAU

9

Cys

UGU

10

Ser

UCU

11

Glu

GAG

12

Val

GUG

13

Ala

GCG

14

His

CAC

15

Leu

CUC

16

Gln

CAA

17

Asn

AAC

18

Trp

UGG

19

Стоп

UAA

20

Asp

GAC

21

Старт - Met

AUG

 

Стоп

UAG

 

Стоп

UGA



Логика действий понятна. Возможно, мы ошиблись в последовательности действий, но это пока не так важно. Конечно, это только мои вариации на тему, профессионалам, наверное, виднее, так или не так всё было в действительности, но все же, … получилось интересно.

Не сходятся концы с концами…

Странно, … симметричные коды можно использовать только при триплетном считывании, без перекрытия. Этот момент заставляет еще раз присмотреться к приведенной выше математике получения 20 аминокислот для использования в триплетном кодировании. Явно, одно не соответствует другому.

Математика показывает объективную реальность поэлементного движения рибосомы по РНК. Но и такое широкое использование симметрий в кодировании аминокислот так же не может быть случайным, и указывает на триплеты независимого считывания.

Возможно, что поэлементное считывание информации РНК существовало до триплетного кодирования и какое-то время вместе с появлением триплетов. Оно и определило количество применяемых аминокислот.

Но на каком-то этапе произошел скачок в развитии. Система кодирования была полностью пересмотрена. Триплетное независимое считывание заставило заново провести кодирование используемых аминокислот по признакам симметрии. Но эволюция не умеет отбрасывать старые варианты…

Дополнительные коды уже есть, пришлось их перераспределить по аминокислотам в зависимости от частоты их применения.

И сложилась парадоксальная картина. Считывание, вроде бы, неперекрываемое, и для кодирования аминокислоты достаточно одного кодона, а использованными оказались все 64 варианта. Потенциальная избыточность кодирования перекрыта вырожденностью кодов. Расчетный запас есть, а фактически – нет. Как это получилось, мы уже увидели.

Скорее всего, фактором пересмотра системы стало быстрое развитие клеточных рибосом. В конечном итоге они определяют всю систему кодирования и её применение в клеточном организме.

Можно предположить, что зона считывания информации у рибосомы давно превысила три знака и вышла далеко за эти пределы. Появилась возможность выбора и запоминания информации нужного кодона внутри большой зоны считывания информации. Это позволило оставить рибосоме поэлементный шаг, но была реализована и возможность триплетного считывания в независимом режиме. У рибосомы где-то появилась оперативная память.

Зона считывания информации для рибосомы даже у прокариотов, как мы видим, достигла 7 нуклеотидов. И это не предел. Если принять за основу, что рибосомы имеют два центра трансляции или считывания информации [6], то их суммарная зона считывания информации одной рибосомой достигла уже и 14 нуклеотидов. Какие-то участки кодов принимаются за триплеты, а остальное составляет контекст…

А сейчас…

А сейчас всё совсем запуталось. По информации биологов счет идет в триплетах, правда никто не объясняет, как это происходит. Ближайший контекст не учитывается. Сопоставление кодовой последовательности РНК и получаемого по ней белка представляет собой очень трудную задачу, и четко понять, как изменилась система и что учитывается при трансляции – пока видимо невозможно.

Мало того, биологи основное внимание уделяют не систематизации, а нахождению отклонений от системы, тем самым увеличивая и без того обширное разнообразие фактов, и сами себе создают головоломную задачку-нерешайку. Неразбериху дополняет полное смешение разнообразных отклонений в механизмах считывании триплетов прокариотов и эукариотов в один большой кроссворд…, где они и сами уже, похоже, запутались.

Почему? У них задачи другие. Они работают с биологическими объектами, так, как принято в их науке. Потому и выводы по вопросам кодирования РНК нашли отражение в теории «качания», а не в системе принципов считывания информации и теории кодирования. Их можно понять, но выход надо находить…

Предложенный самими биологами технократический подход к проблеме понимания кодирования ДНК еще далеко не исчерпал свои возможности. По сути, пока он толком и не применялся. Использовалась только терминология, но не подход.

Возможно, настало время применения машинного анализа последовательностей ДНК с учетом расширенной зоны считывания информации по отношению к триплету кодирования. Тогда станет понятен механизм действия ближайшего к триплету считывания контекста кодирования, а возможно, и элементов программирования процесса трансляции белка, запоминаемых рибосомой. Особенно важен такой анализ для исследования нетранслируемых областей РНК и ДНК. Так как уже понятно, что это программные элементы системы кодирования. От них зависят все процессы, в том числе и трансляция белка. Название «мусор» к ним явно никак не походит…

Да и не может быть «мусора» в массивах стратегически важной информации, хранящихся в ДНК. Этого никакая информационная система себе позволить не может.

Сегодняшний уровень развития вычислительной техники вполне позволяет решать эти задачи. Построить систему информационного управления в клеточной структуре, уточнить каналы связей, установить ключевые элементы управления и систему сигналов. Тогда будет понятен хоть примерный уровень технической сложности этой системы управления. Пока понятно только одно, что ключевую роль в ней исполняет рибосома, но насколько технически сложен это универсальный клеточный автомат? Как на её фоне выглядит техническая сложность остальных исполнительных механизмов клетки?

Ответов я пока не нашел…

 

Литература:

 

  1. Гаряев П.П. Тертышный Г.Г. Леонова Е.А. Мологин А.В. Волновые биокомпьютерные функции ДНК. http://rusnauka.narod.ru/lib/phisic/garayaev/biocom/biocomp.html
  2. Гаряев П.П. Волновой генетический код. Москва, 1997. - 108с.: ил. http://rusnauka.narod.ru/lib/author/garyaev_p_p/1/
  3. А.В.Никитин Эволюционный путь саморазвития искусственного интеллекта. http://andrejnikitin.narod.ru/samorazvitiemozg2.htm или http://trinitas.ru/rus/doc/0016/001c/00161450.htm
  4. П.П.Гаряев, М.Р.Гарбер, Е.А.Леонова, Г.Г.Тертышный. К ВОПРОСУ О ЦЕНТРАЛЬНОЙ ДОГМЕ МОЛЕКУЛЯРНОЙ БИОЛОГИИ http://rusnauka.narod.ru/lib/author/garyaev_p_p/2/
  5. П.П.Гаряев, Лингвистико-волновой геном: теория и практика. Киев, 2009 http://trinitas.ru/rus/doc/0016/001c/00161725.htm
  6. Л. П. ОВЧИННИКОВ Что и как закодировано в мРНК. Московский государственный университет им. М.В. Ломоносова http://nature.web.ru/db/msg.html?mid=1157645&s
  7. Никитин А.В., Считывание и обработка информации ДНК // «Академия Тринитаризма», М., Эл № 77-6567, публ.16147, 08.11.2010 http://trinitas.ru/rus/doc/0016/001c/00161718.htm

Оглавление

Проблемы понимания системы кодирования ДНК.. 1

Два пишем, один - в уме…... 1

Об алфавите клеточных текстов. 3

Об исходной системе кодирования. 3

Начальные основные коды аминокислот. 4

Не сходятся концы с концами…... 5

А сейчас…... 6

 

 

andvnikitin@yandex.ru


Никитин А.В., Проблемы понимания системы кодирования ДНК // «Академия Тринитаризма», М., Эл № 77-6567, публ.16181, 27.11.2010

 

Адрес документа: http://www.trinitas.ru/rus/doc/0016/001c/00161731.htm  

 

 

Hosted by uCoz