3.3. Трансформация Суперматрицы в триплетный топологический код

3.3.1. Кодирование треугольных матриц

Как было сказано в конце раздела 3.2., для целей хранения, передачи и тиражирования структурной информации, заключенной в матрицах, удобнее использовать линейное расположение элементов, которого можно достичь после трансформации Суперматрицы в триплетный код.

 

 

Рассмотрим снова матрицу из шести элементов, где x1 - x6 - переменные, принимающие значения 0 и 1:

Сгруппируем переменные попарно и обозначим буквамии X, Y, Z:

x1x2 = X,  x3x4= Y,  x5x6 = Z.

Закодированная таким образом матрица запишется в виде триплета XYZ.

 

 

Каждая пара переменных xi xj может принимать следующие значения:

 00, 01, 10, 11.

Их можно закодировать с помощью алфавита из четырех букв, например, латинских:

 A, B, C, D

Используем для этих целей первые буквы названий азотистых оснований генетического кода:

C, U, G, A

 

Вопрос о том, что буквам  генетического кода могут соответствовать пары булевых переменных xixj, был поставлен давно [[7]. Анализу различных вариантов таких соответствий посвящен раздел в работе [23].

 

Выбор соответствий букв триплетов парам булевых переменных

 

При выборе этих соответствий мы исходили из идеи, что свойства закодированной триплетом конформации должны совпадать со свойствами аминокислоты, которая соответствует этому триплету:

 

- триплет, содержащий CСС, кодирует антиспиральную аминокислоту пролин (Pro), относящуюся к участкам белка со слабой связностью (матрица 000000),

поэтому должно быть 00 - C.

- триплет AAA кодирует аминокислоту лизин (Lys), часто встречающуюся в альфа-спиральных участках, обладающих сильной связностью (переменные 111111), следовательно 11 A.

- триплет GUU кодирует аминокислоту валин (Val), типичную для бета-структурных участков белка (описываются переменными 100101), что может быть получено, если 10 - G, а 01 - U.

 

В результате были выбраны следующие соответствия:

00 - C

01 - U

10 - G

11 A

На основе выбранных соответствий путем подстановки в треугольные матрицы вместо пар переменных букв кода Суперматрица была трансформирована в триплетный топологический код (рис. 32.), полностью идентичный генетическому коду.

 

3.3.2. Свойства таблицы триплетного кода, трансформированного из Суперматрицы

 

БЛОКИ ТРИПЛЕТОВ

 

 

 

 

Как видно на рисунке 32, блоки матриц с общей второй парой переменных превратились в блоки триплетов с общей второй буквой:

 

C <---> 00  U <---> 01, G <---> 10, A <---> 11.

 

Красно-коричневые блоки (C, U) содержат триплеты, кодирующие матрицы, в которых  x3=0, что соответствует открытым ациклическим конформациям 4х-звенного графа.

В темно-синих блоках (G, A) находятся  триплеты, кодирующие матрицы с x3=1, что соответствует циклическим конформациям 4х-звенного графа

 

 

 

Рис. 32. Трансформация суперматрицы в триплетный топологический код.

СИММЕТРИЯ В БЛОКАХ

 

 

 

 

 

 

На главной диагонали блоков (в качестве примера на рис. 33 показан блок С), находятся триплеты, кодирующие симметричные матрицы и графы.

 

Поскольку C = 00, A = 11, то в первом и третьем положении эти буквы кодируют симметричные состояния связности (триплеты CCC и  ACA).

 

В свою очередь, G = 10, а U=01, поэтому буква G в первом положении кодирует состояние связности симметричное кодируемому буквой U и наоборот (триплеты GCU и UCG).

 

По обе стороны от главной диагонали расположены триплеты, кодирующие симметричные матрицы и конформации, например:

 

GCC - CCU, UCC - CCG, ACC - CCA и т.д.

 

Рис. 33. Симметрия в блоках триплетного кода.

АНТИСИММЕТРИЯ

 

 

 

 

Преобразование антисимметрии выглядит следующим образом:

C <---> A, G <---> U,

что соответствует преобразованию Румера в триплетном генетическом коде (разд. 2.3.). При этом антисимметричные триплеты занимают в таблице симметричное положение (гр. симметрии С2):

CCC <--> AAA, CCU <--> AAG, CCG <--> AAU

 и т.д.

 

 

 

Рис. 34. Антисимметрия в структуре триплетного кода

ПРОСТРАНСТВЕННОЕ ПРЕДСТАВЛЕНИЕ ТРИПЛЕТНОГО КОДА

 

Пространственным представлением данной системы триплетов является структура, изоморфная булеву гиперкубу В6, идентичная пространственной структуре триплетного генетического кода (разд. 2.3.). Она может быть получена на основе трансформации матриц, расположенных в вершинах булева гиперкуба В6 (разд. 3.2.2.), в триплеты,  использующие выбранные соответствия пар переменных буквам триплетов.

 

Тем самым мы ответили на вопрос, поставленный в разделе 3, почему структура триплетного генетического кода оказалась  изоморфной булеву гиперкубу В6.

 

 

Таким образом мы показали, что в основе триплетного кода может лежать закодированное в виде триплетов с помощью алфавита из четырех букв матричное описание конформаций 4-х звенного графа или пентафрагмента белка.

С помощью матриц и триплетов можно закодировать структуру n-звенных графов в виде последовательности триплетов. Однако, возлагаемые на это описание надежды, что с помощью предложенного алгоритма можно будет предсказывать структуру белка, не оправдались. Поэтому в обновленной версии нашей странички мы не приводим этого алгоритма. Желающие могут ознакомиться с ним в нашей монографии [ 8 ].

 

Принципиально важно, как закодированные в виде триплетов конформации 4х-звенного графа  могут быть воссозданы в структуре белка. Этому посвящен раздел  4. нашей странички.

На главную страницу