3.3.
Трансформация Суперматрицы в триплетный
топологический код
3.3.1.
Кодирование треугольных матриц
Как было сказано в конце раздела 3.2., для целей хранения, передачи и тиражирования структурной информации, заключенной в матрицах, удобнее использовать линейное расположение элементов, которого можно достичь после трансформации Суперматрицы в триплетный код.
Рассмотрим
снова матрицу из шести элементов, где x1 - x6 - переменные,
принимающие значения 0 и 1: Сгруппируем переменные
попарно и обозначим буквамии
X, Y, Z: x1x2 = X, x3x4= Y, x5x6 = Z. Закодированная
таким образом матрица запишется в виде триплета XYZ. |
Каждая
пара переменных xi xj может принимать следующие значения: 00, 01, 10,
11. Их можно
закодировать с помощью алфавита из четырех букв, например, латинских: A, B, C, D Используем
для этих целей первые буквы названий азотистых оснований генетического кода: C, U, G, A Вопрос о том, что буквам
генетического кода могут соответствовать пары булевых переменных xixj, был поставлен давно [[7]. Анализу различных
вариантов таких соответствий посвящен раздел в работе [23]. |
Выбор
соответствий букв триплетов парам булевых переменных |
|
При
выборе этих соответствий мы исходили из идеи, что свойства закодированной
триплетом конформации должны совпадать со
свойствами аминокислоты, которая соответствует этому триплету: -
триплет, содержащий CСС, кодирует антиспиральную аминокислоту пролин
(Pro), относящуюся к участкам белка со слабой
связностью (матрица 000000), поэтому
должно быть 00 - C. -
триплет AAA кодирует аминокислоту лизин (Lys),
часто встречающуюся в альфа-спиральных участках, обладающих сильной
связностью (переменные 111111), следовательно 11 – A. -
триплет GUU
кодирует
аминокислоту валин (Val),
типичную для бета-структурных
участков белка (описываются переменными 100101), что может быть
получено, если 10 - G, а 01 - U. |
|
В результате
были выбраны следующие соответствия: 00 - C 01 - U 10 - G 11 – A На
основе выбранных соответствий путем подстановки в треугольные матрицы вместо
пар переменных букв кода Суперматрица была
трансформирована в триплетный топологический код (рис. 32.), полностью
идентичный генетическому коду. |
3.3.2. Свойства таблицы
триплетного кода, трансформированного из Суперматрицы
БЛОКИ ТРИПЛЕТОВ |
|
Как
видно на рисунке 32, блоки матриц с общей второй парой переменных
превратились в блоки триплетов с общей второй буквой: C <---> 00 U <---> 01, G <---> 10, A <---> 11. Красно-коричневые
блоки (C, U) содержат триплеты,
кодирующие матрицы, в которых x3=0, что соответствует открытым ациклическим конформациям
4х-звенного графа. В темно-синих блоках (G, A) находятся триплеты, кодирующие матрицы с x3=1, что соответствует
циклическим конформациям 4х-звенного графа |
|
|
Рис. 32. Трансформация суперматрицы в
триплетный топологический код. |
СИММЕТРИЯ В БЛОКАХ |
|
|
На
главной диагонали блоков (в качестве примера на рис. 33 показан блок С), находятся триплеты,
кодирующие симметричные матрицы и графы. Поскольку
C = 00, A = 11, то в первом и третьем положении эти буквы кодируют
симметричные состояния связности (триплеты CCC и ACA). В свою
очередь, G = 10, а U=01, поэтому буква G в первом положении
кодирует состояние связности симметричное кодируемому
буквой U и наоборот (триплеты GCU и UCG). По обе
стороны от главной диагонали расположены триплеты, кодирующие симметричные
матрицы и конформации, например: GCC - CCU, UCC - CCG, ACC - CCA и т.д. |
Рис. 33. Симметрия в
блоках триплетного кода. |
|
АНТИСИММЕТРИЯ |
|
Преобразование антисимметрии
выглядит следующим образом: C <---> A, G
<---> U, что соответствует преобразованию Румера
в триплетном генетическом коде (разд. 2.3.). При этом
антисимметричные триплеты занимают в таблице симметричное положение (гр.
симметрии С2): CCC
<--> AAA, CCU <--> AAG, CCG
<--> AAU и т.д. |
|
Рис. 34. Антисимметрия в структуре триплетного
кода |
|
ПРОСТРАНСТВЕННОЕ
ПРЕДСТАВЛЕНИЕ ТРИПЛЕТНОГО КОДА |
|
Пространственным
представлением данной системы триплетов является структура, изоморфная булеву
гиперкубу В6, идентичная пространственной
структуре триплетного генетического кода (разд. 2.3.). Она может быть получена на основе
трансформации матриц, расположенных в вершинах булева гиперкуба В6 (разд. 3.2.2.), в триплеты, использующие выбранные соответствия пар
переменных буквам триплетов. Тем
самым мы ответили на вопрос, поставленный в разделе 3, почему структура триплетного
генетического кода оказалась
изоморфной булеву гиперкубу В6. |
Таким образом мы показали, что в основе
триплетного кода может лежать закодированное в виде триплетов с помощью
алфавита из четырех букв матричное описание конформаций
4-х звенного графа или пентафрагмента
белка.
С помощью матриц и
триплетов можно закодировать структуру n-звенных
графов в виде последовательности триплетов. Однако, возлагаемые на это описание
надежды, что с помощью предложенного алгоритма можно будет предсказывать
структуру белка, не оправдались. Поэтому в обновленной версии нашей странички мы
не приводим этого алгоритма. Желающие могут ознакомиться с ним в нашей
монографии [ 8 ].
Принципиально важно, как закодированные в виде триплетов конформации
4х-звенного графа могут быть воссозданы
в структуре белка. Этому посвящен раздел 4. нашей странички.