среда, 2 июня 2010 г.

Анализ белковой структуры: проверьте последовательность!


Что должно быть первым шагом после того как вы загрузили очередной белок в вашем pdb-вьювере? Хочется скорее поразглядывать его, сделать какие-то выводы... Но надо в первую очередь проверить, что же это за белок. Просто удивительно, как часто возникают проблемы из-за того, что люди пренебрегают этим шагом.

Для того, чтобы посмотреть последовательность белка, в Swiss-Pdb Viewer'е надо сделать File → Save → Sequence (FASTA). Если загружено несколько структур, убедитесь, что активна именно та, которая требуется. К сожалению, Swiss-Pdb Viewer не отмечает конец цепи, если в последовательности цепей несколько, то их границы придется находить самим.

Если у вас установлен Modeller, то для извлечения последовательности из файла template.pdb достаточно вот такой простой код (его надо поместить в файл, например getseq.py, и запустить mod9v8 getseq.py):

nv = environ()
code = 'template'
mdl = model(env, file=code)
aln = alignment(env)
aln.append_model(mdl, align_codes=code)
aln.write(file=code+'.seq')


В файле template.seq будет последовательность почти в формате FASTA (лишняя вторая строчка) с символами «/» в концах цепей.

Затем сравните полученную последовательность с правильной последовательностью вашего белка., например из uniprot. В pdb может обнаружиться отсутствие N-конца c сигнальным пептидом или трансмембранного сегмента C-конца. Может добавиться his-tag, например. Могут отсутствовать какие-то петли, потому что они были гибкие, при кристаллизации легли как попало и на рентгенограмме их оказалось не видно. Могут быть какие-то замены.

Это относится как к структурам, загруженном из pdb, так и к моделям, которые вы построили. И особенно к моделям, которые построили не вы. Может оказаться, что вам случайно прислали какую-то постороннюю, совершенно не относящуюся к делу структуру.

На картинке как раз изображена какая-то посторонняя структура.

Комментариев нет:

Отправить комментарий