воскресенье, 13 июня 2010 г.

Биоинформатика - это просто?

Те, кто работают в wet lab, часто считают, что то, чем занимаются биоинформатики - легкая работа. Действительно, не надо возиться с вредными реактивами, не надо приходить на работу в выходные. Да и вообще на работу ходить не надо, можно работать удаленно. И работой-то это можно назвать с натяжкой - сидишь себе, кнопки нажимаешь. Непыльное занятие, в общем.

Не помню кто сказал, что идеальная программа для биоинформатики такая: туда вводишь последовательность белка, а на выходе получаешь черновик готовой статьи. Реальность устроена так, что программы в большинстве своем очень далеки от этого идеала. Но многие из тех, кто с ними не работал, считают, что это очень просто. Регулярно встречается требование научных руководителей добавить в диссертацию "немного биоинформатики". Например, одной девушке, не знакомой со структурной бионформатикой, сказали, что надо сделать молекулярную динамику немаленькой системы, которую она изучает. Надеюсь, ей с моей помощью удалось убедить начальство, что это тянет на отдельную кандидатскую.

Приведу ниже диалог с биологом-экспериментатором, с которой у меня были, как мне казалось, неплохие отношения..

Биолог: Привет. У меня вопрос. Можно ли из pdb скачать solvent accessibility для структур.
Должно же это где-то быть, но я не могу найти. Вторичная структура же там есть.

Биоинформатик: Так, я это считала с помощью swiss-pdb viewer

Биолог: Ясно. Со swiss-pdb viewer у меня заняло полдня чтобы найти как Ramachandran plot построить. Там как-то все сложно.

Биоинформатик: Ну вообще-то я скрипт писала для него, чтобы в файл сохранял. У меня сохранялась сразу вторичная структура, доступность и еще что-то. А насчет того что в программе все как-то сложно.. ну, для этого и нужны биологи-теоретики :) Мне тут недавно показывали, что получается, когда за моделирование берется человек, не понимающий в этом - результат удручающий :)

Биолог: О да. Ты имеешь в виду что такое высшее знание как умение моделировать дается не каждому? Я так не считаю, честно говоря. И ничего супер-сложного в этом всем не вижу.

Биоинформатик: Нет, я имею в виду, что знание не дается, а приобретается в процессе освоения какой-то области. Я раньше переживала, что я руками ничего делать не умею, а потом поняла, что просто каждый должен своим делом заниматься.

Биолог: Т.е. ты хочешь сказать что посчитать solvent accessibility это настолько сложная и специальная тема что для этого нужны биологи-теоретики? Я так не думаю.

Биоинформатик: Нет, ничего сложного.

Биолог: Более того, я думаю это и кролик может сделать. А если в программе все через... извините.. одно место.

Биоинформатик: Вопрос во времени и качестве. Насчет Swiss-pdb viewer - я студентов учу в нем работать, они довольны.

Биолог: Если приходится полдня специально тратить, то выкинуть эту прогу надо.

Биоинформатик: Программа слегка своеобразная, да, но качественная. Выкидывай, бери другую, кто же мешает. Или, еще лучше - напиши другую, в которой все будет нормально.


В общем, после этого она со мной не разговаривала, думаю что обиделась. Отчасти потому, что общение через интернет, к сожалению, иногда приводит к недопонимаю между собеседниками. Но я аналогичное отношение к биоинформатике встречала не однажды, так что боюсь, что это достаточно глобальное явление, с которым надо считаться.

Вот тот самый скрипт для Swiss-Pdb Viewer'а, который сохраняет в файл доступность для растворителя и вторичную структуру - вот:

please do
open pdb from temp "PDB_ID.pdb";
$MYFILE = open file "PDB_ID.access" in temp for writing;
$NBGROUPS = groupcount of "PDB_ID";
$X = 0;
do
{
print on $MYFILE "chain: " + chain("PDB_ID",$X) + " "
+ "name: " + name("PDB_ID",$X) + " "
+ "num: " + (string)num("PDB_ID",$X) + " "
+ "%access: " + (string)access("PDB_ID",$X);
} while (++$X < $NBGROUPS);
close file $MYFILE;
close "PDB_ID";
thank you


Этот текст надо сохранить в файл и открывать через File->Run script... Замените в нем PDB_ID на имя вашего файла без .pdb и положите этот файл в папку spdbv/temp, там же появится файл, пригодный для открывания например в экселе (или R) и дальнейшего анализа. Это немного кривое решение, но оно работает на всех платформах. Ну, Swiss-Pdb Viewer действительно своеобразная программа.

А Ramachanran plot там открывается по Ctrl-R, показывает положение для выделенных остатков текужего слоя. Прямо в этом окошке можно двигать точки мышкой и двугранные углы в белке будут меняться. Как именно - зависит от наличия галочки в меню Tools->Moving C-part during Phi/Psi Changes.

2 комментария:

  1. Джва года ждал такой блог! Буду читать

    ОтветитьУдалить
  2. БЛЭЭЭЭЭ, я из 2019, ищу, значит, инфу, что бы стать биоинформатиком))) т.к. я лошара поступил не туда, да и понял что мне нравится биоинфа ток на 3 курсе... Я очень благодарен за этот блог! Некоторые статьи в этом блоге очень помогли!! спасибо:) было бы побольше таких блогов((

    ОтветитьУдалить