пятница, 18 июня 2010 г.

Лето


Похоже, в ближайшую неделю новых постов не будет, так как я буду меньше времени проводить за компьютером и больше - на свежем воздухе. Чего и вам желаю.

Если же хочется чего-нибудь почитать, то рекомендую вот:
http://scienceblogs.com/

Вот для тех, кого интересует молекулярное моделирование:
http://rosettadesigngroup.com/blog/

А это будет полезно тем, кто уже немного знает Python, и хочет узнать его побольше:
http://www.siafoo.net/article/52

Читать далее

понедельник, 14 июня 2010 г.

На Титане что-то нашли



Если верить нашим журналистам, то на одном из спунтников Сатурна неделю назад обнаружены следы жизни. Так как никто из разумных людей им особенно не верит, то лучше сразу читать первоисточник.

Если кратко, то на Титане зонд Кассини обнаружил некое явление, а именно нехватку ацителена и водорода, которое может быть объяснено в том числе и тем, что там когда-то была метановая жизнь. Метановая жизнь отличается от нашей белковой жизни тем, что вместо воды используется жидкий метан, так как вода при 90 кельвинах твердая и как растворитель не работает. Понятно, что само существование этой жизни более чем гипотетично. Никто ее не видел, никто не знает как она может быть устроена. Объяснять одно непонятное явление другим непонятным явлением, казалось бы, странно.

Видимо, в NASA сидит команда пиарщиков, которые время от времени командуют, что надо в очередной раз найти следы жизни. Приходит такой сотрудник пиар-отдела к ученому-астрофизику, и говорит: "Слушай, нам для привлечения внимания к Кассини обязательно надо что-то опубликовать про жизнь, иначе финансирование могут урезать". Тот ему в ответ: "Ты что, с дуба рухнул? Ты вообще представляешь что сейчас Кассини фотографирует? Какая нафиг жизнь, там озера из метана!" "Ох, вечно ты беспокоишься о всяких пустяках. Пиши, что там метановая жизнь."

На самом деле, конечно, все было не так - про теоретическую возможность метановой жизни заявили еще в 2005 году. Но в целом я права. Просто пиарщики лучше работают.


Читать далее

воскресенье, 13 июня 2010 г.

Биоинформатика - это просто?

Те, кто работают в wet lab, часто считают, что то, чем занимаются биоинформатики - легкая работа. Действительно, не надо возиться с вредными реактивами, не надо приходить на работу в выходные. Да и вообще на работу ходить не надо, можно работать удаленно. И работой-то это можно назвать с натяжкой - сидишь себе, кнопки нажимаешь. Непыльное занятие, в общем.

Не помню кто сказал, что идеальная программа для биоинформатики такая: туда вводишь последовательность белка, а на выходе получаешь черновик готовой статьи. Реальность устроена так, что программы в большинстве своем очень далеки от этого идеала. Но многие из тех, кто с ними не работал, считают, что это очень просто. Регулярно встречается требование научных руководителей добавить в диссертацию "немного биоинформатики". Например, одной девушке, не знакомой со структурной бионформатикой, сказали, что надо сделать молекулярную динамику немаленькой системы, которую она изучает. Надеюсь, ей с моей помощью удалось убедить начальство, что это тянет на отдельную кандидатскую.

Приведу ниже диалог с биологом-экспериментатором, с которой у меня были, как мне казалось, неплохие отношения..

Биолог: Привет. У меня вопрос. Можно ли из pdb скачать solvent accessibility для структур.
Должно же это где-то быть, но я не могу найти. Вторичная структура же там есть.

Биоинформатик: Так, я это считала с помощью swiss-pdb viewer

Биолог: Ясно. Со swiss-pdb viewer у меня заняло полдня чтобы найти как Ramachandran plot построить. Там как-то все сложно.

Биоинформатик: Ну вообще-то я скрипт писала для него, чтобы в файл сохранял. У меня сохранялась сразу вторичная структура, доступность и еще что-то. А насчет того что в программе все как-то сложно.. ну, для этого и нужны биологи-теоретики :) Мне тут недавно показывали, что получается, когда за моделирование берется человек, не понимающий в этом - результат удручающий :)

Биолог: О да. Ты имеешь в виду что такое высшее знание как умение моделировать дается не каждому? Я так не считаю, честно говоря. И ничего супер-сложного в этом всем не вижу.

Биоинформатик: Нет, я имею в виду, что знание не дается, а приобретается в процессе освоения какой-то области. Я раньше переживала, что я руками ничего делать не умею, а потом поняла, что просто каждый должен своим делом заниматься.

Биолог: Т.е. ты хочешь сказать что посчитать solvent accessibility это настолько сложная и специальная тема что для этого нужны биологи-теоретики? Я так не думаю.

Биоинформатик: Нет, ничего сложного.

Биолог: Более того, я думаю это и кролик может сделать. А если в программе все через... извините.. одно место.

Биоинформатик: Вопрос во времени и качестве. Насчет Swiss-pdb viewer - я студентов учу в нем работать, они довольны.

Биолог: Если приходится полдня специально тратить, то выкинуть эту прогу надо.

Биоинформатик: Программа слегка своеобразная, да, но качественная. Выкидывай, бери другую, кто же мешает. Или, еще лучше - напиши другую, в которой все будет нормально.


В общем, после этого она со мной не разговаривала, думаю что обиделась. Отчасти потому, что общение через интернет, к сожалению, иногда приводит к недопонимаю между собеседниками. Но я аналогичное отношение к биоинформатике встречала не однажды, так что боюсь, что это достаточно глобальное явление, с которым надо считаться.

Вот тот самый скрипт для Swiss-Pdb Viewer'а, который сохраняет в файл доступность для растворителя и вторичную структуру - вот:

please do
open pdb from temp "PDB_ID.pdb";
$MYFILE = open file "PDB_ID.access" in temp for writing;
$NBGROUPS = groupcount of "PDB_ID";
$X = 0;
do
{
print on $MYFILE "chain: " + chain("PDB_ID",$X) + " "
+ "name: " + name("PDB_ID",$X) + " "
+ "num: " + (string)num("PDB_ID",$X) + " "
+ "%access: " + (string)access("PDB_ID",$X);
} while (++$X < $NBGROUPS);
close file $MYFILE;
close "PDB_ID";
thank you


Этот текст надо сохранить в файл и открывать через File->Run script... Замените в нем PDB_ID на имя вашего файла без .pdb и положите этот файл в папку spdbv/temp, там же появится файл, пригодный для открывания например в экселе (или R) и дальнейшего анализа. Это немного кривое решение, но оно работает на всех платформах. Ну, Swiss-Pdb Viewer действительно своеобразная программа.

А Ramachanran plot там открывается по Ctrl-R, показывает положение для выделенных остатков текужего слоя. Прямо в этом окошке можно двигать точки мышкой и двугранные углы в белке будут меняться. Как именно - зависит от наличия галочки в меню Tools->Moving C-part during Phi/Psi Changes.

Читать далее

четверг, 10 июня 2010 г.

Как работает клетка?


В автомобиле примерно 2000 деталей. Чтобы понимать японские газеты и большинство текстов, достаточно знать 2000 иероглифов. В Китае хорошей грамотностью считается знание 3500 иероглифов.
Считается, что столько объектов может запомнить (и оперировать с ними) практически любой взрослый человек. Японский и китайский языки кажутся ужасно сложными, но говорят что их можно изучить месяца за три, если усердно заниматься методом погружения и не отвлекаться на другие дела.

У сине-зеленых водорослей примерно 4000 генов. У архей (это нечто похожее на бактерии, но не бактерии) генов 1500-2000. У бактерий под названием микоплазмы меньше 500 генов. В бактерии, геном которой был недавно синтезирован, 381 ген.

Но при этом пока никто не может осознать, как именно функционирует хотя бы самый маленький живой организм. Для некоторых вирусов это понятно, но там генов бывает даже меньше десятка.

Может, дело в том, что пока нам недостаточно хорошо известно назначение "деталей" в клетке.

Может, дело в том, что биологи обычно не понимают, как именно устроен и функционирует автомобиль или, скажем, радиоприемник.

А может, кому-то просто не хватает двух-трех месяцев.

Читать далее

воскресенье, 6 июня 2010 г.

Почему python?


Если вы владеете навыками программирования и хотите использовать их в биологии, то начинайте изучать язык программирования python. Если не владеете, то тем более начинайте его изучать. Сейчас объясню, почему.

Когда я первый раз услышала об этом языке, особого энтузиазма он у меня не вызвал. Ну, язык как язык. Вроде как что-то скриптовое, кажется для веб-приложений. Еще и говорят, что он непроизводительный. А потом я приехала на стажировку в одну серьезную лабораторию, и оказалось, что там пишут в основном на питоне. Конечно же, я спросила, почему именно на нем.

"Это хороший язык, объектно-ориентированный, высокая скорость разработки" - объяснил мне коллега, - "Но главная причина в другом: у нас через лабораторию проходит множество студентов и временных сотрудников, все пишут какой-то код. Если бы он был на perl, его пришлось бы выбрасывать после их ухода".

Итак, один из серьезных плюсов языка python - читабельность кода. Можно взять скрипт, который написал кто-то другой или вы сами два года назад (часто это еще хуже, чем кто-то другой) и понять, как он работает и что надо изменить, чтобы он работал так как надо. Это качество не так часто встречается в языках программирования, а в perl практически отсутствует.

Так как python изначально объектно-ориентирован, его изучение помогает приобрести правильный, объектно-ориентированный способ мышления. Также в нем есть полезные элементы функционального программирования, причем они совсем не страшные и простые для понимания. Неспроста python изучают в MIT. Надеюсь, и в наших школах со временем откажутся от паскаля.

Python очень хорошо подходит для объединения разных программ, написанных на разных языках - glue language. Python используют в Google, в фирмах по производству спецэффектов для кино, и в других местах, где основную работу вроде бы выполняют программы, написанные на C++, а python нужен для управления всеми этими программами. Не бойтесь, если вам будут говорить о низкой производительности python. Почти всегда она достаточно высока и не уступает perl. Кроме того, важно не время, в течение которого программа работает, а время, которое прошло между началом написания программы и получением данных. Если же понадобится увеличение производительности, то существует немало способов, как это можно сделать.. но в первую очередь проверить алгоритм, скорее всего проблема именно в нем.

Для биологии есть библиотека biopython со множеством функций, от работы с выравниваниями до взаимодействия с базой pubmed. Есть еще Biskit, библиотека для продвинутой работы со структурами белков. Modeller сейчас также фактически является библиотекой для python.

Все чаще python или питоноподобный язык используется в качестве встроенного скриптового языка. Знать python нужно, если хочется сделать что-то нестандартное в AutoDock, PyMOL, Chimera и многих других программах. Даже в gimp скрипты пишутся на питоне.

До сих пор многие используют perl там, где целесообразнее было бы писать на python. Безусловно, у perl есть своя ниша, так же как и у фортрана. Но человек, который использует фортран вместо С или C++, вызывает недоумение. Скоро так же будут относиться и к большинству из тех, кто пишет на perl. Безусловно, ваш начальник может любить перл, ведь он начал писать на нем еще до того, как появился питон. Но это не значит, что вам нужно делать то же самое.

Читать далее

четверг, 3 июня 2010 г.

Про анализы

"Моя жизнь кончена. У меня нашли гепатит C", - услышала я однажды от своего знакомого. Подробности оказались такие: он полгода назад сдавал кровь, а вчера ему позвонили и сообщили, что в его крови найдены антитела к гепатиту C, и пригласили на повторный анализ. Пришлось рассказать ему, какие бывают анализы и что означают их результаты.

Анализы на всякие болезни бывают двух основных типов: ИФА и ПЦР. В первом случае определяется наличие антител к возбудителю заболевания, во втором - наличие ДНК. Иногда отдельно проверяется наличие разных типов антител: IgG и IgM. IgM - это ранние антитела, они будут либо при первой встречи с болезнью, либо при обострении хронического процесса. Они довольно быстро исчезают из крови, поэтому их наличие говорит о том, что пациент скорее всего болен. IgG - это поздние, "дежурные" антитела. Если они есть, значит, у человека к этому возбудителю есть иммунитет. Либо хроническое заболевание, но далеко не все микробы и вирусы могут вызывать хронические болезни. ИФА - это довольно простой и дешевый анализ, поэтому в первую очередь делается именно он. Если анализ показывает положительные результаты, то, как правило, делается повторный анализ методом ПЦР. Антитела образуются в результате стохастического процесса, так что в организме вполне могут встретиться антитела, одновременно реагирующие с чем-то безобидным, и с тем самым страшным возбудителем, на который проводится анализ. Ну и просто человеческие ошибки надо учитывать - могут пробирки перепутать, например.

ПЦР показывает наличие в пробе ДНК, специфического для возбудителя болезни. Этот анализ очень чувствительный и, по идее, очень специфичный. Если все сделано идеально, то результаты должны быть правильными. Однако, мир у нас не идеальный, поэтому ПЦР лучше делать там, где этим методом давно и хорошо владеют. Из-за большой чувствительности метода, при неаккуратной работе ДНК микроба может "прилететь" в ваш анализ из какого-нибудь другого места. Сейчас очень популярно в платных клиниках делать ПЦР на кучу микроорганизмов, а потом по результатам предлагать лечить герпес, например, или уреаплазмоз. На самом деле надо с большой осторожностью подходить к таким предложениям, так как при отсутствии клинических признаков такое обычно не требуется лечить. А если есть какие-то жалобы, то врач должен еще убедиться, что они связаны именно с теми существами, которых выявил анализ.

Иногда встречается мнение о том, что для экономии средств лаборанты смешивают несколько образцов крови и делают один анализ, а потом звонят и сообщают о положительном результате всем, кому не повезло оказаться в положительной группе. Такое действительно делалось (для других анализов, но это не важно) во время второй мировой, это называется пулирование. Сейчас в этом нет никакого смысла. Сотрудники медучреждений не покупают расходники для анализов на собственные деньги, да и продать их "налево" нереально.

Ложноположительные результаты ИФА на гепатит C вообще характерны для доноров. Кровь, которую сдают, не используется сразу, а некоторое время хранится, после чего ее снова анализируют. Почему-то для длительно хранившихся образцов крови повышается вероятность ложноположительного результата анализа на гепатит C. Естественно, как показали повторные анализы, у моего знакомого никакого гепатита не было и нет. Чего и вам желаю.

Читать далее

среда, 2 июня 2010 г.

Анализ белковой структуры: проверьте последовательность!


Что должно быть первым шагом после того как вы загрузили очередной белок в вашем pdb-вьювере? Хочется скорее поразглядывать его, сделать какие-то выводы... Но надо в первую очередь проверить, что же это за белок. Просто удивительно, как часто возникают проблемы из-за того, что люди пренебрегают этим шагом.

Для того, чтобы посмотреть последовательность белка, в Swiss-Pdb Viewer'е надо сделать File → Save → Sequence (FASTA). Если загружено несколько структур, убедитесь, что активна именно та, которая требуется. К сожалению, Swiss-Pdb Viewer не отмечает конец цепи, если в последовательности цепей несколько, то их границы придется находить самим.

Если у вас установлен Modeller, то для извлечения последовательности из файла template.pdb достаточно вот такой простой код (его надо поместить в файл, например getseq.py, и запустить mod9v8 getseq.py):

nv = environ()
code = 'template'
mdl = model(env, file=code)
aln = alignment(env)
aln.append_model(mdl, align_codes=code)
aln.write(file=code+'.seq')


В файле template.seq будет последовательность почти в формате FASTA (лишняя вторая строчка) с символами «/» в концах цепей.

Затем сравните полученную последовательность с правильной последовательностью вашего белка., например из uniprot. В pdb может обнаружиться отсутствие N-конца c сигнальным пептидом или трансмембранного сегмента C-конца. Может добавиться his-tag, например. Могут отсутствовать какие-то петли, потому что они были гибкие, при кристаллизации легли как попало и на рентгенограмме их оказалось не видно. Могут быть какие-то замены.

Это относится как к структурам, загруженном из pdb, так и к моделям, которые вы построили. И особенно к моделям, которые построили не вы. Может оказаться, что вам случайно прислали какую-то постороннюю, совершенно не относящуюся к делу структуру.

На картинке как раз изображена какая-то посторонняя структура.

Читать далее

Почему люди верят в то, что ВИЧ не вызывает СПИД?


Сложно найти человека, который бы не слышал о том, что теракты 11 сентября в Нью-Йорке устроили американские спецслужбы, взрывы домов в Москве устроили спецслужбы российские, а люди никогда не были на Луне, это все подделка и съемки в павильоне. Также можно встретить информацию о том, что вирус ВИЧ, который мы все знаем как вирус СПИДа, на самом-то деле не имеет к СПИДу никакого отношения, а вся шумиха вокруг этой болезни — величайшая мистификация прошлого века.

Принципиальное отличие этой теории заговора от остальных в том, что под подозрением в обмане человечества оказывается не горстка сотрудников секретных правительственных организаций, а множество ученых, работающих по всему миру. Говорят например, что самого вируса никто не видел, а диагноз ставится по клиническим признакам и антителам; что от лечения становится только хуже; что ВИЧ не соответствует триаде Коха.

Да, и почему именно СПИД? Казалось бы, есть болезни, которые являются лучшими кандидатами на «несуществование». Возьмем, например, гепатит C. Вирус до сих пор толком не культивируется. Животные им не болеют (кроме шимпанзе, которых используют мало и наверняка только коррумпированные ученые). А где фотографии вируса? А где в печени следы повреждения вирусом? А кто получает огромные деньги от производства тест-систем? Но почему-то ничего не слышно о том, что HCV не вызывает гепатит.

Во-первых, конечно, это связано с тем, что СПИД является самой «разрекламированной» болезнью последнего времени. На исследования, связанные с ВИЧ, расходуется очень много денег. Но вряд ли бы эта теория стала такой популярной, если бы не поддержка одного нобелевского лауреата.

Кари Маллис подарил биологии такую замечательную вещь как ПЦР. За это в 1993 году его справедливо наградили Нобелевской премией по химии. Он очень яркая и неординарная личность. Его первая статья в Nature называлась «Космологические последствия обращения времени». Сам он считает, что эта публикация, не имеющая отношения к биологии, помогла получить ему степень PhD по биохимии, несмотря на то что он не прошел курса по молекулярной биологии. Кари Маллис - не вирусолог, но получение Нобелевской премии помогло ему высказываться и быть услышанным в том числе и по поводу ВИЧ. Сейчас он является одним из самых известных людей, поддерживающих отрицание ВИЧ.

Если человек становится известным и авторитетным благодаря деятельности в какой-либо области, у него часто возникает соблазн высказывать свое мнение и о других вещах. А у людей возникает соблазн его слушать. Но ни статья в Nature, ни Нобелевская премия, ни создание успешной дизайнерской студии, ни регулярное мелькание в телевизоре не делают человека экспертом по всем вопросам.

Читать далее