что такое биоинформатика институт биоинформатики

Подкаст: кто такие биоинформатики и что они изучают

В новый выпуск подкаста «Сушите вёсла» зашёл руководитель научной группы Института биоинформатики Юрий Барбитов. Обсудили профессию биоинформатика и всё вокруг неё: чем похожа на Data Science, почему полезна для человечества и как продвигает науку. Запись выпуска внутри статьи.

«Сушите вёсла» — подкаст про разработку, аналитику, тестирование и всё, что связано с созданием IT-продуктов. Его ведут разработчики red_mad_robot Артём Кулаков и Рома Чорыев. В эпизоде #16 обсудили, что происходит, когда информатика пересекается с биологией, и Юрий Барбитов попробовал объяснить нам простыми словами про геном, секвенирование и «мокрых биологов».

Ниже подкаст и ответы на несколько горячих вопросов про биоинформатику.

1:50 — как попасть в биоинформатику;

10:20 — чем похожа на Data Science;

23:35 — как развивается биоинформатика и почему она важна;

40:00 — про платформы Folding at Home, World Community Grid;

1:05:09 — проблемы с хранилищами данных;

Юрий считает, что у каждого специалиста своё представление о том, что это за область науки. Но герою выпуска ближе такое определение — биоинформатики придумывают, как обрабатывать большие массивы биологических данных, чтобы получить из них конкретные научные результаты.

Эта дисциплина немного похожа на эксперименты в биологии, когда учёный в лаборатории проводит опыты, занимается исследованиями и получает результаты. По словам Юрия, его коллеги называют это «мокрой биологией».

«Мокрый биолог» делает в лаборатории разные манипуляции с живыми клетками, потом куда-то их засевает, пересевает, смешивает растворы. Человек, который занимается биоинформатикой, — dry biologist («сухой биолог»). Он, как и все программисты, выполняет рутинные задачи — пишет программы, скрипты, а потом их запускает. Отличие в том, что работа биоинформатика похожа на работу дата-сайентиста. Нужно не только написать, как обработать входные данные, и получить из них что-то. Ещё надо придумать, как всё это дело применить и как интерпретировать полученные результаты.

Впервые биоинформатику применили, когда люди начали заниматься геномом — это набор молекул ДНК с наследственной информацией. Геном есть у всех живых существ — от бактерий до людей. Если прочитать его и узнать всё про наследственную информацию, человечество научится исправлять наследственные ошибки, подбирать новые методы терапии и т.д.

Проблема в том, что наследственная информация очень большая — это очень длинный текст. Геном человека состоит из трёх миллиардов символов. Чтобы с ним правильно работать, его нужно для начала расшифровать.

Представьте, что у вас была пачка газет и её сначала взорвали, а потом нужно попытаться этот «пазл» составить обратно, собрать исходную газетную страницу из разорванных кусочков. Примерно так работает прочитывание генетических текстов.

В основе расшифровки генома — метод секвенирования. Это прочитывание, восстановление последовательности. Биолог берёт длинную цепочку символов генома и «разрезает» на небольшие кусочки. Затем использует секвенаторы (молекулярно-биологические приборы) — они помогают реконструировать последовательность символов в каждом кусочке. Секвенатор выдаёт набор прочитанных последовательностей — они и станут исходными данными для биоинформатики.

Если совсем на мой рабоче-крестьянский уровень опуститься, секвенатор — это такой специальный биологический компьютер. Мы в него что-то капаем, а он нам на экране буковки показывает.

Это наука на стыке двух областей — биологии и информатики. Поэтому в неё приходят программисты и биологи. Наш гость пришёл со стороны биологии. Поступил в СПбГУ на биофак, работал на кафедре, специализировался на генетике. Параллельно слушал онлайн-курсы по программированию, а потом узнал про биоинформатику.

В какой-то момент коллеги сказали: «Раз тебе это так интересно, то лучше просто получить дополнительное образование по биоинформатике». Так я и попал в Институт биоинформатики.

По словам Юрия, биоинформатика развивается очень активно, потому что для биологии и медицины уже недостаточно описательных исследований. Нужно проанализировать всё то, что человечество открыло за это время.

Практически всё, что можно было описать, уже описано. В последние 50 лет биология перешла на уровень, когда нужно не просто описать, как выглядит зверушка, где она обитает и что делает. Биология хочет знать, как это всё работает. Она пытается понять, как устроены живые организмы.

Необязательно. Прочитать геном одного человека стоит около тысячи долларов. Современные приборы позволяют читать геномы нескольких десятков человек. Но биоинформатика — это довольно хрупкая наука. Если «мокрый биолог» допустил ошибку в лаборатории или реагент изначально оказался некачественным, всё исследование нужно будет проводить заново. Из-за этого увеличится и бюджет, конечно же.

Многие исследования времязатратные. Ты долго-долго растил какую-то культуру раковых клеток и что-то с ними хотел сделать. А потом кто-нибудь пришел и не вытер ноги при входе в лабораторию или не надел халат правильно. Что-то попало в твою культуру, и всё сдохло.

№1 — колоссальные объёмы данных. Один прочитанный геном человека — это 100 гигабайт данных. Представьте, что вам нужно секвенировать сотни геномов.

В Великобритании люди пытаются отсеквенировать геномы всех новорожденных в течение кучи лет. Понятно, что это уже миллионы отдельных образцов, миллионы прочитанных геномов. И каждый, соответственно, по 100 гигабайт сырых данных. Это начинает уходить в космос по части объёма информации.

Данных уже так много, а найти эффективный метод для проверки гипотезы очень сложно. Учёные работали по-разному, получили разные результаты — и вся эта информация лежит в разных местах. Ну и как итог — собрать её из разных работ от разных людей очень непросто. Это может быть очень затратно и по времени, и по финансам.

№2 — биоинформатический софт. Некоторые часто используемые программы активно разрабатывают и улучшают, но они заточены под стандартные задачи.

С таким программами можно работать. Но если задача хотя бы чуть-чуть является нестандартной и люди пишут какие-то новые инструменты, разрабатывают новые алгоритмы для решения какой-то менее популярной задачи, получается софт в ужасном состоянии.

Например, вижу статью про «десять биоинформатических инструментов», которые помогают решить конкретную какую-то задачу. Наверное, восемь из десяти программ уже не работают. Потому что человек удалил свой репозиторий на GitHub или вообще залил софт на какой-то, прости господи, SourceForge, где он и погиб. Так что либо софта вообще нет, либо его невозможно скомпилировать без длительного и больного исправления всех багов, которые автор туда внёс.

Юрий подробно рассказал, чему обучаться, чтобы попасть в биоинформатику. Послушайте, начиная с 1:15:00. Если вкратце — обучение недорогое, но долгое. Предложений на рынке мало, но на крутых спецов спрос всегда есть. Нужно самому искать проекты и задачи, предлагать помощь и обрастать контактами.

Если прямо фокусироваться на том, чтобы войти в область полноценно и с перспективой, обучение потребует больших временных инвестиций. Но это вполне может стать парт-тайм работой на 20 часов в неделю минимум.

«Закон есть закон»: как жить в юридическом мире, если ты из айти.

Источник

Профессия: биоинформатик

Научные исследования, решение прикладных задач и перспективы в будущем

что такое биоинформатика институт биоинформатики. Смотреть фото что такое биоинформатика институт биоинформатики. Смотреть картинку что такое биоинформатика институт биоинформатики. Картинка про что такое биоинформатика институт биоинформатики. Фото что такое биоинформатика институт биоинформатики

что такое биоинформатика институт биоинформатики. Смотреть фото что такое биоинформатика институт биоинформатики. Смотреть картинку что такое биоинформатика институт биоинформатики. Картинка про что такое биоинформатика институт биоинформатики. Фото что такое биоинформатика институт биоинформатики

Преподаватель курса биоинформатики в «Фоксфорде» Сергей Исаев рассказывает о своей профессии, карьерных перспективах и заработках молодого специалиста с дипломом биоинформатика.

От программирования к биологии

Я родился и учился в школе в Астрахани. До 9-го класса увлекался математикой и информатикой: участвовал в местных олимпиадах, самостоятельно изучил Python и пытался писать простенькие программы. Я очень не любил биологию в средних классах, однако в 9-м классе началось изучение молекулярной биологии, генетики и эволюции — и я понял, что это моё.

Я стал посвящать гораздо больше времени биологии и в какой-то момент начал заниматься в основном ей. Важной вехой стало участие в Школе молекулярной и теоретической биологии (ШМТБ). Здесь старшие школьники со всей России занимаются настоящими научными проектами под руководством действующих учёных. В школе я выбрал «сухую» (биоинформатическую) лабораторию Максима Имакаева, в которой занимались компьютерным моделированием диффузии хроматина. Тогда-то понял, что вместо того, чтобы выбирать что-то одно, я могу заняться сразу и биологией, и программированием.

Поступление в МГУ

В ШМТБ я прислушался к мнению преподавателей, прочитал отзывы в интернете и принял окончательное решение поступать на факультет биоинженерии и биоинформатики МГУ. Для поступления нужно было сдавать ЕГЭ по русскому языку, математике, химии, биологии и ДВИ по математике.

что такое биоинформатика институт биоинформатики. Смотреть фото что такое биоинформатика институт биоинформатики. Смотреть картинку что такое биоинформатика институт биоинформатики. Картинка про что такое биоинформатика институт биоинформатики. Фото что такое биоинформатика институт биоинформатики

Поступить было относительно непросто. Я самостоятельно занимался почти всё свободное от школы время, участвовал во Всероссийской олимпиаде школьников по биологии: диплом победителя или призёра гарантировал бы мне поступление. Но мне не хватило всего 0,2 балла до того, чтобы стать призёром на заключительном этапе. Пришлось поступать по результатам ЕГЭ.

Мне очень помогло наличие действительных дипломов нескольких олимпиад по химии, биологии и математике. Они принесли мне 100 баллов ЕГЭ по биологии и химии и 100 баллов ДВИ по математике. Всего получилось около 490 баллов — и я прошёл на бюджет. А вот в 2020 году ситуация с поступлением на факультет была сложнее — все бюджетные места были заняты призёрами и победителями ВсОШ, поэтому по ЕГЭ поступить было в принципе невозможно.

Чем занимается биоинформатик

Важно: под словом «биоинформатика» можно понимать разные вещи.

Во-первых, биоинформатика — это один из методов проведения фундаментальных биологических исследований. Например, с помощью алгоритмов можно определить, каким образом общаются злокачественные клетки рака с соседними клетками, или понять эволюцию группы организмов. Выбор методов и подходов зависит от поставленной цели. Задача биоинформатика — получить данные, изучить их и понять, какую информацию и с помощью каких алгоритмов можно из этих данных извлечь. Чтобы работать в этом направлении, нужно очень хорошо разбираться в какой-то конкретной области биологии.

Во-вторых, биоинформатика — это одно из направлений компьютерных наук. Есть биоинформатики, которые создают алгоритмы и разрабатывают пакеты программ для анализа данных. Здесь важно хорошо понимать фундаментальную математику и алгоритмы.

И в-третьих, биоинформатика — это метод решения прикладных задач в биотехнологической и медицинской индустрии. Например, с помощью анализа данных пациентам можно точнее назначать лекарство при разных заболеваниях. Для этого в медицинских и биотехнологических компаниях в штат нанимают биоинформатиков. Здесь для успешной карьеры не обязательно глубоко разбираться в каком-то конкретном домене биологии, достаточно быть компетентным в своей области — базовой молекулярной биологии и data science.

Чем я занимаюсь сейчас

Сейчас я учусь на 6-м курсе факультета биоинженерии и биоинформатики МГУ. Параллельно с учёбой с 3-го курса работаю в Институте проблем передачи информации РАН в лаборатории Юрия Валентиновича Панчина.

Я безумно благодарен судьбе, что попал к нему в лабораторию: это один из самых важных людей в моей академической карьере. Сложно переоценить, какую поддержку он мне оказывал в течение всей совместной работы. Сначала я был стажёром-исследователем, а потом стал исполняющим обязанности младшего научного сотрудника. В этой лаборатории я занимался в основном сравнительной геномикой различных беспозвоночных животных.

Также с 5-го курса я работаю в компании BostonGene, которая занимается исследованиями в области рака и разрабатывает систему для индивидуальной терапии пациентов на основе генетических анализов. Я занимаюсь исследованиями в отделе молекулярной онкологии.

Ещё одна сторона моей деятельности — преподавание. Курс по биоинформатике я начал вести в 2018 году — сначала в школе № 57, потом в школе «Летово». За это время удалось сделать неплохую программу, и вот с 2020 года веду курс биоинформатики и в «Фоксфорде». Мне очень нравится преподавать.

Это возможность общаться с людьми, рассказывать ребятам что-то новое, о чём они не прочитают в интернете, а также самому развиваться в профессии. Любая информация лучше укладывается в голове, когда её объясняешь другим.

Качества и навыки, которые нужны биоинформатику

Любознательность

В этой профессии очень важно обладать тягой к познанию, изучению нового, быть открытым новым методам. Биоинформатика очень быстро развивается, методы устаревают буквально на глазах за несколько лет — нужно быть в тренде, стремиться попробовать что-то новое.

Целеустремлённость

Чтобы сделать успешную карьеру, требуется приложить большие усилия, и тут очень важно не бросить на полпути, уметь поставить и достичь цель, проявлять усердие и терпение.

Математика

В биоинформатику не стоит идти, если пугает математика и математические методы. Математика необходима, чтобы разбираться в статистике, анализе данных, методах машинного обучения.

Аналитическое мышление

Биоинформатик постоянно имеет дело с анализом информации. Он должен уметь обобщать, отделять главное от второстепенного, группировать данные по категориям, устанавливать причины и следствия.

Английский язык

Это язык современной науки, на нём проходят конференции, публикуются статьи, книги, исследования. В программировании и IT тоже не обойтись без английского языка, так что биоинформатику свободный английский особенно важен.

Карьера и зарплата

Карьерная лестница, зарплата и перспективы зависят в том числе от того, какую из двух сторон профессии выбрать: научные исследования или решение прикладных задач.

В науке можно пройти путь от аспиранта до доктора наук и директора собственной лаборатории, сделать открытие и даже получить Нобелевскую премию. Однако на первых порах зарплата вряд ли будет высокой. Сейчас наука во многом существует за счёт грантов. Если вы даже аспирантом попадёте в хорошую лабораторию, которая занимается актуальными исследованиями, то сможете зарабатывать и 70 тысяч рублей в месяц. А можете попасть в неудачную лабораторию и зарабатывать намного меньше.

В индустрии вы начнёте с места джуниора в отделе компании, где перед вами будут ставить конкретные задачи, но по мере освоения профессии, нарабатывая опыт, можете стать, например, директором отдела компьютерных исследований. Биотехнологических компаний на рынке сейчас намного больше, чем 10 лет назад. Это молодая развивающаяся сфера, которая связана со здоровьем человека, так что новые рабочие места будут появляться. Зарплата начинающего биоинформатика в Москве колеблется от 60 до 80 тысяч рублей, ну а дальше можно зарабатывать и больше — карьерный рост тут устроен примерно так же, как и в других IT-компаниях.

Смежные сферы, куда можно пойти работать с образованием биоинформатика

Биоинженерия. Специальность на факультете называется «биоинженерия и биоинформатика», там дают знания в области молекулярной биологии, генетики, и теоретически можно пойти работать в эти сферы.

IT. Вы получите обширные знания в области компьютерных наук и анализа данных и сможете полностью уйти в эту сферу без привязки к биологии.

Медицинская статистика. Статистика — составная часть анализа данных, и если умеете одно — сможете и другое.

Где учиться на биоинформатика

Университеты с направлением «Биоинженерия и биоинформатика»:

Также биоинформатике обучают на таких направлениях, как «Биотехнические системы и технологии» (Уральский федеральный университет им. Б.Н. Ельцина), «Биомедицинские технические системы» (МГТУ им. Н.Э. Баумана), «Биотехнические и медицинские аппараты и системы» (МАИ, Национальный исследовательский университет «МЭИ», СПбГЭТУ «ЛЭТИ», Санкт-Петербургский государственный университет аэрокосмического приборостроения).

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter

Источник

Просто о сложном: что нужно знать о биоинформатике

Если спросить случайного прохожего, что такое биология, он наверняка ответит что-то вроде «наука о живой природе». Про информатику скажет, что она имеет дело с компьютерами и информацией. Если мы не побоимся быть навязчивыми и зададим ему третий вопрос – что такое биоинформатика? – тут-то он наверняка и растеряется. Логично: про эту область знаний даже в ЕРАМ знает далеко не каждый – хотя в нашей компании и биоинформатики есть. Давайте разбираться, для чего эта наука нужна человечеству вообще и ЕРАМ в частности: в конце концов, вдруг нас на улице об этом спросят.

что такое биоинформатика институт биоинформатики. Смотреть фото что такое биоинформатика институт биоинформатики. Смотреть картинку что такое биоинформатика институт биоинформатики. Картинка про что такое биоинформатика институт биоинформатики. Фото что такое биоинформатика институт биоинформатики

Почему биология перестала справляться без информатики и при чем тут рак

Чтобы провести исследование, биологам уже недостаточно взять анализы и посмотреть в микроскоп. Современная биология имеет дело с колоссальными объемами данных. Часто обработать их вручную просто невозможно, поэтому многие биологические задачи решаются вычислительными методами. Не будем далеко ходить: молекула ДНК настолько мала, что разглядеть ее под световым микроскопом нельзя. А если и можно (под электронным), всё равно визуальное изучение не помогает решить многих задач.

ДНК человека состоит из трех миллиардов нуклеотидов – чтобы вручную проанализировать их все и найти нужный участок, не хватит и целой жизни. Ну, может и хватит – одной жизни на анализ одной молекулы – но это слишком долго, дорого и малопродуктивно, так что геном анализируют при помощи компьютеров и вычислений.

Биоинформатика — это и есть весь набор компьютерных методов для анализа биологических данных: прочитанных структур ДНК и белков, микрофотографий, сигналов, баз данных с результатами экспериментов и т. д.

что такое биоинформатика институт биоинформатики. Смотреть фото что такое биоинформатика институт биоинформатики. Смотреть картинку что такое биоинформатика институт биоинформатики. Картинка про что такое биоинформатика институт биоинформатики. Фото что такое биоинформатика институт биоинформатики

Иногда секвенировать ДНК нужно, чтобы подобрать правильное лечение. Одно и то же заболевание, вызванное разными наследственными нарушениями или воздействием среды, нужно лечить по-разному. А еще в геноме есть участки, которые не связаны с развитием болезни, но, например, отвечают за реакцию на определенные виды терапии и лекарств. Поэтому разные люди с одним и тем же заболеванием могут по-разному реагировать на одинаковое лечение.

Еще биоинформатика нужна, чтобы разрабатывать новые лекарства. Их молекулы должны иметь определенную структуру и связываться с определенным белком или участком ДНК. Смоделировать структуру такой молекулы помогают вычислительные методы.

Достижения биоинформатики широко применяют в медицине, в первую очередь в терапии рака. В ДНК зашифрована информация о предрасположенности и к другим заболеваниям, но над лечением рака работают больше всего. Это направление считается самым перспективным, финансово привлекательным, важным – и самым сложным.

Биоинформатика в ЕРАМ

В ЕРАМ биоинформатикой занимается подразделение Life Sciences. Там разрабатывают программное обеспечение для фармкомпаний, биологических и биотехнологических лабораторий всех масштабов — от стартапов до ведущих мировых компаний. Справиться с такой задачей могут только люди, которые разбираются в биологии, умеют составлять алгоритмы и программировать.

Биоинформатики – гибридные специалисты. Сложно сказать, какое знание для них первично: биология или информатика. Если так ставить вопрос, им нужно знать и то и другое. В первую очередь важны, пожалуй, аналитический склад ума и готовность много учиться. В ЕРАМ есть и биологи, которые доучились информатике, и программисты с математиками, которые дополнительно изучали биологию.

Как становятся биоинформатиками

Мария Зуева, разработчик:

«Я получила стандартное ИТ-образование, потом училась на курсах ЕРАМ Java Lab, где увлеклась машинным обучением и Data Science. Когда я выпускалась из лаборатории, мне сказали: «Сходи в Life Sciences, там занимаются биоинформатикой и как раз набирают людей». Не лукавлю: тогда я услышала слово «биоинформатика» в первый раз. Прочитала про нее на Википедии и пошла.

Тогда в подразделение набрали целую группу новичков, и мы вместе изучали биоинформатику. Начали с повторения школьной программы про ДНК и РНК, затем подробно разбирали существующие в биоинформатике задачи, подходы к их решению и алгоритмы, учились работать со специализированным софтом».

Геннадий Захаров, бизнес-аналитик:

«По образованию я биофизик, в 2012-м защитил кандидатскую по генетике. Какое-то время работал в науке, занимался исследованиями – и продолжаю до сих пор. Когда появилась возможность применить научные знания в производстве, я тут же за нее ухватился.

Для бизнес-аналитика у меня весьма специфическая работа. Например, финансовые вопросы проходят мимо меня, я скорее эксперт по предметной области. Я должен понять, чего от нас хотят заказчики, разобраться в проблеме и составить высокоуровневую документацию – задание для программистов, иногда сделать работающий прототип программы. По ходу проекта я поддерживаю контакт с разработчиками и заказчиками, чтобы те и другие были уверены: команда делает то, что от нее требуется. Фактически я переводчик с языка заказчиков – биологов и биоинформатиков – на язык разработчиков и обратно».

Как читают геном

Чтобы понять суть биоинформатических проектов ЕРАМ, сначала нужно разобраться, как секвенируют геном. Дело в том, что проекты, о которых мы будем говорить, напрямую связаны с чтением генома. Обратимся за объяснением к биоинформатикам.

Михаил Альперович, глава юнита биоинформатики:

«Представьте, что у вас есть десять тысяч экземпляров «Войны и мира». Вы пропустили их через шредер, хорошенько перемешали, наугад вытащили из этой кучи ворох бумажных полосок и пытаетесь собрать из них исходный текст. Вдобавок у вас есть рукопись «Войны и мира». Текст, который вы соберете, нужно будет сравнить с ней, чтобы отловить опечатки (а они обязательно будут). Примерно так же читают ДНК современные машины-секвенаторы. ДНК выделяют из клеточных ядер и делят на фрагменты по 300–500 пар нуклеотидов (мы помним, что в ДНК нуклеотиды связаны друг с другом попарно). Молекулы дробят, потому что ни одна современная машина не может прочитать геном от начала до конца. Последовательность слишком длинная, и по мере ее прочтения накапливаются ошибки.

Вспоминаем «Войну и мир» после шредера. Чтобы восстановить исходный текст романа, нам нужно прочитать и расположить в правильном порядке все кусочки романа. Получается, что мы читаем книгу несколько раз по крошечным фрагментам. То же с ДНК: каждый участок последовательности секвенатор прочитывает с многократным перекрытием – ведь мы анализируем не одну, а множество молекул ДНК.

Полученные фрагменты выравнивают – «прикладывают» каждый из них к эталонному геному и пытаются понять, какому участку эталона соответствует прочитанный фрагмент. Затем в выравненных фрагментах находят вариации – значащие отличия прочтений от эталонного генома (опечатки в книге по сравнению с эталонной рукописью). Этим занимаются программы – вариант-коллеры (от англ. variant caller – выявитель мутаций). Это самая сложная часть анализа, поэтому различных программ – вариант-коллеров много и их постоянно совершенствуют и разрабатывают новые.

Подавляющее большинство найденных мутаций нейтральны и ни на что не влияют. Но есть и такие, в которых зашифрованы предрасположенность к наследственным заболеваниям или способность откликаться на разные виды терапии».

что такое биоинформатика институт биоинформатики. Смотреть фото что такое биоинформатика институт биоинформатики. Смотреть картинку что такое биоинформатика институт биоинформатики. Картинка про что такое биоинформатика институт биоинформатики. Фото что такое биоинформатика институт биоинформатики

Для анализа берут образец, в котором находится много клеток — а значит, и копий полного набора ДНК клетки. Каждый маленький фрагмент ДНК прочитывают несколько раз, чтобы минимизировать вероятность ошибки. Если пропустить хотя бы одну значащую мутацию, можно поставить пациенту неверный диагноз или назначить неподходящее лечение. Прочитать каждый фрагмент ДНК по одному разу слишком мало: единственное прочтение может быть неправильным, и мы об этом не узнаем. Если мы прочитаем тот же фрагмент дважды и получим один верный и один неверный результат, нам будет сложно понять, какое из прочтений правдивое. А если у нас сто прочтений и в 95 из них мы видим один и тот же результат, мы понимаем, что он и есть верный.

«Для анализа раковых заболеваний секвенировать нужно и здоровую, и больную клетку. Рак появляется в результате мутаций, которые клетка накапливает в течение своей жизни. Если в клетке испортились механизмы, отвечающие за ее рост и деление, то клетка начинает неограниченно делиться вне зависимости от потребностей организма, т. е. становится раковой опухолью. Чтобы понять, чем именно вызван рак, у пациента берут образец здоровой ткани и раковой опухоли. Оба образца секвенируют, сопоставляют результаты и находят, чем один отличается от другого: какой молекулярный механизм сломался в раковой клетке. Исходя из этого подбирают лекарство, которое эффективно против клеток с “поломкой”».

Биоинформатика: производство и опенсорс

У подразделения биоинформатики в ЕРАМ есть и производственные, и опенсорс-проекты. Причем часть производственного проекта может перерасти в опенсорс, а опенсорсный проект – стать частью производства (например, когда продукт ЕРАМ с открытым кодом нужно интегрировать в инфраструктуру клиента).

Проект №1: вариант-коллер

Для одного из клиентов – крупной фармацевтической компании – ЕРАМ модернизировал программу вариант-коллер. Ее особенность в том, что она способна находить мутации, недоступные другим аналогичным программам. Изначально программа была написана на языке Perl и обладала сложной логикой. В ЕРАМ программу переписали на Java и оптимизировали – теперь она работает в 20, если не в 30 раз быстрее.

Исходный код программы доступен на GitHub.

Проект №2: 3D-просмотрщик молекул

Для визуализации структуры молекул в 3D есть много десктоп- и веб-приложений. Представлять, как молекула выглядит в пространстве, крайне важно, например, для разработки лекарств. Предположим, нам нужно синтезировать лекарство, обладающее направленным действием. Сначала нам потребуется спроектировать молекулу этого лекарства и убедиться, что она будет взаимодействовать с нужными белками именно так, как нужно. В жизни молекулы трехмерные, поэтому анализируют их тоже в виде трехмерных структур.

Для 3D-просмотра молекул ЕРАМ сделал онлайн-инструмент, который изначально работал только в окне браузера. Потом на основании этого инструмента разработали версию, которая позволяет визуализировать молекулы в очках виртуальной реальности HTC Vive. К очкам прилагаются контроллеры, которыми молекулу можно поворачивать, перемещать, подставлять к другой молекуле, поворачивать отдельные части молекулы. Делать всё это в 3D куда удобнее, чем на плоском мониторе. Эту часть проекта биоинформатики ЕРАМ делали совместно с подразделением Virtual Reality, Augmented Reality and Game Experience Delivery.

Программа только готовится к публикации на GitHub, зато пока есть ссылка, по которой можно посмотреть ее демо-версию.

Как выглядит работа с приложением, можно узнать из видео.

Проект №3: геномный браузер NGB

Геномный браузер визуализирует отдельные прочтения ДНК, вариации и другую информацию, сгенерированную утилитами для анализа генома. Когда прочтения сопоставлены с эталонным геномом и мутации найдены, ученому остается проконтролировать, правильно ли сработали машины и алгоритмы. От того, насколько точно выявлены мутации в геноме, зависит, какой диагноз поставят пациенту или какое лечение ему назначат. Поэтому в клинической диагностике контролировать работу машин должен ученый, а помогает ему в этом геномный браузер.

Биоинформатикам-разработчикам геномный браузер помогает анализировать сложные случаи, чтобы найти ошибки в работе алгоритмов и понять, как их можно улучшить.

Новый геномный браузер NGB (New Genome Browser) от ЕРАМ работает в вебе, но по скорости и функционалу не уступает десктопным аналогам. Это продукт, которого не хватало на рынке: предыдущие онлайновые инструменты работали медленнее и умели делать меньше, чем десктопные. Сейчас многие клиенты выбирают веб-приложения из соображений безопасности. Онлайн-инструмент позволяет ничего не устанавливать на рабочий компьютер ученого. С ним можно работать из любой точки мира, зайдя на корпоративный портал. Ученому не обязательно всюду возить за собой рабочий компьютер и скачивать на него все необходимые данные, которых может быть очень много.

что такое биоинформатика институт биоинформатики. Смотреть фото что такое биоинформатика институт биоинформатики. Смотреть картинку что такое биоинформатика институт биоинформатики. Картинка про что такое биоинформатика институт биоинформатики. Фото что такое биоинформатика институт биоинформатики

Геннадий Захаров, бизнес-аналитик:

«Над опенсорсными утилитами я работал частично как заказчик: ставил задачу. Я изучал лучшие решения на рынке, анализировал их преимущества и недостатки, искал, как можно их усовершенствовать. Нам нужно было сделать веб-решения не хуже десктопных аналогов и при этом добавить в них что-то уникальное.

В 3D-просмотрщике молекул это была работа с виртуальной реальностью, а в геномном браузере – улучшенная работа с вариациями. Мутации бывают сложными. Перестройки в раковых клетках иногда затрагивают огромные области. В них появляются лишние хромосомы, куски хромосом и целые хромосомы исчезают или объединяются в случайном порядке. Отдельные куски генома могут копироваться по 10–20 раз. Такие данные, во-первых, сложнее получить из прочтений, а во-вторых, сложнее визуализировать.

Мы разработали визуализатор, который правильно читает информацию о таких протяженных структурных перестройках. Еще мы сделали набор визуализаций, который при контакте хромосом показывает, образовались ли из-за этого контакта гибридные белки. Если протяженная вариация затрагивает несколько белков, мы по клику можем рассчитать и показать, что происходит в результате такой вариации, какие гибридные белки получаются. В других визуализаторах ученым приходилось отслеживать эту информацию вручную, а в NGB – в один клик».

Как изучать биоинформатику

Мы уже говорили, что биоинформатики – гибридные специалисты, которые должны знать и биологию, и информатику. Самообразование играет в этом не последнюю роль. Конечно, в ЕРАМ есть вводный курс в биоинформатику, но рассчитан он на сотрудников, которым эти знания пригодятся на проекте. Занятия проводятся только в Санкт-Петербурге. И всё же, если биоинформатика вам интересна, возможность учиться есть:

1) Вводный курс в генетическую диагностику от компании 23andme.
2) Несколько курсов на Coursera (в том числе пара курсов на русском: введение в биоинформатику и в метагеномику).
3) Курсы на Stepik от института биоинформатики: молекулярная биология и генетика, молекулярная филогенетика, генная инженерия и введение в технологии высокоэффективного секвенирования. Полный список курсов от института можно посмотреть на его официальном сайте.
4) Лекции Павла Певзнера – профессора Калифорнийского университета в Сан-Диего, специалиста в области биоинформатики.
5) Если вы живете в Санкт-Петербурге, можно прийти на гостевые лекции в институт биоинформатики – это бесплатно.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *