tbd2 bioinformatics. windows of opportunities

31
1 Биоинформатика. Окна возможностей 1 Окна возможностей Ключевой спикер Павел Певзнер Биоинформатика. Профессор отделения компьютерных наук и инженерии Университета Калифорнии (Сан-Диего) 30 августа 2012 www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru w www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru w

Upload: gamechangers-gamechangers

Post on 22-Mar-2016

213 views

Category:

Documents


0 download

DESCRIPTION

 

TRANSCRIPT

1

Биоинформатика. Окна возможностей

1

Окна возможностей

Ключевой спикер

Павел Певзнер

Биоинформатика.

Профессор отделения компьютерных наук

и инженерии

Университета Калифорнии (Сан-Диего)

30 августа 2012

www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru

www.tbd.ru

www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru www.tbd.ru

www.tbd.ru

2

technology business development, to be defined

2

СОДЕРЖАНИЕ

О Павле Певзнере 3

Эксперты 4

О семинаре 8

Мировой контекст 10

Российский контекст 13

Заказная разработка 16

Технологии секвенирования в России и за рубежом 17

Проекты и стартапы 19

Образование и исследования 22

Окна возможностей 26

Организаторы и партнеры 30

3

Биоинформатика. Окна возможностей

3

О ПАВЛЕ ПЕВЗНЕРЕ

Профессор отделения компьютерных наук и инженерии Университета Калифорнии (Сан-

Диего). В 1988 получил степень кандидата физико-математических наук в Московском

физико-техническом институте, с 1987 по 1990 работал исследователем в НИИ Генетики.

В 1990 г. уехал на постдок в University of Southern California. С 1992

преподавал и вел исследования в Pennsylvania State University. В 1995

вернулся в University of Southern California, преподавал на кафедрах

математики, информатики и молекулярной биологии. С 2000 работал в

University of California San Diego (UCSD). Является директором Центра

вычислительной масс-спектрометрии и входит в научный совет Genome

Institute of Singapore.

В 2010 г. стал победителем конкурса мегагрантов, проводимого министерством образования

РФ, по привлечению ученых с мировым именем в Россию. По этому гранту руководит

созданием лаборатории алгоритмической биологии в Санкт-Петербургском Академическом

университете.

Павел - автор книг по алгоритмам в биоинфоматике и вычислительной биологии,

сооснователь и председатель организационного комитета ежегодной международной

конференции по вычислительной молекулярной биологии (RECOMB), входит в редколлегии

множества профильных научных журналов. Автор сотен научных публикаций, в том числе в

журнале Science. В 2010 получил звание ACM Fellow за вклад в секвенирование ДНК,

протеомику и алгоритмы расшифровки генома.

Личная страница на сайте UCSD

4

technology business development, to be defined

4

ЭКСПЕРТЫ

Александр Карабельский

Руководитель лаборатории молекулярной генетики в компании Биокад

Алла Лапидус

Сотрудник лаборатории алгоритмической биологии Санкт-

Петербургского Академического университета Российской Академии

наук (СПбАУ РАН), сотрудник Центра геномной биоинформатики им.

Ф.Г. Добржанского, сотрудник Ракового центра Фокс Чейза,

Филадельфия, США

Михаил Капушевский

CEO и основатель GeneStack, консультант в Европейском институте

биоинформатики

Дмитрий Коростин

Руководитель отдела исследований компании Генотек

5

Биоинформатика. Окна возможностей

5

Василий Федорин

Ведущий специалист по анализу проектов в Биофонде РВК

Николай Вяххи

Сотрудник лаборатории алгоритмической биологии Санкт-

Петербургского Академического университета Российской Академии

наук (СПбАУ РАН), руководитель магистерской программы по

биоинформатике и курсов по биоинформатике в АУ РАН

Вячеслав Нестеров

Генеральный директор Санкт-Петербургского центра разработок EMC

Дмитрий Гальперин

директор по инвестициям фонда Runa Capital

Мария Самсонова

Профессор Санкт-Петербургского Политехнического Университета

(СПБГПУ), межвузовский научно-образовательный центр (НОЦ)

«Математическая биология систем»

6

technology business development, to be defined

6

Александр Азаров

Заместитель технического директора в компании Wave Access

Анна Шумейко

Начальник отдела развития медико-фармацевтических проектов в

КЭРППТ

Виталий Пруцкий

глава центра по биоинформатике и прогностической медицине

«AstraZeneca» в Санкт-Петербурге

Владимир Шварц

К.п.н., доцент. Руководитель отдела разработки алгоритмов компании

GGA Software

Александр Павлов

Руководитель проекта Sequoia Genetics, компания входящая в состав

Группы компаний Алкор Био

7

Биоинформатика. Окна возможностей

7

Андрей Терехов

Доктор физико-математических наук, заведующий кафедрой

системного программирования СПбГУ

Алексей Лагунин

Специалист в НИИ биомедицинской химии РАМН. Разработчик

компьютерной системы "ФармаЭксперт".

Валентин Макаров

Президент некоммерческого партнёрства РУССОФТ

Марина Грановская

Менеджер по научному сотрудничеству фармацевтической компании

Roche

8

technology business development, to be defined

8

О СЕМИНАРЕ

Семинар «Биоинформатика. Окна возможностей» - третий семинар проекта,

организованного «Центром Предпринимательства США в России» и межвузовской

программой Game|Changers при поддержке РВК. Серия семинаров ставит цель по

объединению двух тем: предметной области как биоинформатика в данном семинаре и

предпринимательства в ракурсе открывающихся возможностей для инновационного

бизнеса. tbd2 (Technology, business, development: to be defined) - это площадка для

представления и обсуждения тенденций и передовых разработок в значимых сферах

технологического развития и общественной жизни и их возможной роли в трансформации

рынков, компаний и общества.

Игорь Егоров, руководитель Санкт-Петербургского офиса Центра предпринимательства: «Те,

кто присутствуют сегодня на семинаре, станут, если ещё не являются, основателями

очень успешных и серьёзных компаний».

В рамках семинара стояли следующие задачи: раскрыть, чем является биоинформатика,

оценить развитие биоинформатики в мире и в России, выявить, какие биоинформатические

проекты и исследования существуют в России и в Санкт-Петербурге, а также понять, какие

окна возможностей биоинформатика предоставляет современному бизнесу.

Почему было выбрано это направление? Сейчас есть уникальная возможность создать в

Санкт-Петербурге центр компетенций по биоинформатике. За эти два-три года и в

академической, и в бизнес среде города произошло несколько существенных событий.

Причем до 2010 года в сфере разработки софта для биотеха были замечены только две

компании: GGA Software Services и Wave Access. В университетах исследования велись в

основном в области компьютерной биологии, в частности в 2002 году Мария Самсонова

начала вести городской семинар в Политехническом университете по этой теме.

9

Биоинформатика. Окна возможностей

9

2010

● Начали свою работу две вузовских лаборатории - в АУ РАН лаборатория

алгоритмической биологии под руководством Павла Певзнера и в НИУ ИТМО на базе

кафедры "КТ" лаборатория "Алгоритмы сборки геномных последовательностей".

● Двумя университетами — СПбГПУ и СПбГУ образован межвузовский Научно-

образовательный центр (НОЦ) «Математическая биология систем» — для научной

работы и обучения в области математической и системной биологии.

● В АУ РАН при поддержке JetBrains работает магистратура "Алгоритмы и анализ данных

в биоинформатике".

● В программу летней практики для школьников 10 классов ФМЛ 239 и 30 на кафедре

"Прикладная математика" включена лекция Марии Самсоновой о биоинформатике

2011

● Сформирована лаборатория биоинформатики НИУ ИТМО (фактически исследования

велись с 2007 г.)

● В рамках межвузовской программы Game|Changers мы стартовали трек по бизнесу в

сфере биоинформатики.

● AstraZeneca работает над созданием центра биоинформатики и прогностической

медицины.

2012

● Михаил Капушевский запускает в Великобритании стартап GeneStack (сотрудники

набираются в Петербурге в сотрудничестве с JetBrains).

● На базе СПбГУ в лаборатории Стивена О’Брайена открыт центр геномной

биоинформатики им. Ф.Г. Добржанского.

● Корпорация EMC c помощью своего петербургского центра разработок начинает

работу над запуском своего сколковского центра исследований и разработок по

облачным технологиям и аналитике big data в области биоинформатики и

энергоэффективности.

● Состоялся первый петербургский TEDx - TEDxNevaRiver. На нем выступили два спикера

занимающиеся в России биоинформатикой - Михаил Гельфанд (МГУ, ИППИ РАН) и

Николай Вяххи (АУ РАН).

● Запущена платформа Rosalind - среда для изучения биоинформатики с помощью

решения задач. Совместная разработка University of California San Diego и АУ РАН

10

technology business development, to be defined

10

перенимает опыт таких практико-ориентированных проектов как Project Euler, Google

Code Jam и открытых он-лайн курсов.

● Открыта магистратура по биоинфоматике (а также математической системной

биологии и медицины) в СПбГПУ на базе кафедры прикладной математики.

● в конце августа формируется "неделя биоинформатики": две научных конференции 4th

RECOMB Satellite Conference on Bioinformatics Education и (RECOMB-BE) и 1st RECOMB

Satellite Conference on Open Problems in Algorithmic Biology (RECOMB-AB) и

экосистемный семинар tbd2 "Биоинофрматика. Окна Возможностей".

Исследовательский и бизнес контексты начинают формироваться. Поэтому важно не

упустить момент, чтобы катализровать создание и необходимой экосистемы для

привлечения талантов и капиталов в эту отрасль. Семинар tbd2 - один из инструментов,

который может поддержать этот процесс.

МИРОВОЙ КОНТЕКСТ

def Биоинформатика - всё, что связано с вычислениями и компьютерами в биологиеских науках,

и, следовательно, в биотехнологиях, как в индустриальном приложении биологических

наук. В настоящий момент, вычислительная работа становится ключевой составляющей

многих биотехнологических компаний, индикатором этого факта также является постоянное

увеличение доли программистов в штате биотехнологических компаний.

Павел Певзнер, профессор отделения компьютерных наук и инженерии Университета

Калифорнии (Сан-Диего): «Биотехнологические компании превращаются в

вычислительные. Экспериментальная работа сводится к рутине, в то время как

вычислительная работа представляет наиболее креативную часть».

Естественные науки в наше время – одно из самых перспективных направлений. Если

Кремниевая долина создавалась на физике и электротехнике, то сейчас среди основных

направлений проектов преобладает совокупность естественных и компьютерных наук. В то

время как в мире биоинформатика находится в своём расцвете, в России

биоинформатическая наука сжалась до уровня одного американского университета. Страна,

по мнению Павла Певзнера, на 15 лет отстаёт от Запада, на 10 – от Индии и на 5 – от Китая.

11

Биоинформатика. Окна возможностей

11

К примеру, в таком крупном городе как Санкт-Петербург ежегодно выпускается 5000

магистров по специальностям, имеющим отношение к IT, из которых 400 соответствуют

хорошему уровню, а также 50-60 кандидатов наук, из которых 10-15 по квалификации

можно сравнивать с западными аспирантами. В 1995-96 годах американская компания

SmithKline Beecham открывала новый отдел биоинформатики, для которого требовалось

нанять 100 специалистов. Компания столкнулась с трудностями: в Америке в то время не

было университетских программ, которые готовят биоинформатиков. В результате, в

журнале “Science” вышла статья, в которой констатировался недостаток квалифицированных

кадров в этой области. И это был сигнал: через семь лет почти в каждом ведущем

университете в Штатах появилась биоинформатическая аспирантура. При этом необходимо

понимать, что специалистов по биоинформатике нельзя создать просто так, их нужно

выращивать. До аспирантуры необходимо подготовить магистра, до магистратуры –

бакалавра, а ведь все эти программы сначала нужно создать и поддерживать.

Павел Певзнер: «На пятимиллионный город нужно выпускать хотя бы 10 аспирантов-

биоинформатиков в год, так как область биоинформатики будет только расти!»

Российские исследования в биоинформатике на данный момент не являются

конкурентоспособными.

Павел Певзнер: «То, что самые лучшие скрипачи и программисты живут в России – это

всё-таки миф».

Данная ситуация обусловлена тем, что в России очень поздно начали заниматься

биоинформатикой, а также нехваткой ресурсов. Сейчас очень важно трезво оценить

ситуацию и понять, какие существуют возможности.

Алексей Лагунин, специалист НИИ биомедицинской химии РАМН: «Это неправда! В

некоторых областях исследований Россия даже превосходит конкурирующие страны!»

Действительно, в России есть интересные разработки, ведутся исследования, но мировое

сообщество о них не знает. Получается, что хорошие российские специалисты занимаются

12

technology business development, to be defined

12

биоинформатикой, но что-то не даёт им прорваться на мировую арену ни через бизнес, ни

через исследования. При этом, немереное количество биоинформатиков, работающих в

Америке, имеют русское происхождение, но реализуют себя в качестве успешных учёных на

Западе.

Алла Лапидус, сотрудник Центра геномной биоинформатики им. Ф.Г. Добржанского: «Я не

знаю ни одного биоинформатического инструмента, разработанного в России, который

был бы полезен в моих исследованиях, связанных с геномным анализом, сборкой и

выравниванием последовательностей».

Тем не менее, в России существуют отдельные сильные группы исследователей под

руководством Певзнера, Гельфанда, Колчанова и остальных преданных биоинформатике

учёных. Но появились они совсем недавно и находятся в процессе становления и наработки

репутации, которая в ближайшее время позволит им выйти на один уровень с известными

мировыми исследовательскими институтами биоинформатики, а также создать прецедент

первого русского «бренднейм» мирового значения.

13

Биоинформатика. Окна возможностей

13

РОССИЙСКИЙ КОНТЕКСТ

Большие транснациональные компании начинают проявлять интерес к России. Так,

крупная фармацевтическая компания «AstraZeneca» делала громкие заявление об

учреждении центра по биоинформатике и прогностической медицине в Санкт-Петербурге

в 2012 году, штат сотрудников планирует состоять из 10-15 исследователей.

Отношение компании к центру определяется двумя основными положениям: упором на

сотрудничество с компаниями, которые занимаются заказной разработкой в области

биоинформатики (в Санкт-Петербурге известны две компании, занимающиеся

алгоритмами и программным обеспечением), фокусом исследований: от центра ждут

качественного исполнения повседневных задач, а не прорывных инновационных

исследований.

В плане содействия развитию фармацевтических компаний, правительство Санкт-

Петербурга не бездействует: город работает над тем, чтобы фармацевтическим и

медицинским компаниям было интересно размещать свои исследовательские центры в

Петербурге. За последние два года комитетом экономического развития в рамках создания

фармкластера была проведена работа над 15-ю крупнейшими проектами по созданию

новых фармацевтических производств и выделены инвестиции в объёме более 30

миллиардов рублей.

Компания «AstraZeneca» также получила поддержку от петербургского правительства.

Основным условием прихода в город таких компаний как «AstraZeneca» и «Novartis» со

стороны города, является требование по привлечению местного научного потенциала для

разработки оригинальных препаратов.

На сегодняшний день, фармкластер постепенно превращается в кластер естественных

наук: уже включены медицинские и биотехнологические компании, а также компании,

занимающиеся радиологией. Кластер естественных наук Санкт-Петербурга получил

поддержку Министерства Экономики РФ и был включён в 13 приоритетных

инновационных кластеров РФ. Life Science кластер включает 145 компаний, 109

производств, 22 фармацевтические компании и 87 медицинских промышленных

14

technology business development, to be defined

14

организаций. R&D ниша на данный момент почти не занята и находится на начальной

стадии развития.

Анна Шумейко, начальник отдела развития медико-фармацевтических проектов в КЭРППТ:

«Основная задача, которую мы видим как город, - это поиск конкретных точек

соприкосновения для взаимодействия компаний и учёных. Мы хотим, чтобы контакты

были как можно чаще!»

Для поддержки отрасли, комитет участвует и проводит ежегодные мероприятия, такие как

Санкт-Петербургский международный форум «Фармацевтика. Медпром. Биотехнологии»,

а также мероприятия фонда «Life Science Invest».

Анна Шумейко: «Наши усилия направлены на то, чтобы к 2020 году доля медицинских

препаратов, произведённых в РФ, составила 50 процентов, а не сегодняшние 20».

Поддержку биотехнологическим компаниям готов оказывать биофонд РВК, но только при

условии, что такие компании начнут появляться. РВК выступает в роли «института

развития», это крупная государственная инвестиционная компания, которая помогает

развивать венчурный рынок России.

Василий Федорин, ведущий специалист по анализу проектов в Биофонде РВК: «Почему на

Западе люди идут сейчас на научные специальности? Потому что пришло понимание,

что своими мозгами можно заработать большие деньги. Где будут востребованы

15

Биоинформатика. Окна возможностей

15

высококвалифицированные специалисты? Они должны востребовать себя сами! Взять

свои идеи и превратить их в деньги на рынке».

В компании «Биокад» налажен эффективный бизнес-процесс, включающий разработку,

клинические исследования и регистрацию лекарственных препаратов. Основное внимание

уделяется работе с рекомбинантными белками, направленной на лечение онкологических

заболеваний и расстройств иммунной системы. Усилия исследовательского центра сегодня

сосредоточены на разработке препаратов на основе моноклональных антител, факторов

свёртывания крови. В настоящее время компания занимается строительством «БИОКАД-

2.0» в ОЭЗ «НОЙДОРФ» (Стрельна) – второй очереди производственных мощностей и

подразделения R&D.

На первом этапе исследований, компания занимается разработкой препаратов и

геноинженерной работой. Биоинформатика интересует «Биокад» с точки зрения

следующих задач: анализа генома клеток, которые вырабатывают терапевтически-важные

белки, а также анализа библиотек. Компания «Биокад» имеет схожие задачи с их

западным коллегой компанией «Genentech», но у последней масштаб бизнеса совсем

иной: «Genentech» имеет мощный биоинформатический научный отдел и обладает

ресурсами для секвенирования 500 моноклональных антител.

Александр Корабельский, руководитель лаборатории молекулярной генетики компании

Биокад: «Мы можем сделать всё, что касается биотехнологических работ, но без

поддержки биоинформатики мы обходиться вряд ли сможем. Я пришёл на семинар,

чтобы узнать, где взять биоинформатиков».

Действительно, многие компании сталкиваются с невозможностью найти

квалифицированных специалистов по биоинформатике в России.

Алла Лапидус: «Я на данный момент уже два месяца в стране, и за это время мне

пришло около девяти просьб найти человека, разбирающегося в языке

программирования R».

Компания Samsung планировала открывать в Петербурге отделение персонализированной

медицины, если бы в городе нашлось хотя бы пять специалистов соответствующего уровня.

Компания обратилась за помощью к Павлу Певзнеру, но несмотря на длительные поиски,

эта задача оказалась не решаема.

16

technology business development, to be defined

16

Павел Певзнер: «Мне с трудом удалось найти людей в свою лабораторию. Своих людей я

вам не отдам!»

ЗАКАЗНАЯ РАЗРАБОТКА

Чтобы понять, что представляет петербургский ландшафт заказной разработки на мировом

уровне, можно обратиться к мировым рейтингам, к примеру, к Global Services Top-100. Так,

в сто мировых сервисных компаний включены семь российских. При этом большинство из

них имеют к Петербургу прямое отношение: три базируются в городе, а ещё две имеют

свои представительства.

Валентин Макаров, президент некоммерческого партнёрства РУССОФТ: «Эти компании

попали в рейтинг не потому, что они самые большие, а потому, что они делают

работу, которую другие сделать не могут».

GGA

Американская компания с основным производством в Петербурге и штатом сотрудников в

400 человек производит программное обеспечение по заказу крупных фармацевтических

компаний таких как «AstraZeneca», «Merck», «Eli Lilly», «Pfizer» и им подобным. «GGA»

работает с исследовательскими подразделениями этих компаний и делает программное

обеспечение, помогающие учёным в работе по разработке лекарств на разных фазах.

Компания существует уже 15 лет, и все эти годы основным родом деятельности была

хемоинформатика. В последние годы интерес к биоинформатике побудил к

переориентации: в портфолио «GGA» есть солидные биоинформатические проекты, к

примеру, проект для компании-производителя масс-спектрометров. В настоящее время

все производство петербургского центра разработок компании «AstraZeneca» реализуются

у «GGА».

Владимир Шварц, руководитель отдела разработки алгоритмов компании GGA Software:

«GGA» имеет достаточное количество ресурсов, чтобы выполнить любую работу.

Успех – не только в исполнителях. Бизнес часть гораздо важнее. Нужны очень серьёзные

усилия, чтобы привлечь крупные фармацевтические компании и получить от них

заказы».

17

Биоинформатика. Окна возможностей

17

Большая часть проектов компании уникальна: «GGA» берётся за наукоёмкие задачи,

которые другие решить либо не могут, либо им это совсем не выгодно, а также за задачи,

которые плохо сформулированы заказчиком.

WaveAccess

Компания занимается разработкой продуктов заказного ПО и их сопровождением для

западных и российских компаний. За двенадцатилетний опыт «WaveAccess» приобрела

экспертизу в оптимизации алгоритмов и увеличении быстродействия алгоритмов. В

биоинформатику компания пришла три года назад при сотрудничестве с компанией,

занимающейся обработкой генетической информации. Алгоритм той компании

отрабатывал в течение нескольких часов, а «WaveAccess» создала алгоритм,

справляющийся с подобной задачей за минуты. Таким образом, значительно повысилась

производительность труда. В том числе компания сотрудничает с NVIDIA, чтобы

производить вычисления на CUDA, что позволяет алгоритмы, рассчитанные на минуты,

считать секундами.

Также компания стала развивать область смежную с биоинформатическими задачами:

программное обеспечение для серверных, вэб и мобильных платформ помогает

биоинформатикам руководить подсчётом задач, к примеру, с мобильного телефона.

Сегмент компании, который занимается наукоёмкими задачами для биоинформатики, не

превышает 10 процентов.

Александр Азаров, заместитель технического директора компании WaveAccess: «Мы

помогаем биоинформатикам воплощать их идеи. Но минус биоинформатики в том, что

все разработки – это, так называемые, ноу-хау. Биоинформатики боятся привлекать

разработчиков из других компаний».

Несмотря на то, что команда «WaveAccess» состоит из обычных разработчиков, сотрудники

вникают в среду, чтобы убедиться, что новый алгоритм качественно соответствует

поставленным учёными задачам.

Павел Певзнер: «Внутри биоинформатики есть масса чисто технических

алгоритмических задач. Необязательно знать структуру белка, чтобы решить

некоторые важные программистские задачи».

18

technology business development, to be defined

18

ТЕХНОЛОГИИ СЕКВЕНИРОВАНИЯ РОССИИ И ЗА РУБЕЖОМ

Александр Павлов, руководитель компании Sequoia Genetics: «Секвенирование – тяжелая

работа!»

Sequoia Genetics специализировалась в разработке панелей диагностических наборов. Ввиду

постоянного обновления информации, и, как следствие, необходимостью пересматривать

панели каждый год компания встала перед непростым выбором: либо закрыть, либо

реструктуризировать бизнес.

Sequoia Genetics обратилась к известной и широко используемой на Западе технологии

«microarray» (здесь и далее, микрочипирование). На базе данной технологии построен

бизнес такиx ведущих мировые компании в области генетического тестирования как

23andMe (200 000 человек генотипированы компанией), Navigenics и многих других. Тем не

менее, существенной проблемой технологии микрочипирования является валидация. Каким

образом можно подтвердить надёжность полученных данных и их клиническую

значимость?

Sequoia Genetics разработала технологию клинического микрочипирования на таком уровне,

что наборы, произведённые в США, и наборы Sequoia Genetics приносят идентичный

результат. При наличии венчурных инвестиций, компания готова производить “клинический

microarray”.

Тем не менее, встаёт вопрос о конкурентноспособности микрочипирования в сравнении с

полным геномным секвенированием, экзомным, а также таргетным секвенированием.

Технология микрочипирования ограничена тем, что она даёт информацию исходя из уже

известных последовательностей и полиморфизмов. При помощи микрочипирования

невозможно идентифицировать новую букву в последовательности генома. Принимая во

внимание, удешевление технологии, полное геномное секвенирование станет доступным

уже в ближайшие 2-3 года. К примеру, американская компания Complete Genomics уже

сегодня предлагает последнее за $5000, а экзомное секвенирование – за $700.

Скорее всего, в России секвенирование пойдёт в том же направлении, что и на Западе, а

именно к созданию централизованных лабораторий. Оборудование для секвенирования,

19

Биоинформатика. Окна возможностей

19

сложное и дорогостоящее, не будет стоять в каждой поликлинике. Примером такого центра

является The Australian Genome Research Facility (AGRF) в Австралии. Лаборатория

предлагает любому пользователю секвенирование на заказ на любой из 8 машин Illumina Hi-

Seq, уставновленных в центре. Таким образом, секвенаторы работают круглые сутки, что

считается оптимальным режимом работы данных машин.

В России ситуация с секвенированием складывается достаточно неоднозначно. Имеется две

машины Illumina Hi-Seq: одна находится в Красноярске, где анализируют геном

лиственницы, и одна - в Москве, в Interlab service. Несколько лучше складывается ситуация у

компании Life Technologies, которая первая вышла на российский рынок: закуплено 24

секвенатора Ion-Torrent. Однако соответствующую инженерным стандартам установку

прошли только 10 машин, а реально работают только 3 из них.

ПРОЕКТЫ И СТАРТАПЫ

Sequoia Genetics

При сотрудничестве с EMC компания реализует проект «Персонализированная геномная

диагностика», ставший резидентом Сколоково. Основной компетенцией является

биологически-генетическая экспертиза. В отличие от 23andMe фокус идёт не на B2C, а на B2B

рынок, то есть на работу с врачами, как основными посредниками между лабораторией и

пациентом. Сейчас создаётся proof-of-concept проекта, и главный критерий – это удобство.

Александр Павлов: «Потребности биоинформатиков и клиницистов диаметрально

противоположны».

В то время как биоинформатики стремятся к усложнённым алгоритмам, постоянному

улучшению старых и созданию новых инструментов, клиницисты хотят максимальной

простоты использования и удобства.

Среди сложностей, препятствующих развитию биотехнологических стартапов в России,

можно выделить нехватку экспертизы. К примеру, Sequoia Genetics получает

финансирование от Группы «Алкор-Био», в которую входит компания. Но, для того чтобы

заказывать необходимое программное обеспечение, развиваться дальше, компании

20

technology business development, to be defined

20

необходимы внешние инвестиции. Тем временем, некоторые инновационные венчурные

фонды не имеют достаточно специализированного экспертного мнения , и, как следствие,

даже такая компания как Sequoia Genetics не получает достаточного отклика от венчурных

компаний.

Проекты кафедры системной биологии СПбГПУ

Главным направлением кафедры является компьютерная биология, в области которой

проводятся фундаментальные и прикладные исследования. Изучаются механизмы

эмбриогенеза в норме и при патологии, механизмы вирусных инфекций, в частности,

гепатита С, ищутся мишени для действия лекарств методами системной биологии в

сотрудничестве с Институтом Радиологии.

На базе кафедры зародился стартап РосТэк, который специализируется в области анализа

изображения с целью разработки методов диагностики.

Разработана база редких данных, которую пока не удалось коммерциализировать, но на

включённые в базу данные ссылаются такие известные издания как Nature и Science. РосТэк

получает поддержку Фонда содействия малым предприятиям.

Генотек

Компания предлагает услуги генотипирования и

полного геномного секвенирования частным

клиентам. Также Генотек сотрудничает с

учёными, которым секвенирование генома

предоставляется по минимальным ценам

близким к себестоимости. Такая возможность

обусловлена ресурсами Генотека: компания

имеет доступ к секвенаторам и прочей технике,

находящейся в ведомстве учреждений, которые

не имеют такого количества задач для

полноценной загрузки оборудования. Как

правило, из-за неэффективного использования

оборудование простаивает, что негативно

влияет на качество секвенирования.

Дмитрий Коростин, руководитель отдела исследований компании Генотек: «Мы стараемся

максимально загружать доступное оборудование, при этом работаем на результат».

21

Биоинформатика. Окна возможностей

21

В дополнение Генотек получил несколько грантов, которые позволили закупить секвенатор

производства Illumina, в данный момент находится в Сингапуре. Такой выбор

географического расположения удобен для бизнеса, так как позволяет избежать рисков,

связанных с ввозом дорогих реактивов в Россию.

Что касается биоинформатики, Генотек находится в начале научного пути: на сегодняшний

день, осуществлены проекты экзомного секвенирования и анализа лактобактерий в

сотрудничестве с партнёрами. Тем не менее, компания заинтересована в подобных

исследованиях и готова сотрудничать как в исследованиях так и в публикациях в области

полного геномного секвенирования.

Стартап GeneStack (совместное предприятие с компанией JetBrains)

GeneStack - английская компания с головным офисом в Кембридже и разработчиками в

России. Экспертиза компании включает опыт Европейского Института Биоинформатики (EBI),

где основатель компании Михаил Капушевский занимался анализом геномных данных, а

также знакома с опытом работы американских стартапов и компаний.

В качестве основной разработки представлена облачная платформа-сервис для геномных

данных и приложений в фармацевтической индустрии. В то время как цена секвенирования

упала практически до $1,000 за геном, стоимость хранения, анализа и защиты данных

генома человека растут, достигая $1,000,000. Размер рынка программного обеспечения в

2011 году был оценен в 2,5 млрд $. При этом эти деньги тратятся весьма неэффективно: на

поддержание больших баз данных, преобразование форматов, проделывание рутинной

обработки и на многократную пересылку файлов.

Платформа GeneStack решает проблему универсального доступа к большим объёмам

публичных данных, эффективно защищённого хранения и разделения частных геномных

данных, интегрированного доступа к вычислительным мощностям, а также проблему

размещения и поставки приложения пользователю.

Михаил Капушевский, СЕО компании GeneStack: «Наша платформа отличается фокусом

на безопасность и нужды фармацевтических и биотехнологических компаний, а также

независимостью от производителей данных. В платформе есть весь необходимый

функционал для работы с геномом».

Среди конкурентов GeneStack - платформы для анализа данных от производителей

секвенаторов, например, Illumina, платформы специализированных компаний (DNA Nexus), а

также академические платформы такие как GenomeSpace и Galaxy. Между конкурентными

22

technology business development, to be defined

22

решениями есть кардинальные различия. В одном конце диапазона стоит DNA Nexus, у

которых программная среда обуславливает функциональные возможности, а по другой

конец находится Galaxy, где все данные представлены пользователем и большую часть

приходится настраивать вручную. Платформа GeneStack находится посередине: с одной

стороны, конвертация форматов и прочие сложности спрятаны, с другой стороны,

разработчикам предоставляется хороший SDK (software development kit).

Сергей Дмитриев, руководитель межвузовской образовательно-исследовательской

программы Game|Changers: «Стоит делать сразу глобальную компанию, а не

жаловаться, что в России пока нет спроса».

Бизнес GeneStack представляет собой модель подписки: клиент платит за то, что использует.

Первые клиенты у компании появились ещё до выхода на рынок. Стартовый капитал

GeneStack не уступает первоначальному финансированию DNA Nexus.

Михаил Капушевский: «Сейчас проблема не в деньгах. Речь о том, кто лучше поймёт

рынок, освоит нишу и выпустит полезный продукт».

ОБРАЗОВАНИЕ И ИССЛЕДОВАНИЯ

Без образования нет исследований, ему необходимо уделять большое внимание.

Павел Певзнер: «Биологи без знаний биоинформатики подобны инженерам без высшей

математики».

Три года назад Павел Певзнер с Роном Шамиром (Израиль) предсказали необходимость

обучения биологов биоинформатике. На Западе эта тенденция широко развивается. Так, в

Штатах программа обучения биологии составлена таким образом, что каждый биолог

обязан взять курс computer science (далее, компьютерные науки), а система

биоинформатического образования предполагает наличие двух руководителей у студента:

вычислительного и биологического.

В UCSD, где биология – самая популярная специальность (в университете получают

образование около 2000 биологов), запускается пилотный проект – on-line курс

23

Биоинформатика. Окна возможностей

23

биоинформатики для биологов. Новый образовательный биоинформатический проект

rosalind.info должен решить проблему обучения биологов в UCSD.

Тем временем, в России обучается примерно 30 000 биологов, которые воспитываются без

основного инструмента современной биологии – компьютерных наук.

Павел Певзнер: «Биоинформатика – ключевая технология в области биологии».

В ближайшее время в нашей стране возникнет острая потребность в квалифицированных

профессорах, способных преподать биологам биоинформатику. Откуда же возьмутся

преподаватели и сколько их нужно, чтобы объять все региональные российские

биологические университеты?

В этом контексте возможным решением проблемы может стать web-based education. В

Америке в настоящее время произошёл взрыв on-line образования, которое активно

поддерживается венчурными фондами. В России такой вид образования должен стать

основным инструментом продвижения компьютерных наук в провинцию и обязательно

поддерживаться на государственном уровне. С помощью on-line образования значительные

средства в бюджете будут сэкономлены, а студент из провинциального ВУЗа получит

уникальную возможность заниматься с лучшими специалистами.

Дмитрий Гальперин, директор по инвестициям фонда Runa Capital: «Пока ещё

неадекватное предложение – не очень виден рынок…»

Частные российские венчурные фонды не торопятся инвестировать в массовое on-line

образование в узких профессиональных сферах и в такого рода стартапы. Тем временем,

Runa Capital проинвестировала в стартап LinguaLeo (обучение иностранным языкам), так как

налицо присутствует осознанный спрос населения на данные услуги, и рынок более

понятный. Наравне обучения биологов компьютерным наукам существует обратный подход

к выращиванию биоинформатиков, а именно, обучение студентов технических

специальностей биологии. Так, в Санкт-Петербурге на базе Академического Университета

существует магистерская программа по биоинформатике, а также курсы по

биоинформатике.

Николай Вяххи, руководитель магистерской программы по биоинформатике и курсов по

биоинформатике в АУ РАН: «Мы набираем технических студентов старших курсов с

24

technology business development, to be defined

24

матмеха СПбГУ и из ИТМО… Выпускники востребованы в таких компаниях как JetBrains,

Биокад, Sequoia Genetics».

Студенты обучаются молекулярной биологии, биотехнологиям и информатике. На базе

СПбГПУ ведутся занятия для более юного контингента: на кафедре прикладной математики

обучаются школьники, которые приходят из математических школ и занимаются

биоинформатикой. С этого года в СПбГПУ открывается магистратура биоинформатики.

Особенность этой программы - подготовка специалистов, знающих и биологию, и

математику, и информатику.

Мария Самсонова, профессор СПбГПУ: «Никакой программист не сможет работать

эффективно в области биоинформатики, не зная биологии. Он сможет работать

только по техзаданиям, написанным кем-то, запрограммировать. Знание биологии –

essential!»

Кафедра системной биологии СПбГПУ планирует взращивать всесторонне развитых

специалистов. В дополнение к программам магистратуры необходима разработка программ

бакалавриата по биоинформатике. Но можно пойти по альтернативе массовому обучению

пути, как предлагает Андрей Терехов, и сосредоточиться на элитном обучении лучших

студентов. Кафедра системного программирования СПбГУ выпускает по 50 человек в год, с

25

Биоинформатика. Окна возможностей

25

такими специалистами нет необходимости учить программиста биологии, а биолога

программированию. Выпускник кафедры, способный придумывать блестящие алгоритмы,

будет чувствовать себя уверенно в любой индустрии, начиная с аэрокосмической и

заканчивая биоинформатикой.

Андрей Терехов, заведующий кафедрой системного программирования СПбГУ: «Я не хочу

стать биологом. И не очень хочу, чтобы мои выпускники с кафедры системного

программирования становились биологами. Но я хочу в этой области работать, я

понимаю, что это важно и актуально».

Для развития биоинформатики необходимы совместные усилия с партнёрами из

биоинформатики. Кафедра системного программирования может помочь в лучшей

промышленной реализации задач, но партнёры нужны такие, которые смогут поставить

задачу и на мировом уровне оценить решение. Задачи при этом должны быть наукоёмкими.

Алла Лапидус: «Мне кажется, люди, способные придумывать алгоритмы,

замечательные, хорошие – это такая голубая кровь, её много не нужно».

При всей важности создания биоинформатических алгоритмов, в контексте персональной

медицины необходимо понимать, что биоинформатики нужны на каждом этапе от забора

крови до биопсии. Важны такие задачи, как создание баз данных о пациентах, обеспечение

её надёжности, создание библиотеки ДНК и выравнивание её с последовательностью

генома. Поэтому программы, обучающие биологов информатике, а информатиков -

биологии, очень важны. И сейчас самое подходящее время для обучения. Нужны

специалисты со знанием статистики, программирования и аналитики, люди, способные

построить инфраструктуру, обеспечить хранение данных, так как объём их огромный, и не

все данные поддаются компрессии.

Алла Лапидус: «Врачи захотят учиться последними».

Ключевую роль будут играть специалисты, способные проводить анализ данных, к примеру,

проверку качества данных, идентификацию изменений в геноме, определение

биологических путей и задетых биохимических процессов, сравнение результатов данных с

тем, что уже известно в фармакологии.

Не стоит забывать также специалистов, связующих науку и бизнес. В этой области работает

программа Game|Changers. Game|Changers - это образовательно-исследовательская

26

technology business development, to be defined

26

программа об ИТ-бизнесе, рассчитанная на сильных студентов. В рамках программы есть

специализации и одна из них биоинформатика, ее курирует Николай Вяххи.

Сергей Дмитриев: «Цель программы – подготовить из студентов коммерциализаторов и

дать им глубокое представление о том, как работает индустрия».

ОКНА ВОЗМОЖНОСТЕЙ

Игорь Егоров: «Life Science позиционируется сейчас, как приемник информационных

технологий и тех интернет компаний, которые привнесли экономическую ценность и

создали огромное количество рабочих мест. Где нас ждёт следующий прорыв? »

Биоинформатика поможет решить проблемы будущего в различных индустриях, начиная

от здравоохранения и заканчивая сельским хозяйством. Одним из успешных примеров

является проект ассемблирования генома пальмы в Малайзии. Производство пальмового

масла - третий по счёту источник дохода в стране, в то время как нужные для производства

масла деревья растут только по экватору. Геном пальмы даст возможность культиваторам

понять механизмы, влияющие на рост, созревание плодов, адаптацию к новым

климатическим условиям. Таким образом вложение в проект $1 миллиона может принести

экономическую выгоду в виде многомиллиардной прибыли.

Павел Певзнер: «Исслеодвательский проект Human Microbiome Project – это mega

science!»

Здоровье человека зависит не только от его собственного генома, но и от бактерий,

населяющиx организм. Одна из самых быстро развивающихся областей – секвенирование

микробиоты. Такое секвенирование на порядок сложнее обычного секвенирования. Ведь

чтобы машина прочитала геном необходимо около миллиона клеток, в то время как

бактерии состоят из одной или нескольких клеток, а способы выращивания клеток

большинства бактерий ещё науке неизвестны.

27

Биоинформатика. Окна возможностей

27

Таким образом, задача заключается в том, чтобы секвенировать из одной единственной

клетки. Первая публикация на тему single cell sequencing появилась год назад. Лаборатория

Павла Певзнера совместно с Институтом Крейга Вентера поставили себе задачу чтения

генома таких клеток. Разрабатываемая технология поможет в изучении начальных стадий

рака, так как станет, наконец, возможным секвенирование первых появившихся раковых

клеток, не дожидаясь появления миллиона таких клеток в организме.

Алгоритмическая задача включает в себя и надёжность алгоритмов, и хорошие релизы, а,

главное, не абстрактное создание алгоритмов, а комплектацию готовых пользовательских

решений. Права на интеллектуальную собственность представляют колоссальную

возможность извлечения прибыли в биоинформатике. Вместе с тем индустрия характерна

тем, что многие инструменты находятся в открытом доступе. Например, совершенно

бесплатна самая популярная программа поиска информации по геному среди биологов –

BLAST, cозданная в 90м году при поддержке американского правительства

(финансирование NCBI). BLAST – пример очень сильного бренда. Несмотря на то что

существуют программы, обладающие более высокой точностью с такой же

функциональностью, на каких-то этапах исследования высокая точность не требуется. При

этом BLAST даёт вполне надёжные результаты при простоте использования.

28

technology business development, to be defined

28

Павел Певзнер: «Задача моей лаборатории – создать сильный бренднейм, который

позволит развиваться и дальше».

С середины 90х западные инвесторы начали проявлять интерес к биоинформатике, и

многие из них, к примеру Чарли Смит (нефтяной магнат), приходили к выводу, что упустили

многомиллиардные состояния, так как не обратили должного внимания на индустрию

биоинформатики.

Павел Певзнер: «В районе 1995-1996 годов биоинформатика была очень странным и

непонятным зверем».

Для биоинформатического развития в России характерны две тенденции: одна из них

покрывает собой аутсорсинг и основана на привлечении квалифицированных Java

программистов, вторая – на интеграции различных инструментов. Системная интеграция

представляет большие возможности, так как в стране будут востребованы готовые

биоинформатические решения. Для компаний-разработчиков систем хранения и

аналитики большого объёма данных, биоинформатика представляет заманчивое

направление для развития бизнеса.

Вячеслав Нестеров, генеральный директор Санкт-Петербургского центра разработок ЕМС:

«Мы можем быть полезны в создании инфраструктуры. У нас есть компетенции,

которые востребованы в биоинформатических приложениях, медицинских и научных».

Компания ЕМС специализируется на управлении большими объёмами информации. В

настоящее время компания готовится к открытию центра в Сколково и ориентируется на

взаимодействие с партнёрами и привлечение специалистов из индустрии

биоинформатики. Особенности российского законодательства вносят свою специфику в

формирование потенциальных возможностей. Например, процесс регистрации технологий

таких как микрочипирование и геномное секвенирование достаточно прост в сравнении с

западными законодательными нормами. Следовательно, произведённая в России

инновационная технология может выводится на рынок раньше. Вместе с тем таможенные

проволочки создают преграды для импорта реагентов и оборудования.

Павел Певзнер: «Нужно рассчитывать на то, что всё изменится к лучшему. В Россию

двинутся компании с Запада».

29

Биоинформатика. Окна возможностей

29

Не менее важной возможностью развития биоинформатики является образование. На

сегодняшний день в Петербурге источником образования являются с одной стороны

университеты, а с другой стороны - неформальные образовательные структуры. С

распространением образовательных программ индустрия будет развиваться лучше.

Сергей Дмитриев: «Нужны не только биологи и информатики, но и «склейщики» - люди,

которые будут связывать между собой медиков и фарму, государство и

университеты».

30

technology business development, to be defined

30

ОРГАНИЗАТОРЫ И ПАРТНЕРЫ

Организаторы

Генеральный спонсор при поддержке

Информационные партнеры

31

Биоинформатика. Окна возможностей

31

Над семинаром работали:

Сергей Дмитриев

Руководитель межвузовской образовательно-исследовательской

программы Game|Changers

Проработка темы, подбор экспертов, модерация семинара

Павел Фролов

Генеральный директор ГНУ/Линуксцентра и Группы компаний

«Мезон.ру»

Модератор дискуссии со стороны ИТ индустрии

Игорь Егоров

Руководитель Санкт-Петербургского офиса Центра

предпринимательства

Организационный комитет семинара

Яна Полякова

Координатор проектов Центра предпринимательства

Александра Вачнадзе

Высшая Школа Менеджмента СПбГУ

Подготовка отчёта по семинару