В темноте ночи, вдали от света города, звезды Млечного Пути нам кажутся бесчисленными. Но невооруженному глазу из любой точки видно не более 4500 звезд. В нашей же галактике их сто-четыреста миллиардов, во Вселенной галактик и того больше. Так что, в ночном небе не так уж и много звезд. Но даже это число перед нами открывает глубокую подноготную… препаратов и лекарств. Дело в том, что количество вероятных органических соединений с лекарственными способностями превышает количество звезд во Вселенной более чем на тридцать порядков. И различные химические конфигурации, которые ученые создают из имеющихся медикаментов, можно сравнить со звездами, которые мы могли бы увидеть ночью в центре города.
Поиск всех вероятных лекарств — это для человека совершенно непосильная задача, так же как и исследование всего физического пространства, и даже если бы мы это могли, большая часть обнаруженного нашим целямне соответствовала бы. Тем не менее идея о том, что волшебные лекарства могут скрываться среди изобилия, чересчур заманчива, чтобы игнорировать ее.
Именно по этой причине нам необходимо использовать искусственный интеллект, который будет больше работать и сможет ускорить это открытие. Так полагает Алекс Жаворонков, который выступил недавно на Exponential Medicine в Сан-Диего. Это применение может оказаться самым крупным для искусственного интеллекта в медицине.

Собаки, диагноз и лекарства

Жаворонков — CEO Insilico Medicine и CSO Biogerontology Research Foundation. Insilico — это один из многих стартапов, которые  разрабатывают искусственный интеллект, который способен ускорить открытие новых препаратов и лекарств.
За последние годы, как говорит Жаворонков, известная техника машинного обучения — глубокое обучение — осуществила прогресс на нескольких фронтах. Алгоритмы, которые могут обучаться игре в видеоигры — такие как AlphaGoZero или покерист CarnegieMellon — являются самым большим предметом интереса. Но распознавание закономерностей — вот что дало глубокому обучению мощный толчок, когда алгоритмы машинного обучения наконец-то стали отличать собак от кошек и это делать достаточно точно и быстро.
В медицине алгоритмы глубокого обучения, которые обучены по базам данных медицинских снимков, способны обнаруживать заболевания опасные для жизни с равной или большей точностью, чем люди-специалисты. Существует даже предположение, что искусственный интеллект, если мы ему научимся доверять, может оказаться бесценным для диагностики болезни. И как сказал Жаворонков, появится больше приложений, и послужной список станет только расти.

«Tesla уже выводит на улицу автомобили», рассказывает Жаворонков. «Трех-, четырехлетняя технология уже с легкостью перевозит пассажиров из пункта А в пункт Б на скорости двести километров час; всего одна ошибка — и ты мертв. Но люди все же доверяют этой технологии свои жизни».
«Так почему бы того же самое не делать в фармацевтике?».

Постоянные пробы и ошибки

В фармацевтических исследованиях искусственному интеллекту не надо будет управлять автомобилем. Он будет ассистентом, который в паре с химиком или двумя химиками сможет ускорить открытие препаратов, просматривая в поисках лучших кандидатов больше вариантов.
Пространство для повышения и оптимизации эффективности просто очень большое, уверен Жаворонков.
Поиск препаратов — это занятие очень дорогостоящее занятие и кропотливое. Химики просеивают десятки тысяч вероятных соединений в поисках наиболее многообещающих. Из них только некоторые уходят на дальнейшее изучение, и еще меньшему количеству предстоит проходить испытания на людях, а из этих вообще крохи окажутся одобрены к дальнейшему использованию.
Весь этот процесс может занять очень много лет и стоить сотни миллионов долларов.
Это проблема касается больших данных (bigdata), а глубокое обучение преуспевает в работе с большими данными. Первые приложения показали, что системы искусственного интеллекта на основе глубокого обучения способны находить едва заметные закономерности в гигантских выборках данных. Хотя производители лекарств уже используют программное обеспечение для просеивания соединений, такое программное обеспечение требует четких правил, написанных химиками. Плюсы искусственного интеллекта в данном деле — его способность учиться и совершенствоваться самостоятельно.
«Существует две стратегии инноваций на базе искусственного интеллекта в фармацевтике, которые обеспечат вас лучшими молекулами и быстрым одобрением», говорит Жаворонков. «Один ищет иглу в стоге сена, а другой создает новую иглу».
Чтобы найти иголку в стоге сена, алгоритмы обучаются на больших база данных молекул. Затем они ищут молекулы с подходящими свойствами. Но создать новую иглу? Эту возможность предоставляют генеративные состязательные сети, на которых специализируется Жаворонков.
Такие алгоритмы ставят две нейронные сети друг против друга. Одна генерирует осмысленный результат, а другая решает, является ли этот результат истинным или ложным, говорит Жаворонков. В совокупности эти сети генерируют новые объекты, такие как текст, изображения или, в данном случае, молекулярные структуры.
«Мы начали использовать эту конкретную технологию, чтобы глубокие нейронные сети вообразили новые молекулы, чтобы сделать ее идеальной с самого начала. Нам нужны идеальные иглы», говорит Жаворонков. «Вы можете обратиться к этой генеративной состязательной сети и попросить ее создать молекулы, которые ингибируют белок Х в концентрации Y, с наивысшей жизнеспособностью, заданными характеристиками и минимальными побочными эффектами».
Жаворонков полагает, что искусственный интеллект может найти или изготовить больше иголок из множества молекулярных возможностей, освободить химиков-людей, чтобы те могли сосредоточиться на синтезе только самых перспективных. Если это сработает, как надеется он, мы сможем увеличить количество попаданий, минимизировать промахи и в целом ускорить процесс.

Дело в шляпе

Insilico не единственная занимается поиском новых путей к созданию лекарств, и это не новая область интересов. В прошлом году гарвардская группа опубликовала работу на тему искусственного интеллекта, который аналогичным образом подбирает кандидатуры из лекарств. Программное обеспечение обучилось на 250 000 лекарственных молекулах и использовало свой опыт для создания новых молекул, которые смешивали существующие препараты и делали предложения на основе желаемых свойств. Однако, как отмечал MIT Technology Review, полученные результаты не всегда значимы или легко синтезируются в лаборатории, и качество этих результатов, как всегда, высоко настолько, насколько качественные предоставленные изначально данные.
Стэнфордский профессор Химии Виджай Панде говорит, что у изображений, речи и текста — которые на данный момент являются предметами интереса глубокого обучения — хорошие и чистые данные. Но химические данные, с другой стороны, по-прежнему оптимизируются для глубокого обучения. Кроме того, хотя публичные базы данных существуют, большая часть данных все еще живет за закрытой дверью частных компаний.
Чтобы преодолеть все препятствия, компания Жаворонкова сосредоточена на проверке технологии. Но в этом году скептицизм в фармацевтической отрасли, похоже, сменяется интересом и инвестициями. Даже Google может ворваться в гонку.
По мере того, как развивается искусственный интеллект и аппаратное обеспечение, наибольший потенциал еще должен быть раскрыт. Возможно, однажды, все 1060 молекул в области препаратов окажутся в нашем распоряжении.