Оглавление

Новый инструмент от Google Research использует сверточные нейронные сети для идентификации раковых мутаций с высокой точностью, превосходя существующие методы анализа геномных данных.

Схема процесса обнаружения генетических вариантов в опухолях с помощью DeepSomatic
Источник: research.google.com

Точная диагностика рака через генетические вариации

Рак — это прежде всего генетическое заболевание, при котором нарушаются механизмы контроля клеточного деления. Каждый тип рака имеет уникальные генетические особенности, и идентификация конкретных мутаций в опухолевых клетках становится критически важной для разработки персонализированных методов лечения.

В совместной работе с Институтом геномики Калифорнийского университета в Санта-Круз и другими федеральными и академическими исследователями, представленной в журнале Nature Biotechnology, Google представила DeepSomatic — инструмент, использующий машинное обучение для более точного выявления генетических вариантов в опухолевых клетках.

От наследственных к приобретенным мутациям

Секвенирование генома используется в исследованиях и медицинской практике для идентификации генетических вариаций между индивидуумом и референтным геномом человека. Различение реальных вариантов и ошибок, возникающих в процессе секвенирования, представляет серьезную проблему.

Почти десять лет назад Google Research представила DeepVariant для идентификации наследственных вариантов, также называемых герминальными вариантами, которые передаются от родителей и присутствуют во всех клетках организма.

Генетика рака сложнее. Рак часто вызывается вариантами, приобретенными после рождения. Воздействие окружающей среды, повреждающее ДНК, такое как ультрафиолетовое излучение или химические канцерогены, а также случайные ошибки, возникающие во время репликации ДНК, могут привести к появлению новых вариантов в клетках организма, известных как соматические клетки. Иногда эти приобретенные варианты изменяют нормальное поведение клеток, заставляя их делиться, когда они не должны. Этот процесс лежит в основе развития рака и его последующего прогрессирования до более агрессивных стадий.

Как работает DeepSomatic

DeepSomatic разработан для решения этих проблем и точной идентификации соматических вариантов. В большинстве клинических и исследовательских условий рак изучается путем секвенирования опухолевых клеток, полученных при биопсии, а также нормальных клеток, не затронутых ростом опухоли и содержащих более типичные наследственные генетические вариации.

DeepSomatic обучается идентифицировать вариации, наблюдаемые в опухолевых клетках, которые не являются наследственными. Эти типы вариаций могут предоставить критически важную информацию о том, какие именно изменения вызывают рост опухоли. DeepSomatic также способен идентифицировать соматические вариации в режиме только опухоли, когда последовательность нормальной ткани недоступна, например, при раке крови, таком как лейкемия, где трудно получить только нормальные клетки из образца крови.

Как и предыдущий инструмент DeepVariant, модель DeepSomatic работает путем преобразования данных генетического секвенирования в набор изображений. Изображения представляют данные секвенирования, выравнивание вдоль хромосомы, качество результатов и другие переменные. DeepSomatic затем использует свою сверточную нейронную сеть на данных из опухолевых клеток и нераковых клеток, чтобы дифференцировать референтный геном, нераковые герминальные варианты у этого индивидуума и вызванные раком соматические варианты в опухоли, отбрасывая вариации, вызванные небольшими ошибками, возникшими в процессе секвенирования. Результатом является список раковых вариантов или мутаций.

График частоты мутаций в образцах рака молочной железы и лёгких
Источник: research.google.com

DeepSomatic обнаруживает раковые варианты в геномных данных. Сначала данные секвенирования из опухолевых клеток и нераковых клеток преобразуются в изображение. DeepSomatic пропускает эти изображения через свою сверточную нейронную сеть, чтобы дифференцировать референтный геном, нераковые герминальные варианты у этого индивидуума и вызванные раком соматические варианты в опухоли, отбрасывая вариации, вызванные небольшими ошибками секвенирования. Результатом является список вызванных раком вариантов или мутаций.

То, что Google открывает доступ к инструменту и обучающим данным — это стратегический ход, который может ускорить исследования по всему миру. Вместо того чтобы каждая лаборатория разрабатывала свои алгоритмы, теперь есть готовое решение, проверенное на нескольких платформах секвенирования. Особенно ценно, что модель работает даже когда нет контрольного образца здоровой ткани — это расширяет возможности диагностики в сложных случаях.

По материалам Google Research.