Переводчик с языка клеток: ИИ обучили интегрировать данные о клетках тканей в одно пространство

Фото с сайта pxhere.com
Представьте, что в вашем распоряжении оказался инструмент, способный распутать сложную клеточную мозаику в образце ткани человека.
Группа учёных Института рака Найта при Университете здоровья и науки штата Орегон создала инновационный эффективный метод, который делает значительно проще исследование состава клеток тканей человеческого орагнизма.
Это открытие имеет огромную важность для изучения таких болезней, как онкология. Разработанный инструмент получил имя OmicsTweezer.
Детали этой разработки можно найти в публикации Cell Genomics.
Традиционно, для определения состава опухоли и окружающей ее среды, исследователи используют два типа данных.
Первый - это данные, полученные при массовом анализе (bulk data) цельного образца тканей, к примеру, когда проводится биопсия. Это даёт усреднённые результаты.
Второй - данные об отдельных клетках (single-cell data), которые предоставляют детальную информацию о характеристиках каждой клетки, однако их получение требует больших финансовых и временных затрат.
Проблема заключается в том, что из-за unterschiedlichen подходов к сбору данных, эти данные зачастую не согласуются друг с другом, напоминая результаты, полученные на разных приборах с разными настройками. Это несоответствие, получившее название "пакетный эффект", существенно осложняет получение точных результатов.
OmicsTweezer смог решить эту проблему, используя современные алгоритмы по машинному обучению. Он работает как интеллектуальный "переводчик", используя известные образцы из информации об отдельных клетках для интерпретации сложных массированных данных. Инструмент объединяет оба типа данных в единое цифровое пространство, осуществляя выравнивание и минимизируя ошибки. Этим достигается высокая точность оценки клеточного состава образца.
"Микроокружение опухоли, включающее в себя разнообразные клетки, влияющие на прогрессирование рака и результат лечения, всегда было одним из наших приоритетных направлений исследований," говорит ведущий автор исследования, доктор Чжэн Ся, доцент кафедры биомединженерии. "Нашей целью является определение клеточного состава с использованием массированных данных большого числа клинических образцов."
Преимущества данного подхода включают в себя:
Масштабируемость: Он позволяет анализировать большие массивы существующих массированных данных, что было невозможно ранее.
Точность: Использование глубокой нейронной сети позволяет выявлять сложные, нелинейные зависимости в данных, которые остаются незамеченными при использовании стандартных линейных моделей.
Доступность: Открывает возможности для проведения масштабных исследований без значительных инвестиций в технологии исследования отдельных клеток.
Разработка была протестирована на смоделированных данных и реальных образцах пациентов с раком предстательной железы и толстой кишки. OmicsTweezer успешно выявлял даже редкие подтипы клеток и отслеживал изменения в их популяции у разных групп пациентов, что может помочь в поиске новых терапевтических мишеней.
Эта разработка стала возможной благодаря сотрудничеству в рамках проекта SMMART (Serial Measurements of Molecular and Architectural Responses to Therapy) ключевой программы института, направленной на подбор индивидуализированной терапии для пациентов, страдающих распространёнными формами рака.
"Такая работа невозможна в одиночку," подчеркивает Чжэн Ся. "Это действительно результат коллективного труда."
Истинная ценность этого исследования заключается в том, что оно делает высокоточный клеточный анализ более доступным. В мире накоплены терабайты данных массового секвенирования РНК (bulk RNA-seq) образцов тысяч пациентов, хранящихся в биобанках и базах данных. OmicsTweezer, по сути, предоставляет ключ к их повторному, но теперь значительно более глубокому анализу. Мы можем ретроспективно изучить эти архивы и выявить взаимосвязи между составом клеток в микроокружении опухоли и эффективностью конкретных препаратов, выживаемостью пациентов и побочными эффектами. Это прямой путь к созданию новых диагностических панелей и биомаркеров, которые помогут онкологам принимать более взвешенные решения о лечении.
Необходимо подчеркнуть, что данный метод зависит от качества и полноты клеточного атласа. Если в данных об отдельных клетках отсутствует редкий или новый тип клеток, или его сигнатура определена неточно, OmicsTweezer не сможет его обнаружить в массированных данных. Алгоритм способен идентифицировать только то, что ему уже известно. Следовательно, точность инструмента не абсолютна и зависит от текущего уровня знаний о клеточном разнообразии, которое постоянно пересматривается и уточняется, сообщает innovanews.
Обратите внимание: