ИИ научили «на глаз» определять, где собрали гербарный образец

Анастасия Максименко Редактор ленты новостей
Современные большие языковые модели могут с выс...

freepik.com

Современные большие языковые модели могут с высокой точностью определять место сбора гербарных образцов и тем самым ускорить оцифровку коллекций естественной истории. К такому выводу пришли биологи Университета Северной Каролины в Чапел‑Хилл. Результаты работы опубликованы в журнале Nature Plants.

Речь идёт о геопривязке — восстановлении координат по этикетке образца, где указаны исторические описания местности, старые названия деревень или ориентиры вроде «у моста в трёх милях к северу от города». Сейчас это один из самых трудоёмких этапов оцифровки: исследователю приходится вручную сопоставлять текст с картами и справочниками, либо использовать специализированное ПО с обязательной доработкой экспертом.

Команда под руководством постдока кафедры биологии Юйяна Се протестировала большие языковые модели на реальных этикетках из коллекций UNC. Алгоритм на основе LLM анализировал текст, сопоставлял его с современными топонимами и предлагал координаты точки сбора. По данным авторов, средняя ошибка составила менее 10 километров, что сопоставимо с человеческой точностью и превосходит традиционные автоматические системы.

При этом скорость и стоимость такого подхода оказались на порядки ниже: модель обрабатывает массивы записей за минуты, тогда как ручная геопривязка тех же объёмов может занимать недели. По оценке Сяо Фэна, доцента кафедры биологии и автора‑корреспондента статьи, это снимает одно из ключевых «узких мест» в оцифровке гербариев и открывает путь к массовой обработке миллионов образцов.

Сейчас в мире, по различным оценкам, хранится от 2 до 3 миллиардов гербарных экземпляров, и лишь малая часть снабжена полными цифровыми и пространственными данными. Авторы исследования считают, что применение LLM к геопривязке позволит в сжатые сроки превратить гербарии в глобальную базу данных о распределении видов, полезную для мониторинга утраты биоразнообразия, анализа реакции флоры на изменение климата и реконструкции прошлых экосистем, сообщает rutab.net.

Читайте также:

Источник: samaraonline24.ru

Читайте в Дзен