Международная группа ученых под руководством специалистов из Университета Аликанте и Центра лесных наук и технологий Каталонии представила глобальную базу данных World Annotated Bird Acoustic Dataset (WABAD). Проект объединил тысячи аудиозаписей из различных экосистем планеты для обучения алгоритмов искусственного интеллекта автоматическому распознаванию птиц по их голосам.
Система позволяет вести мониторинг биоразнообразия без прямого вмешательства в среду обитания. Технология пассивного акустического мониторинга – один из наиболее эффективных методов оценки состояния фауны, особенно в труднодоступных регионах. В ходе исследований ученые размещали автоматические рекордеры в лесах и заповедниках на срок до нескольких месяцев.
Сейчас база данных включает более 5000 минут записей и около 90 000 фрагментов вокализаций 1192 видов птиц. В проекте использованы данные из 72 экосистем, расположенных в Китае, Вьетнаме, Коста-Рике, Гватемале, Гвинее-Бисау, Новой Зеландии, Мексике, США, Аргентине и Испании. Специалисты детально проверили каждую запись, определив вид птицы и точное время звучания голоса, что необходимо для корректного обучения нейросетей.
Наибольшее количество записей в коллекции приходится на Европу, за ней следуют регионы Латинской и Северной Америки, Азии, Африки и Океании. На Пиренейском полуострове сбор данных проходил в национальном парке Доньяна, лесах Каталонии и сельских районах Кастилии. Среди наиболее представленных в архиве видов оказались зяблик и черный дрозд, а также соловей, зарянка и просянка.
Практическое применение WABAD выходит за рамки фундаментальной науки. Анализ звукового ландшафта дает возможность фиксировать изменения в видовом составе и оценивать динамику восстановления или деградации территорий. Автоматическая идентификация птиц заменяет длительные ручные учеты, позволяя следить за состоянием природы на больших площадях при минимальных затратах ресурсов.