Все аудиозаписи сегментированы и проверены на отсутствие посторонних шумов и звуков. Разметчики придерживались строгого ТЗ:
1) В разметку не должны попадать любые посторонние звуки: пение других птиц, шум деревьев, разговоры людей, и любые другие звуки отличные от чистого пения птицы данного вида.
2) Если на аудиозаписи слышно пение одновременно множества птиц одного вида, такие сегменты включать в разметку не нужно, так как требуется разметить чистое пение одной птицы каждого биологического вида.
3) Желательно, чтобы продолжительность сегментов была не меньше, чем половина секунды, но при этом в сегмент не должны попадать лишние звуки, описанные ранее.
Датасет можно использовать для создания нейронки, генерирующей звуки природы, или птичьего Shazam, который будет определять, какая птица поёт в реальном времени.