Космомониторинг
Байкальская природная территория (БПТ) обладает обширными и частично труднодоступными площадями. На таких территориях наиболее широко используемым источником данных является дистанционное зондирование Земли (ДЗЗ). Имеются спутники, предоставляющие снимки с различным пространственным разрешением и регулярностью. Разработано большое количество методов обработки данных ДЗЗ. В рамках проекта ведется работа по созданию системы мониторинга, включающей регулярный сбор данных, обработку и публикацию результатов.
Данные ДЗЗ могут использоваться для множества задач. Для них применяются множество методов обработки и анализа. Данные ДЗЗ характеризуются достаточно большим объемом данных и требуются значительные вычислительные мощности для их обработки. Так, загруженные на геопортал снимки Sentinel-2 на Иркутскую область и Бурятию за три года занимают более 57 терабайт, 21 тысяча снимков. Для ускорения обработки данных на исследуемой территории данные ДЗЗ импортируются из открытых источников в систему хранения данных (СХД). Разработан Каталог снимков, позволяющий найти, просмотреть и получить нужные снимки из СХД. Сбор данных производится специальными компонентами, которые скачивают снимки и регистрируют в каталоге. Каждый снимок представлен на карте в виде ограничивающего прямоугольника. Отображаются снимки в двух режимах (для Sentinel-2 это native RGB и RGB на основе каналов B12, B8A, B04). Реализован поиск снимков с учетом сенсора, облачности, положения и даты.
Можно искать снимки, находящиеся внутри указанного пользователем экстента, либо содержащие выбранный экстент. Добавлен поиск снимка по его идентификатору в каталоге. Снимки можно скачать (Download).
Одной из задач анализа данных ДЗЗ является классификация, где для каждого пикселя снимка определяется его класс – растительность, открытая почва, вода, антропогенные объекты и т.д. Данные ДЗЗ любой территории, в том числе Иркутской области и Байкальской природной территории, имеют специфические спектральные и текстурные характеристики. Для учета специфических характеристик активно применяются методы классического обучения с учителем. Применение методов обучения с учителем для задач классификации снимков требует подготовки обучающей выборки на заданную территорию. Нами проанализированы существующие наборы данных, предназначенные для классификации снимков. Одним из наиболее используемых является набор данных EuroSAT, который состоит из 27000 образцов снимков европейских стран. Набор размечен 10 классами. Учитывая высокую точность, полученную на снимках европейских стран, на данных EuroSAT произведено обучение сверточной нейронной сети, которая затем применена на исследуемой территории. Однако результаты оказались отрицательными – вся территория БПТ была классифицирована как вода. Это произошло из-за того, что значения спектральных каналов набора EuroSAT значительно отличаются от значений соответствующих каналов исследуемой Байкальской природной территории. Кроме того, набор классов не покрывает БПТ, а некоторые классы в принципе отсутствуют, поэтому начато формирование обучающей выборки на БПТ.
Природные особенности ландшафтов Байкальской природной территории обусловили состав обучающей выборки, большая часть территории которой занята горной тайгой, а в средней части преобладает лесостепной ландшафт. Лесообразующие породы включают в себя хвойные (сосна, лиственница, кедр) и лиственные (береза, осина) деревья. В высокогорном поясе и поймах рек распространены кустарниковые заросли, поэтому в обучающей выборке лесные ресурсы представлены 5 классами: хвойный, лиственный и смешанный лес, редколесье, кустарники. На БПТ проводятся активные заготовительные рубки леса, в том числе и нелегальные, для их учета к набору добавлен класс «Вырубки». Значительную и важную часть исследуемой БПТ занимают водные объекты и горные системы, для обработки которых добавлены классы «Голая скала» и «Вода». На исследуемой территории развит аграрный комплекс, который на текущий момент представлен классами «Однолетние сельскохозяйственные культуры» и «Пастбище». Для оценки антропогенного влияния на территорию добавлен класс «Жилая зона». На снимках БПТ достаточно часто присутствуют облака, которые значительно влияют на качество классификации. Маски облаков, представленные в наборе данных Sentinel-2, недостаточно точны, поэтому для учёта их влияния, добавлен класс «Облака».
Построение обучающей выборки проводится с помощью Web-интерфейса (рис. 2) на основе данных Sentinel-2 и полевых исследований. Разметка осуществляется полигональными объектами с указанием класса, директории снимка, даты съемки. Идентификацию классов лесов проводили на основе комбинации каналов SWIR (2185.7-2202.4 мкм), NIR (864.0-864.7 мкм) и RED (664.6-664.9 мкм), позволяющей отделять породы по интенсивности оттенка зеленого цвета на полученном изображении.
Для классификации снимков применялась сверточная нейронная сеть ResNet50. Архитектура сети представлена на рисунке 4.
Обучение проводилось на 12 классах по 4000 образцов в каждом. Классификация производилась попиксельно. Решение о классе пикселя принимается на основе анализа его окрестности 64×64 пикселя, где каждый пиксель имеет пространственное разрешение 10 м., т.е. производится анализ окрестности 640×640 метров. Каждый пиксель представлен 13 исходными каналами Sentinel-2. Каждый образец представлен тензором 64x64x13.
Проведена классификация снимков Sentinel-2 за 2018-2020 годы. Обработано более 20 тысяч снимков на 4 вычислительных узлах с GPU. Результаты классификации можно посмотреть в каталоге. Нужно в интересующем снимке кликнуть на следующую иконку:
Работа по формированию обучающей выборке, улучшению качества результатов продолжается. Кому интересно, можете писать по адресу fedorov@icc.ru.