Все карты врут.

Я прям скописпастить решил! Источник gisa.ru


На сайте POBonline.com размещена статья, посвящённая точности географических карт и способам её оценки.

Автор статьи, Майк Талли (Mike Tully), является президентом и главным исполнительным директором компании Aerial Services. Он является сертифицированным фотограмметристом и профессионалом в области географических информационных систем, а также членом Американского общества фотограмметрии и дистанционного зондирования (ASPRS), Ассоциации управления для частных фотограмметрических исследователей (MAPPS), общества американских лесоводов (SAF) и Национального совета по географической информации (NSGIC).

Все карты врут. Привыкайте к этому! Карты являются абстракцией реального мира и лишь приблизительным отображением реальности. Каждый слой рельефа или лазерных данных включает в себя десятки, если не миллионы, измерений местоположения объектов. Как и все измерения, их точность не является абсолютной. Орто- и лазерные базовые карты не могут накладываться друг на друга идеально. Они часто создаются для различных целей. Это означает, что допустимые ошибки на каждой карте разные. Для любого профессионала в области геопространственных технологий важны количественные значения этих ошибок. Насколько близки отображаемые координаты на карте к фактическому местоположению объекта на земле? Какая карта является наиболее точной?


Сегодня специалисты в области картографии тонут в океане доступных геоданных, которые можно легко загрузить и интегрировать в новые карты. Точность этих данных часто не ставится под сомнение, пока аномалия или проблема не будет обнаружена. Но поскольку геоданные доступны в таком изобилии, то получение новых часто не требует никаких усилий. Так как точность и ошибки так важны, то полное понимание этих концепций имеет важное значение.

Точность является основополагающим фактором для любого геопространственного проекта. Профессионал, хорошо разбирающийся в геопространственных данных, всегда сначала должен убедиться, что у используемых им данных хорошо описано значение их точности – тогда и реализованный им проект будет работать хорошо. Но это приводит к другому вопросу: Насколько точными могут быть данные (или должны быть), чтобы координаты объектов определялись верно? Что подразумевается под «правильными данными»? Координаты являются «идеальными» или просто «достаточно близкими», если имеют точность пять дюймов (около 12 см)? Пять футов (около 1,5 м)? Пять метров? Пятьдесят метров? Всегда ли ошибка может быть выражена количественно?

Существует базовая универсальная истина: каждое измерение любым устройством, содержит ошибку. Зная эту аксиому, можно сказать с абсолютной уверенностью: все карты является «неправильными». Эта «абстракция реальности» лишь моделирует реальный мир, и он не является совершенным. Координаты, которые пользователи снимают с карты, не будут быть истинными координатами расположения объектов на Земле. При этом не имеет большого значения, является ли пользователь карты экспертом или картографом или использует лучшее оборудование. Измерения все равно являются неправильными.

Зная, что «истинное» значение измерений объектов никогда не известно и значение ошибки также никогда не известно точно, то для профессионалов геопространственной отрасли становится необходимым знать о точности и погрешностях, связанных с картографированием. Лучшее, что можно сделать, это измерить и сопоставить данные, с использованием передовых технологий, а затем описать распределение этих ошибок. Национальный стандарт по пространственной точности данных (National Standard for Spatial Data Accuracy - NSSDA) позволяет статистически достоверно, последовательным методом измерять и сообщить о точности и связанных с ней погрешностей геопространственных данных.

Представители настоящего искусства и науки в области картографии и фотограмметрии оценивают, насколько близкими к «идеальным» являются измерения. Нет смысла говорить о точности геопространственного продукта, если никто конкретно не знает о точности позиционирования его данных. Кроме того, никто не может иметь любые рациональные ожидания по точности, если заинтересованные стороны не определили предполагаемое использование геоданных, и если он не был создан специально для этого использования по назначению.

Люди используют Google и Bing Maps каждый день для множества приложений. Большинство из них не имеют ни малейшего представления, насколько точны эти карты. На самом деле, нет никакой указанной точности позиционирования на этих сервисах. Но пользователей это не волнует, потому что они просто «работают», или пользователи знают, что карты «достаточно точны». Но люди грамотные понимают профессиональную неопределенность точности этих данных и осторожно используют эти ресурсы, зная, что их нельзя применять для некоторых целей.

Поскольку угроза для общественного благосостояния и безопасности реальна, то геопространственные данные обязаны понимать и «использовать по назначению» и обеспечить технические характеристики и результаты совместимые с ними. Это уместно в настоящее время, потому что наборы геопространственных данных так легко найти, и многие из них не имеют метаданных, описывающих их точность или возможности предполагаемого использования. Заинтересованные стороны должны иметь хорошее представление о том, как они намерены использовать любые карты, которые они запрашивают. Они также должны знать, для чего они не предназначены. Концепция «Использования по назначению» должна диктовать требования к точности. Например, сопоставление данных о планировании землепользования должно быть не хуже по точности, чем плюс/минус 3 фута (примерно 1 м), в то время как карты, используемые для технических целей, возможно, потребует точность плюс/минус 3 дюйма (7,6 см). Расходы, связанные с картографированием, пропорциональны их точности: чем выше точность, тем больше стоимость. Поэтому, правильное определение назначения карты может сэкономить вам деньги, если вы не станете покупать данные лучшей точности, чем это вам необходимо.

Как не спрашивать о точности. Solici-tations для геопространственных сервисов поддерживается различными организациями. Это не редкость - найти ошибки в указаниях на характеристики по точности. Например:

«Цифровая модель рельефа по данным спутника Spot будет использована для обеспечения полной и точной информации о высотах».

Понятие «Полная и точная» не измеримы. Каждая фирма, вероятно, считает, что производит самые «полные и точные» данные, что делает невозможным сравнение цен и объема данных.

Другой пример: «Ортофотопланы сотого масштаба составлены для удовлетворения горизонтальной точности 2,0 фута при уровне достоверности 95 процентов».

Это высказывание уже лучше, потому что они пытаются выразить требования к точности использованием NSSDA прогнозов. Но что такое «100-й масштаб» цифровых ортофотопланов? Ссылки на «масштаб» для цифровых изображений, когда он могут быть отображены в любом масштабе, не имеют смысла. Оставьте слово «масштаб» для бумажных карт, соответствующим стандартам 1990 ASPRS и ранее для крупномасштабных карт.

Набор данных должен включать данные о присущей им точности позиционирования. Было ли это «проверено»? Или это были только ничем не подкрепленные предположения о точности? Роль NSSDA - это установление стандартизированного способа учета точности и погрешностей. Пользователи могут затем легко сравнивать точность одного набора данных с другим, и принимать более обоснованные решения о возможности использования определенного набора данных для их целей.

Отклонение. Точность. Дисперсия.

Чтобы понять, как количественно выразить точность данных для профессиональных задач, нужно понимать ошибки: отклонение и дисперсию. Термин «Отклонение» набора данных описывает близость одного измерения к другому. Этот показатель указывает на случайные ошибки. «Точность» с другой стороны, описывает степень совершенства данных, полученных при измерениях, то есть насколько близко они находятся к «истинному» значению измерений. На точность влияют как случайные, так и систематические ошибки. При отсутствии систематической ошибки (и просчета) , точность и близость равны. В общем же случае близость может ухудшать точность.

Наборы данных, полученные с дидаров (или ортоизображения) состоят из миллионов "измерений". Каждой точке (или пикселю) присваивается координата X, Y и Z.

«Наличие неопределенности не вызывает сомнений». Ничто не может быть измерено без ошибок. И эта ошибка должна быть определена количественно. Если человек не может количественно измерить эту ошибку, то «доверие» к таким данным будет низким в лучшем случае, и необоснованным , в худшем случае.

Для оценки точности набора данных полевых исследований выполняется измерение расположения, по меньшей мере, 20 четко определенных объектов (опорных точек GCP) , которые видны в наборе данных LiDAR. (Конкретное писание того, как это можно сделать в каждом конкретном случае также важно, но это повод для отдельной статьи). Эти 20 точек GCP измерены очень хорошо (и практика показывает, что они являются, по крайней мере, в три раза более точными, чем остальные данные). При измерении опорных точек тем же самым прибором, они , безусловно, также будут ошибочными, а потому лучше измерить их приборами с большой точностью, тогда их точность будет на порядок выше точности лазерных данных. «Степень доверия» того, что эти 20 точек дают точную информацию о высотах, достаточно высока.

Измеряя разницу между координатами опорных точек («истиной»), и теми данными, которые получены с лидаров, можно оценить расхождение в значениях координат X, Y и Z в каждой из наших опорных точек. Если рассчитать эту разницу для каждой из 20 опорных точек, то можно сделать оценку погрешности для всего «набора» точек данных LiDAR. Статистика говорит, что 20 измерений достаточно, чтобы оценить средние ошибки в наборах данных в случае «нормального распределения» («доверяй, но проверяй» - это также важная тема уже для другой статьи), и если опорные точки хорошо распределены по всей территории.

При усреднении ошибок по координатам X, Y и Z для каждой точки, полученной с данных LiDAR с опорными точками, мы получаем хорошее понимание, насколько велика ошибка в среднем. Но нам нужно больше информации, чем простое среднее значение этой ошибки. Например, предположим, что средняя ошибка по X и Y составляет 8 дюймов. Но если мы выберем 21-ую опорную точку а данных измерений, то насколько близко к этой средней ошибки измерений она будет? Иными словами, насколько уверенно можно говорит о том, что это средняя ошибка дает надежную оценку следующего измерения? Как можно сопоставить информацию о значении этой ошибки с другими наборами данных? К счастью, статистика уже описала эту процедуру.

«Доверие» можно измерить с помощью изучения частоты и распределения ошибки наблюдений. Уверенность изменяется обратно пропорционально диапазону ошибок GCP. Были измеренные разности между точками LiDAR и опорными точками все очень близкими к 8 дюймам (X, Y), либо какие-то из них значительно отличались от 36 дюймов? По всей вероятности, данные с 20 опорных точек, существенно различаются между собой: ​​некоторые из них значительно ближе к «истине», некоторые значительно более отдалены от нее. На самом деле, если все наблюдения были усреднены, то если точка имеет погрешность по координате Х 2 дюйма, по координате Y 4 дюйма, а по координате Z 6 дюймов, то данные будут «нормально» распределены. То есть, ошибки измерений колеблются между 2-мя и 6-ю, и имеют средне значение 4. Эта оценка дисперсии называется среднеквадратической ошибкой (СКО). Это ключевой элемент статистики, используемой в отчетности NSSDA.

После того, как распределение (и частота) ошибки (СКО) известна, то вероятность того, что 21-ая (или даже сотая) GCP будет находиться в пределах некоторого расстояния от среднего значения, может быть количественно оценена. Например, предположим, что 95 % всех наших измерений находятся в пределах +-5 дюймов от средней погрешности 8 дюймов, то есть где-то между 3 и 13 дюймами. То есть с вероятностью 95% наблюдаемая средняя ошибка будет равняться 8 дюймам, так что фактическая погрешность лидара составляет где-то между 3 и 13 дюймов. Эта же фраза с точки зрения спецификации NSSDA будет звучать так:

“LiDAR был протестирован на соответствие горизонтальной точности 10,0 дюймов для четко определенных функций на уровне достоверности 95 %».

Невозможно точно определить, какой именно будет последующие отклонение измерения от истинного значения GCP, но есть только 1 шанс из 20 (1/20 = 5 %), что эта ошибка будет более чем на 5 дюймов отклоняться от среднего значения.

Точность и соответствие.

После того, как ошибка, связанная с набором пространственных данных была описана и количественно, она может быть сравнена с другими географическими данными, у которых эта ошибка также описана количественно. Кроме того, заинтересованные стороны получают обоснованное представление о том, как правильно (или неправильно) они могут использовать эти данные для картографирования, и определить, соответствуют ли они их предназначению. Затем абстракция реального мира будет служить заинтересованным сторонам и другим пользователям для информирования. [Подробное описание того, как вычислить СКО и точность геопространственных наборов данных, можно найти в Стандарте по определению геопространственной точности позиционирования: Часть 3. Национальный стандарт для определения пространственной точности данных, опубликованный Федеральным комитетом по географическим данным, 1998].

Комментарии

Популярные сообщения из этого блога

Apache2 и cgi-bin на Ubintu Server 12.04

Перемещаемые подписи в QGIS