Нейронные сети и ГИС
В качестве основной альтернативы подходу Дж. фон-Неймана обсуждалась ориентация на воспроизведение принципов работы биологических нейронных сетей. Примерно в те же годы, что и первый компьютер, была создана первая нейроподобная система — пер- септрон Розенблатта. Некоторое время оба направления — Дж.фон- Неймана и Ф. Розенблатта — развивались независимо, затем персеп- тронное направление пережило кризис и возродилось уже в 80-е годы под именем нейронных сетей, при этом на новом этапе бинарно-логический и бионический принципы стали сочетаться. Интересно, что кризис бионического направления во многом был обусловлен не техническими сложностями и не отсутствием приложений, а содержательным математическим рассмотрением, проведенным М. Минским и С.Пейпертом, — они показали, что не существует персептрона, способного надежно определять топологические характеристики образа, такие, как связность, и этого оказалось достаточно для резкого падения первоначального энтузиазма. Любопытно также, что и возрождение энтузиазма было связано не с опровержением выводов Минского и Пейперта, а просто с формированием обширной ориентированной на приложения сферы деятельности. Впрочем, в последние годы появились некоторые приложения нейроподобных алгоритмов и к задачам топологий.'
Сопоставление машины фон-Неймана и биологической нейронной сети приведено в табл. 4.1.
Таблица 4.1
Сопоставление машины фон-Неймана и биологической нейронной сети
Показатель | Машина фон-Неймана | Биологическая нейронная сеть |
Процессор | Сложный | Простой |
Высокоскоростной | Низкоскоростной | |
Один или несколько | Большое количество | |
Память | Отделена от процессора | Интегрирована в процессор |
Локализована | Распределенная | |
Адресация не по содержанию | Адресация по содержанию | |
Вычисления | Централизованные | Распределенные |
Последовательные | Параллельные | |
Хранимые программы | Самообучение | |
Надежность | Высокая уязвимость | Живучесть |
Специализация | Численные и символьные операции | Проблемы восприятия |
Среда функционирования | Строго определенная | Плохо определенная |
Строго ограниченная | Без ограничений |
Рис.
44. Сравнение технического и биологического нейронов
Более конкретные характеристики мозга человека: кора головного мозга образована нейронами поверхностью толщиной от 2 до 3 мм и площадью около 2,2 дм2, содержит около 10" нейронов, каждый нейрон связан с 103—104 другими нейронами.
Нейроны взаимодействуют посредством короткой серии импульсов, как правило, продолжительностью несколько миллисекунд. Сообщение передается посредством частотно-импульсной модуляции. Частота может изменяться от нескольких единиц до сотен герц, что в миллион раз медленнее, чем самые быстродействующие переключательные электронные схемы. Тем не менее достаточно сложные решения по восприятию информации человек принимает за несколько сотен миллисекунд.
Сопоставим биологический нейрон с наиболее часто рассматриваемой схемой технического нейрона (рис. 44).
Оба типа нейронов реагируют на воздействие со стороны многих нейронов, в зависимости от величины связей с этими нейронами. В отличие от технических нейронов, реакция биологического нейрона всегда неотрицательна, причем, если воздействие на него не достигло критического уровня, то реакции нет. Возможно, что с этим связано одно из наиболее очевидных отличий биологических нейронных сетей от существующих в настоящее время нейропрограмм — один и тот же мозг, в зависимости от того, какие нейроны «молчат», может работать весьма различным образом, это выглядит так, как будто мозг — «склад» процессоров, которые по-разному соединяются при разных задачах. Аппаратное обеспечение, реализующее технические нейроны, постепенно усложнялось — сначала это были релейные схемы, сейчас, например, операционные усилители, но чаще всего — эмуляция в обычном ком-
Рис. 45. Типы технических нейросетей
пьютере. Характеризуя вычислительную мощность, можно отметить, что по экспертным оценкам современные ПК могут моделировать уровень нервной системы сложных червей, лучшие нейросетевые спецпроцессоры — уровень мухи.
Если рассматривать биологические нейронные сети, то для них существует принципиальное внутреннее деление: нейронные сети могут реализовывать либо рефлекторное поведение, либо мышление. Нейрофизиологически рефлекторному поведению соответствует относительно короткий всплеск процессов в ответ на внешнее воздействие с последующим возвращением в спокойное состояние, а мышлению — длительная работа сети, нередко с весьма умеренным, но постоянным уровнем возбуждения мозга, при этом внешние воздействия скорее мешают. В технических системах воспроизводят в основном рефлекторное поведение, хотя возможно, что некоторые нейроалгоритмы, решающие «внутренне сложные» задачи, могут сопоставляться и с процессами мышления.
Типы технических нейросетей. В литературе заметное внимание уделяется вопросам архитектуры технических нейронных сетей, приведем вариант соответствующей классификации схем (рис. 45).
Более принципиальным является разбиение нейроалшритмов на два класса — Supervised (обучающиеся по образцу, с учителем) и Unsupervised (обучающиеся без образца, без учителя). В первом случае обучение организовано как воспроизведение набора правильных образцов (обучающей выборки), после чего сеть может адекватно реагировать и на примеры, которых не было в обучающей выборке, во втором случае образцы правильной реакции исходно отсутствуют. В части русскоязычной литературы утвердились термины «обучение с учителем» и «обучение без учителя», что не является точным переводом с английского и не вполне точно по нормам русского языка. Видимо, нейросети, обучающиеся по образцу, неплохо воспроизводят рефлекторное поведение. Нейросети, обучающиеся без образца, быть может, иногда моделируют более интересную вещь — мышление, однако делают это несравненно менее успешно.
Нейросети, обучающиеся по образцу, произошли от персептро- нов и в современной трактовке могут рассматриваться как варианты и модификации сетей с обратным распространением ошибки (иногда как результат примитивизации такого рода сетей, в целях упрощения реализации).
К этому классу можно отнести, например, однослойный и многослойный перцептроны, машину Больцмана, сети, обучающиеся по правилу Хебба, рекуррентные слоистые и полносвязные сети обратного распространения ошибки, сети, использующие радиальные базисные функции. Различия между указанными системами порой достаточно велики, но всегда есть немало общего, а детали классификации различаются у разных авторов.Нейросети, обучающиеся без образца, более разнообразны, хотя стоящая за ними теория математически порой более примитивна — это карты Кохонена, системы с множественными локально устойчивыми состояниями, такие как сеть Хопфилда, сети, настраивающиеся на основе адаптивного резонанса. Прямые аналогии между данными классами не просматриваются, хотя часто исходно имеются необработанные данные, а в итоге возникают их образы, построенные в ходе работы нейросети, либо сама сеть, меняя свою структуру, моделирует образы данных. В живой природе есть аналоги и этому — строились карты возбуждения участков коры мозга в зависимости от возбуждения участков тела, получившие названия «гомункулусов», оттого, что на этих картах формируется узнаваемый образ человека, только ладони, например, получаются увеличенными, а спина — уменьшенной.
Наконец, разрабатываются, хотя и не нашли широкого применения, комбинированные подходы. Идеология такого комбинирования заставляет вспомнить лозунг «человека создал труд». За основу здесь берется алгоритм обучения по образцу, произвольно устанавливающий некое первоначальное, можно сказать «абстракционистское», соответствие между «сырыми данными» и «обработанными данными». Затем «обработанные данные» меняются в ходе внешней «трудовой деятельности» с учетом «свойств материала», так что соответствие улучшается. Устанавливается новое соответствие между исходными и обработанными данными, вновь меняются обработанные данные и так далее. В итоге нейросеть порождает, с одной стороны, «художественный образ» ситуации, а с другой — собственный навык быстрого, как бы рефлекторного, соотнесения реальных данных и их образов.
Например, так можно проверять связность образа данных — если «природа материала» не позволяет ему изменять связность, а вышеобозначенный подход работает, то значит и у образа данных связность та же. Этот пример дан для того, чтобы напомнить о кризисе нейросетевого подхода, имевшем место до 80-х годов, в связи с пессимизмом по части возможностей использования нейроалгоритмов в задачах топологии.В заключение укажем задачи, которые принято относить к чаще всего рассматриваемым в рамках нейросетевого подхода:
• обучение по образцу — классификация образов, аппроксимация функций, предсказание, управление, анализ данных, категоризация внутри класса, сжатие данных; обучение без образца — категоризация, категоризация внутри класса, анализ данных, сжатие данных, ассоциативная память.
Нейросетевые алгоритмы — математические аспекты. Под именем нейросетевых алгоритмов в настоящее время объединяется несколько подходов к обработке данных, которые их авторы, не согласовывая друг с футом, сочли напоминающими принципы организации биологических нейронных сетей. Видимо, сыграла роль привлекательность названия вместе с тем обстоятельством, что по-настоящему принципы работы таких сложных биологических систем, как мозг человека, никому не известны, и в этом смысле все равны и свободны. Это несколько нарушает существующие в математике традиции логически обоснованной классификации алгоритмов, но поскольку некоторые нейроалгоритмы достаточно эффективны, приходится считаться с установившейся практикой. Рассмотрим два типа нейроалгоритмов, наиболее часто используемых в приложениях, — алгоритмы обратного распространения ошибки (back error propagation algorithms; BackProp; в российских публикациях 80-х годов использовалось математически более точное название: алгоритмы двойственного функционирования; АДФ) и карты Кохонена (самоорганизующиеся карты, self-oiganization maps, SOM).
Алгоритм обратного распространения ошибки. Такие алгоритмы создавались во многом для решения классической задачи математической статистики — задачи регрессии табличных данных.
Хорошо известны простейшие задачи регрессии — такие как задача проведения прямой, наилучшим образом приближающей облако точек (например, прямой, сумма квадратов расстояний точек до которой минимальна). В этом примере речь идет о линейной регрессии, алгоритм которой должен определить параметры положения прямой, — ее углы наклона к осям координат и координаты одной из точек прямой.Если речь идет о нелинейной регрессии, в качестве аппроксимирующего облака точек многообразия выступает не прямая, не плоскость или гиперплоскость, а некоторая гладкая кривая, поверхность или гиперповерхность. Чтобы описать такие нелинейные многообразия, требуется увеличить число параметров по сравнению со случаем линейной регрессии: возникает задача многопараметрической нелинейной регрессии.
Задолго до возникновения алгоритма обратного распространения ошибки были известны сложности проведения нелинейной многопараметрической регрессии данных: при большом числе параметров регрессии увеличивается время счета; параметры регрессии определяются неоднозначно (так называемая плохая обусловленность задач многопараметрической регрессии); неясно, как выбрать лучший из множества вариантов нелинейной регрессии.
Алгоритм обратного распространения ошибки успешно преодолел первую из указанных сложностей, после чего был накоплен практический опыт в отношении двух оставшихся сложностей, так что в настоящее время эти сложности уже не смущают, хотя полной математической теории по их поводу так и не было создано. Можно говорить о том, что нейроалгоритм обратного распространения ошибки эффективно решает задачи многопараметрической нелинейной регрессии: имеются программы, осуществляющие «хорошую» нелинейную регрессию для десятков и сотен тысяч точек с определением десятков тысяч регрессионных параметров за приемлемое время (до нескольких суток счета). Суть метода изложена в специальной литературе.
Алгоритмы квантования данных и карты Кохонена. Карты Ко- хонена — это вариант алгоритмов квантования данных, т. е. представления N точек данных с помощью меньшего числа точек-образцов. Изложим один из вариантов — Batch SOM. Выбирается регулярная сетка М узлов, расположенная так, чтобы примерно соответствовать наиболее важной части пространства данных, обычно М существенно меньше N. Каждая точка данных «приписывается» к ближайшему для нее узлу. Определяется среднее арифметическое положение векторов «приписанных» групп, пусть для узла / это будет rh Определяется среднее арифметическое положение векторов, «приписанных» к первым соседям групп, пусть для узла / это будет Д . Новое положение узлов задается вектором р, + Xrt, где X — параметр метода порядка десятых единицы. Шаги 2—5 повторяются несколько раз.
В итоге получается сетка, не лишенная черт регулярности, но сгущающаяся там, где густы исходные данные. Такая сетка может рассматриваться как компактная модель исходного множества данных либо как средство классификации новых данных — этим данным можно приписывать тот же класс, который ранее был приписан ближайшему к вектору данных узлу карты Кохонена.
Прочие нейросетевые алгоритмы. Комбинируя два изложенных типа алгоритмов, можно получать новые варианты алгоритмов обработки данных. Например, если данных много, то можно сначала по ним построить компактную карту Кохонена (точнее, ее многомерную версию), и уже к этой карте применять методы нелинейной регрессии. Однако не все нейроалгоритмы сводятся к такого рода комбинациям — с ними следует знакомиться по многочисленным специализированным изданиям.
Области применения нейросетевых ГИС. Интегрированные с геоинформационными системами нейронные сети — мощный инструмент для решения широкого круга задач, обеспечивающий эффективную поддержку принятия решений. В качестве входных и выход
ных данных нейронная сеть может использовать пространственно координированные данные. Программы, созданные на основе нейросетевых алгоритмов, будут динамически модифицировать слои электронной карты, изменять характеристики существующих объектов, создавать новые объекты. В результате обработки массива имеющихся данных могут также возникать новые слои карты, в то время как существующие слои будут приобретать динамические свойства.
Можно привести много примеров, демонстрирующих эффективность нейросетевых подходов, реализуемых в ГИС-среде. Наиболее выигрышно они проявляют себя в ситуациях, когда приходится иметь дело с большими массивами информации, хранящимися в крупных организациях, на основе которых принимаются решения. В них нуждаются специалисты, оценивающие и прогнозирующие состояние какой-либо области человеческой деятельности, например, рынков сбыта продукции, реальной стоимости недвижимости, загрязнения территории. Планирование очередности действий при развитии территорий и их инвестиционной привлекательности, выявление зон с наиболее напряженной экологической, социальной или экономической ситуацией, анализ характеристик геологических объектов — эти и многие другие задачи уже невозможно решать на современном уровне без привлечения интеллектуальных геоинформационных систем.
Приведем несколько примеров.
В сельском хозяйстве одни слои ГИС могут содержать сведения о посеве зерновых культур, а другие — об урожайности. Нейросеть в этом случае будет обобщать практический опыт методов и технологий выращивания зерновой культуры с учетом конкретных климатических, почвенных и прочих характеристик выбранной территории.
В лесоустройстве с помощью нейросети можно анализировать динамику приростов деревьев по высоте, диаметру и объему. Обработка тематических слоев ГИС с такой информацией поможет спланировать лесоустроительные работы, например при выращивании насаждений сосны в лесопарках и в зеленых зонах.
Прогностические нейросетевые модели могут использоваться в демографии и организации здравоохранения, опираясь на пространственные данные по плотности населения, медицинской статистике, загрязнению окружающей среды, представленные в виде слоев ГИС. Экспертная система будет определять, например, вероятностную продолжительность жизни, зависимость различных категорий заболеваемости от экологического состояния территории, прогнозировать вспышки эпидемий.
Обработка ДДЗ — одна из традиционных задач, решаемых геоинформационными системами. Анализ изображений с точки зрения математики опирается на теорию распознавания образов, когда по входным данным необходимо отнести объект к тому или иному классу. В данной области нейронные сети наряду с методами нечеткой логики нашли наиболее широкое применение, с их помощью можно описать правила классификации, не прибегая к точным математическим значениям (используя понятные человеку термины типа «небольшой», «значительный» и т. д.). И, наоборот, извлекать из обученных нейронных сетей правила классификации по исходным данным, представляя их на обычном языке. В отличие от традиционных статистических методов, основанных на вычислениях в рамках той или иной математической формализации, классификаторы, базирующиеся на нейронных сетях, используют адаптацию в процессе обучения, не требующую предварительного обоснования модели. В то же время доказано, что результаты классификации и в том и в другом случае могут совпадать, т.е. нейронная сеть способна сама построить соответствующую математическую формализацию.
Для классификации используются различные нейросетевые алгоритмы. В нейронной сети с обучением без образца проводится анализ цветных или черно-белых пикселей снимка без привязки к другим слоям карты в целях выделения однородных фрагментов изображения (объектов) по тону, структуре, оттенку. Обучение по образцу полагается на доступные пространственные данные для выбранного участка территории. Если известно априори, что выбранному фрагменту снимка соответствует, например, лесной массив с известной степенью антропогенной нарушенности, то эта информация может быть использована нейронной сетью для классификации изображения.
Нейронные сети все чаще используются в задаче выявления пространственно однородных участков изображения. Эта задача является очень актуальной при разработке теоретических и методологических основ новых альтернативных систем земледелия, принципов экологически безопасною землепользования и проектов землеустройства на ландшафтной основе. Отдельные элементы ландшафта могут быть выявлены на основе анализа фрагментов изображения, их формы, цвета, взаимосвязей, неоднородности. Нейронная сеть также позволит оценить взаимосвязи отдельных элементов ландшафта.
В транспортной отрасли нейронная сеть может стать эффективным дополнением к ГИС при мониторинге автомобильных дорог. Здесь речь идет об анализе транспортной нагрузки и состояния полотна дороги, выборе оптимальных коридоров для строительства новых трасс и определении приоритетов в строительстве, анализе различных стратегий проведения ремонтных работ и соответственном распределении финансовых вложений. Задачей для нейронной сети может стать оперативное принятие решения по оптимизации распределения транспортной нагрузки на автомобильные дороги в случае дорожно-транспортного происшествия в определенном месте, повлекшего за собой скопление автомобилей (пробку). Нейронная сеть будет использовать в качестве входных данных слои ГИС с автодорогами, местоположением аварии, текущими погодными условиями и прочими характеристиками, которые влияют на скорость движения. Все параметры системы, имеющие отношение к указанному происшествию, будут скорректированы нейронной сетью, и их откат в исходное состояние станет возможен после стабилизации ситуации. Следующим шагом в развитии данного направления должна стать возможность онлайнового доступа из автомобиля с помощью карманных ПК (КПК, PDA) и других мобильных устройств к картографическому серверу, содержащему оперативную информацию об обстановке на дорогах и подготовленные с помощью нейросети рекомендации по выбору оптимального маршрута.
Программное обеспечение. На рынке программного обеспечения в настоящее время имеется множество самых разнообразных программ для моделирования нейронных сетей. Поиск в Интернете дает сотни ссылок на зарубежные и российские сайты. Можно выделить несколько основных функций, которые реализованы во всех этих программах: формирование, конструирование нейронной сети; обучение нейронной сети; имитация функционирования (тестирование) обученной нейронной сети.
С точки зрения компьютерной технологии и программных интерфейсов они опираются на современные стандарты — от простых программ, ориентированных на платформу Unix с текстовым интерфейсом, до сложных модульных продуктов, базирующихся на последних технологических решениях от Microsoft.
Интегрированные решения на основе ГИС и нейронных сетей пока представлены слабо, несмотря на то, что повышение функциональной мощности геоинформационных пакетов за счет интеграции специальных модулей расширения или ГИС-приложе- ний — одна из важнейших черт современных геоинформационных систем. Проблема интеграции нейронных сетей и ГИС может быть решена по крайней мере тремя способами: интеграция (встраивание) нейросетевых моделей в ГИС с использованием специализированных средств геоинформационной системы (программирование на встроенных языках типа Avenue, MapBasic и т.п.); развитие интерфейса между отдельными приложениями нейросетевого анализа и ГИС, как самостоятельными системами; создание прикладного программного обеспечения нейросетевых систем с элементами ГИС (например, с использованием библиотек классов типа MapObjects, GeoConstructor, МарХ и пр.).
Выбор конкретного варианта связан с требованиями и постановкой задачи, имеющимися ресурсами и опытом работы. Ниже приводятся два конкретных примера — программных продукта, которые уже созданы на основе нейросетей и ГИС.
Программа ScanEx-NeRIS
Программа NeRIS предназначена для тематической интерпретации пространственных данных, в первую очередь данных дистанционного зондирования Земли. Основной инструмент, реализованный в программе, — нейронные сети Кохонена. Являясь одним из методов классификации многомерных данных, нейронные сети Кохонена обладают важными дополнительными свойствами, на которых основана значительная часть используемых в программе алгоритмов.
Возможности пакета тематической обработки растровых изображений в программе ScanEx-NeRIS: оценка количества классов, требуемых для описания тематики и составления тематической карты; оценка внутренней дробности, неоднородности тематических объектов (контуров); оценка распределения свойств экспертных объектов в признаковом поле модели; оценка вероятностей присутствия тематических объектов, заданных экспертом в поле признаков снимка (выделение на изображении областей с различным уровнем оценки: оптимистическим, реалистическим, пессимистическим); построение иерархических классификаций с оценкой близости классов между собой; создание тематически ориентированных нейронных сетей для последующей обработки растра с целью выявления тематических объектов; автотрассировка (векторизация) результатов доклассовой обработки; поддержка системы координат наиболее распространенных отечественных и зарубежных картографических проекций; экспорт растровых покрытий и векторных слоев в наиболее распространенных обменных форматах; представление результатов классификации для всех видов нейронных сетей как присвоением индекса класса каждому классифицированному пикселу, так и созданием растровых слоев «вероятности» (possibility) принадлежности пиксела одному конкретному классу (создание нескольких таких слоев с последующей их визуализацией позволяет наглядно представлять результаты классификации, например, выявлять «белые пятна» (неклассифицированные области пространства) и представлять данные для окончательной классификации традиционными методами).
Еще по теме Нейронные сети и ГИС:
- СЕТИ КОНФЛИКТУЮЩИЕ, СЕТИ ИСЧЕЗАЮЩИЕ
- Глава 5 ПРОЕКТИРОВАНИЕ ГИС
- Глава 2 ФУНКЦИОНАЛЬНЫЕ возможности гис
- ГИС и Интернет
- Глава 3 ГИС КАК ОСНОВА ИНТЕГРАЦИИПРОСТРАНСТВЕННЫХ ДАННЫХ И ТЕХНОЛОГИЙ
- Выбор программного обеспечения ГИС
- ГИС идистанционное зондирование
- Разработка системного проекта ГИС
- ГИС и глобальные системы позиционирования
- Глава 2 Сети сквозь поколения
- Три революции и их сети
- Наши сети
- Голос индустриальной сети
- Социальные сети и джихад
- ЧАСТЬ 1. УЗЛЫ СЕТИ