4.1.4 Разработка научно-методических основ построения больших распределенных систем дистанционного мониторинга состояния окружающей среды, природных и антропогенных объектов.
Особое значение при построении больших распределенных систем дистанционного мониторинга состояния окружающей среды, природных и антропогенных объектов все больше приобретают вопросы, связанные с организацией их документирования и контроля. При этом, поскольку системы мониторинга обычно являются достаточно сложными информационными системами, в работе которых задействовано большое число ресурсов и производится и распространяется  огромное число информационных продуктов, требуется создание специализированных блоков их документации и контроля (СДК). Работы в этом направлении достаточно давно ведутся и в ИКИ РАН. В 2011 году в ИКИ РАН была выпущена новая версия СДК, которая позволила упростить контроль работы достаточно большого числа информационных систем, создающихся и поддерживающихся в ИКИ РАН. В настоящем разделе мы кратко опишем возможности этой системы. 
Для обеспечения бесперебойной работы систем сбора, обработки и распространения спутниковых данных необходим контроль. Эффективная система контроля позволяет модернизировать систему с учетом необходимых мер по предотвращению сбоев в работе системы и устранять сбои с минимальными потерями для клиентов или даже без всякого ущерба. Базируясь на разработки и эксплуатацию систем дистанционного мониторинга можно выделить основные задачи контроля и управления:
    - Контроль за успешным и своевременным выполнением программ.
    В системах, связанных с потоковой обработкой спутниковых данных, получение требуемых информационных продуктов, зачастую, является многошаговой процедурой, в которой может участвовать довольно большое количество связанных процессов. Ошибка в каждом из этих процессов или несвоевременное выполнение процесса может привести к тому, что пользователь вовремя не получит интересующие его информационные продукты. Таким образом,  необходимо контролировать успешность и своевременность выполнения каждого из процессов.
      
    - Контроль за состоянием компьютеров.
    Т.е. контроль таких параметров, как наличие свободного места на дисках, состояние дискового массива, работы механизма репликации баз данных и других важных сервисов. Как правило, своевременное детектирование такого рода сбоев позволяет избежать серьезных проблем.
      
    - Контроль за своевременным поступлением информационных продуктов.
    Основным критерием проведения такой проверки должно быть наличие актуальных информационных продуктов в соответствующих базах данных.
      
    - Оперативное оповещение персонала. 
    Для устранения сбоя необходимо оповестить о ней персонал, занимающийся поддержкой работы системы,  используя возможности электронной почты и других средств доставки сообщений таких, как SMS. 
      
    - Протоколирование сбоев и контроль их устранения.
    Регистрация обнаруженного сбоя с детальным описанием сбоя и оповещением персонала о ходе его устранения.
      
    - Протоколирование изменений в системе. 
    Необходимо оперативно отслеживать и оповещать персонал о последних изменениях в системе, обеспечивая дополнительную надежность. 
      
    - Документирование программных и аппаратных  компонент системы.
    Документирование многочисленных электронно-вычислительных и программных компонент, входящих в систему дистанционного мониторинга. 
      
    - Интеграция всех реализованных компонент контроля и управления.
    Удобный интерфейс по использованию всего разработанного инструментария. 
Решение обозначенных задач требует разработки специального программного обеспечения и специальных организационных мер. В статье мы кратко опишем разработанный нами инструментарий и подробно рассмотрим систему документирование и контроля, задачей которой является документирование и интеграция реализованных компонент. 
Программный пакет PMS это ядро системы контроля и предназначен, в первую очередь, для контроля за успешным и своевременным выполнением программ на UNIX серверах. На базе программного пакета PMS решаются задачи: контроль за успешным и своевременным выполнением программ, контроль за состоянием компьютеров, оперативное оповещение персонала. 
Пакет устанавливается на каждый из серверов, участвующих в работе системы. При этом контролируемые процессы запускаются в автоматическом режиме при помощи специальной программы, которая сохраняет в БД протоколы их выполнения. Доступ к информации о выполнении программ реализован при помощи WEB интерфейса, позволяющего, в частности, задать критерии детектирования ошибок для каждого процесса. Для оперативного оповещения о возникших в работе процессов сбоях используется электронная почта. 
Сбои, выявленные системой PMS, заносятся в Систему ведения сбоев  в ручном или автоматизированном режиме. Система ведения сбоев обладает как программным так и пользовательским интерфейсами. Пользовательский интерфейс позволяет вручную заносить информацию об обнаруженном сбое и ходе его устранения. При занесении сбоя в систему, обязательно указывается список специалистов, которые должны принять меры по его устранению. Система ведения сбоев решает задачи: Оперативное оповещение персонала, протоколирование сбоев и контроль их устранения.
Контроль за своевременным поступлением информационных продуктов осуществляется Системой контроля наличия информационных продуктов. Система позволяет следить за сроком «давности» экземпляров данных для каждого из определенных в ней типов продуктов. Доступ к информации осуществляется при помощи WEB интерфейса. В случае обнаружения ошибки система автоматически заносит информацию в систему сбоев. 
  
Ввиду постоянной модернизации системы крайне важно отслеживать все изменения по доработке или добавлению новой функциональности системы.   Для этого была разработана Система протоколирования изменений, которая решает задачу протоколирования изменений в системе. Основным элементом системы является WEB интерфейс, через который разработчик заносит детальное описание изменений.
Выше описанные компоненты являются универсальными и дополняются Специальными интерфейсами контроля в рамках конкретной системы. Например, чтобы свести различные параметры контроля за работой распределенной системы, в рамках одного интерфейса разрабатывается обобщающий WEB интерфейс – панель контроля за функционированием системы. 
По мере совершенствования разработанного инструментария и постоянного роста системы дистанционного мониторинга возникает задача по интеграции реализованного инструментария в рамках одной системы.  Для этих целей была разработана Система документирования и контроля.
Система документирования и контроля (СДК). СДК разрабатывалась для эффективного решения задач: Документирование программных и аппаратных  компонент системы, Интеграция всех реализованных компонент контроля и управления.
Документирование программных и аппаратных компонент для различных систем дистанционного мониторинга требует введения однотипных понятий, на базе которых возможен эффективный контроль и управление в рамках каждой системы. 
Для документирования нескольких систем дистанционного мониторинга в рамках СДК было введено понятие – Проект.
Проект – любая совокупность программно аппаратных средств, объединенных одной тематикой, которая указывается в описании Проекта. 
В Проект входят следующие понятия:
Организации – центры приема спутниковых данных или центры обработки спутниковых данных;
Компьютеры – сервера, станции обработки, рабочие места;
Базы Данных – базы данных, расположенные на серверах; 
Блоки обработки – цепочки обработки спутниковых данных;
Веб интерфейсы  - интерфейсы, установленные на серверах;
Тип исходных данных – описание исходных данных (например, спутник-прибор).
На базе введенных понятий была разработана база данных СДК и реализован интерфейс СДК, в котором каждое понятие выделено в тематический блок (Рис. 4.1.4.1).

Рис. 4.1.4.1 Интерфейс СДК.
В каждом блоке осуществляется добавление, просмотр, редактирование уже введенной информации. Структура понятий выстроена иерархически.  Например, для добавления описания базы данных необходимо наличие описания сервера, на котором расположена база данных . Общую схему построения СДК смотрите на рисунке 4.1.4.2. Приведенная схема построения СДК позволяет интегрировать различный инструментарий по контролю и управлению в единый интерфейс.  СДК позволяет документировать основные компоненты системы дистанционного мониторинга. На базе документации разрозненных компонент системы дистанционного мониторинга осуществляется интеграция и контроль  ее отдельных компонент и всей системы в целом. 
На текущий момент Система документирования и контроля успешно эксплуатируется нами для документирования и управления действующих распределенных систем дистанционного мониторинга. Хотя описанное в настоящей статье программное обеспечение разработано под конкретную архитектуру построения распределенных систем дистанционного мониторинга, оно может представлять интерес и для других информационных систем такого класса.

Рисунок 4.1.4.2. Схема СДК