Система ресурсных баз данных

Проблемы природных ресурсов занимают особое место в развитии любого государства, определяя степень его независимости и процветания.

Полная, достоверная информированность в данном вопросе с целью контроля, анализа и прогнозирования состояния ресурсов является одной из приоритетных потребностей в интересах объективных , научно-обоснованных оценок возможных путей развития общества.

Существующее положение с данными о ресурсах экономики РФ можно охарактеризовать наличием разрозненных информационных массивов в отдельных ведомственных и отраслевых системах (некоторые республик и отраслей), а также в базах данных отдельных предприятий и организаций.

Большое количество фактографической информации о при родных ресурсах сосредоточено в базах научно-технической информации.

Отсутствует централизованный учет этих информационных массивов и их систематизация.

Можно утверждать, что сейчас в стране нет полных и достоверных данных о земельных и водных ресурсах (полноценных централизованных кадастров), о растительном и животном мире, о состоянии лесов; нет данных о нетрадиционных энергоресурсах и вторичных ресурсах, крайне разрозненна и неполна информация по экологической обстановке и т.п. Требует систематизации и пополнения информации по топливно-энергетическим ресурсам, необходимо обновление базы данных по гидроэнергетическим ресурсам.

Систему БД природных ресурсов отличает ряд особенностей , в том числе:

- разнообразие видов объектов ресурсов БД;

- взаимозависимость и взаимозаменяемость различных видов ресурсов, а следовательно, необходимость обеспечения информационной взаимосвязи и сопоставимости информации о них;

- существование большого числа как централизованных , так и региональных и ведомственных источников информации;

- различные формы представления информации в информационных потоках (цифровой, текстовой, графической, картографи ческой и т.д.);

- большой диапазон объемов и временных параметров ин формационных потоков, получаемых как с помощью датчиков, так и ручным вводом;

- влияние состояния ресурсов и окружающей среды одного региона на другие.

В соответствии с изложенным систему БД о ресурсах целесообразно проектировать в виде распределенной сети БД как в разрезе регионов, так и видов ресурсов и их совокупностей. При этом возникает необходимость обеспечения взаимодействия БД в процессе их функционирования. При этом должна учитываться многоаспектность классификаций как регионов, так и вмдов ресурсов, а следовательно характер информационных взаимосвязей.

Необходимо определить ряд общесистемных требований для возможностей интеграции и информационной целостности совокупности ресурсных БД во времени.

Одним из системных требований является регламентирование процесса актуализации информации во времени. Целесообразно выделить два режима: регламентированный и нерегламентированный, обеспечивающий актуализацию БД в реальном времени.

Для обеспечения взаимодействия и сопоставимости данных необходимо создание и ведение баз данных , содержащих сведения о конкретных БД системы и структурах и режимах данных.

Подводя итог изложенного можно сформулировать следующие основные положения концепции построения ресурсных баз данных:

1.Ресурсные БД должны создаватьвся как территориально-распределенные с интеграцией в общую сеть БД по признакам назначения, взаимозаменяемости, взаимозависимости. Это обуславливает следующую группировку ресурсных данных по направлениям:

- земли, воды и водные источники, атмосфера;

- биоресурсы (животный и растительный мир, биопродуктивность земли и вод;

- гидрометеорология;

- полезные ископаемые и энергоресурсы;

- вторичные ресурсы и отходы;

- экологическая обстановка;

- технология производства (добыча) и использования ресурсов. Приоритетность направлений определяется на местах в зависимости от преобладающих видов ресурсов и технологий.

2.Формирование ресурсных БД целесообразно осуществлять силами регионов, имея в виду развивающуюся заинтересован ность местных мунициполитетов в определении имеющейся собственности. При этом на первой стадии данные о ресурсах могут быть включены в более информационные массивы, например, массивы паспортов территорий , городов, предприятий. Финансирование работ по БД должно осуществлятся в основном за счет средств местных органов власти (нецентрализованных источников).Финансирование работ по интеграции БД в сеть должно осуществлятся в основном за счет нецентрализованных источников (межрегиональные связи заинтересованных регионов), так и за счет централизованных (связи регион-центр). При этом ассигнования из центральных источников могут выделяться в рамках соответствующей научно-технической программы и/или как плата за пользование региональной информацией.

3.При формировании и развитии сети источников информации для ресурсных БД необходимо использовать наряду с имеющимися источниками возможности конверсии .При этом имеется в виду как создание и тиражирование первичных средств сбора информации (датчики, сигнализаторы, другие средства контроля), так и использование некоторых систем наблюдения

и связи и транспортных средств.

4.Интегрированные БД по регионам должны создаваться с максимально возможным использованием сложившихся ведомственных информационных систем ресурсных , экологических и других служб и организаций, но общую ответственность за эти БД должны взять на себя региональные органы.

5.На общегосударственном уровне целесообразно создавать специализированные БД, содержащие данные о проблемах и объектах, имеющих международное, общероссийское, межрегиональное значение, а также об уникальных объектах природы и ресурсов.

К середине 90-ых годов в РФ в области фактографических баз данных в науке сложилась ситуация, характеризующая следующими особенностями:

1. Существует значительное количество практически не связанных друг с другом информационно-решающих систем и банков фактографических данных. Имеется дублирование в разработке БД и БнД, и в то же время появление БД в таких областях знаний, где ими пользуется только узкий круг специалистов. Эти банки данных создаются давно сложившимися научными коллективами и поддерживаются ими прежде всего для информационного обеспечения собственных нужд (новые технологии подготовки справочников, работы в рамках между народного сотрудничества и т.д.). В отраслевых НИИ фактографические БД создавались в интересах поддержания того или иного рабочего места (АРМ) технолога, конструктора и т.п.

Такие БД имеют очень ограниченную доступность, использование их для широкого круга пользователей проблематично, а их учет и регистрация затруднены.

2. Развиваются как большие фактографические БД (например, по структурам химических веществ, спектроскопии и т.д.), так и специальные БД, например, по химии особо чистых веществ, физико-химической кинетике газовых реакций и т.п.). Эта тенденция в полной мере отвечает и зарубежному опыту.

3. Отсутствуют по большей части мотивы к кооперации и интеграции разработчиков ФБнД. Расширение узкоспециальных ФБнД, приспособленных к решению только одного класса за дач, на другую предметную область требует заново решать проблему выбора программных средств, т.к. при этом меняются структуры фактографических данных.

4. Фактографические БД формируются двумя способами:

1) на основенакопленных разработчиками больших массивов одно родной информации; 2) на основе документальных потоков существующих документографических БД.

5. Понижено доверие специалистов к фактографическим, прежде всего численным данным, получаемым из БнД, вследствие большой вероятности ошибок при вводе значений. Проблема проверки достоверности информации перед ее загрузкой в БД является актуальной и за рубежом, и в РФ. Для отечественных фактографических БнД она решена только в части единичных функционирующих БД. Для большинства отечественных фактографических БнД эта проблема остается актуальной в силу отсутствия финансирования и других ресурсов.

Представление научной информации в фактографических БД имеет следующие особенности:

- трудная формализуемость многих типов данных;

- актуальность многих, прежде всего, экспериментальных данных в течение длительного времени (часто многими десятилетиями);

- использование аналитических форм представления данных (уравнения состояния, уравнения термодинамического подобия и другие зависимости), необходимым компонентом ФБнД в науке, как правило, является модель предметной области, вне связи с которой, данные теряют смысл;

- наличие нескольких видов данных, отличающихся способом обработки. Несмотря на общность подходов к информации в науке, формируются представлением непосредственно полученных или выявленных из литературных источников численных и структурных данных, графической информации, тем не менее наблюдаются и значительные отличия в различных областях знания: степень систематизации данных, уровень достоверности данных и возможности их экспертной проверки, традиционные способы представления информации, степень вариабельности данных и т.д.

К настоящему времени выделились два подхода к созданию фактографических БД. Условно их можно назвать "исследовательским" и "библиотечным".

Наиболее характерная черта "исследовательских" БД – целенаправленный отбор информации для решения заранее сформулированной исследовательской задачи.

При "библиотечном" подходе сбор информации, как правило, непосредственно не связан с ее использованием. БД формируются преимущественно в ходе централизованной работы крупных научных и информационных центров и пополняются новыми данными без изменения уже существующей структуры информационного массива.

Свертывание научной информации, которое связано с функционированием БД, позволяет пользователю в более сжатые сроки и в концентрированном виде получить интересующие его сведения, в большинстве своем прошедшие экспертную проверку на достоверность. Таким образом, разработка и эксплуатация БД в той или иной области науки или техники позволяет значительно увеличить доступную пользователю долю информационных ресурсов и, в конечном итоге, приводит к по лучению нового знания.

С распостранением персональной техники с современным сервисным обеспечением появляется возможность создания локальных баз данных, необходимых для научных исследований.

Информация для таких баз заимствуется из обзоров, справочников, отдельных оригинальных работ и других источников, и значительно реже - из банков данных. Однако качество информации , предлагаемой пользователям банками данных, существенно выше , поскольку эта информация проходит экспертный анализ на достаточно высоком уровне - в среде специалистов по данному вопросу , и оперативно обновляется.

Появление значительного числа проблемоориентированных локальных БД в различных областях науки , реализованных как правило, на ПЭВМ, особенно остро ставит задачу координации работ в области информационного обеспечения научных исследований. За последние годы во многих странах возникли специальные организации , деятельность которых направлена, с одной стороны , на сбор, систематизацию и распространение информации о функционирующих или только проектирующихся БД (объеме и содержании информационного массива и комплексе информационных услуг), а, с другой стороны, на стимулирование и финансирование проектов, связанных с созданием БД, совершенствованием их программного и лингвистического обеспечения, а также разработкой единых стандартов при переводе данных в машиночитаемую форму.

При объединении локальных БД в информационную сеть одна из основных задач - обеспечение прямой и надежной связи между банками данных и личными локальными базами данных, оперативное наполнение таких локальных баз информацией из банков данных. Такая связь и поддержка локальных баз данных уже хорошо освоена в США (например, система STN) и Западной Европе. Банки данных , не включенные в сети, имеют возможность оперативно передавать данные по инетрнету . В связи с этим необходимо обеспечить организацию современных методов передачи информации банков фактографических данных по сетям. Помимо решения технических проблем это потребует от системной организации банков данных обеспечения возможности формирования передаваемых файлов данных независимо от конкретной СУБД и типа машинной реализации , ведения гибких форматов и соответствующих интерфейсов средств обмена данными в разных форматах.

База данных может быть централизованной или распределенной. Централизованная база поддерживается одной ЭВМ. Распределенные базы можно разделить на два типа. В од ном случае каждый пользователь имеет почти все данные на своей ЭВМ, в другом случае каждый вид данных находится в каком-то одном месте и центральная ЭВМ поддерживает только каталог всех данных с указанием местонахождения конкретных данных. По-видимому, наиболее перспективной является последняя система организации.

При проектировании в систему , помимо трдиционного хранилища информации, могут входить также следущие подсистемы:

- библиотека научных программ для обработки данных (моделирование, вычислительный эксперимент и др.);

- библиотека статистической обработки данных (регрессионный анализ, сглаживание, оценка достоверности, получение значений коэффичиентов эмпирических и теоретических зависимостей , графический пакет и т.д.);

- буфер получаемых данных для их предварительного анализа (возможно и архив результатов);

- ряд служебных подсистем, таких , как вводи коррекция данных, обмен данными между хост-машиной и локальными системами и др.

Форма вывода данных определяется потребностью конкретных пользователей. БнД должен выполнять широкий спектр запросов от простейших информационных до слжных, требующих расчетов по прикладным программам.

БнД может быть использован также как программная основа автоматизированного рабочего места исследователя с правом доступа к справочным данным и внесением собственных данных в имеющуюся БД.

Особое внимание следует обратить на открытость систем, особенно в частности возможности включения программ математической обработки данных.

ФБнД в области науки должны обладать возможностью восполнения недостающих данных при помощи баз моделей, алгоритмов и программ расчета и т.п.

Пользователю БнД должна быть предоставлена возможность доступа к любым имеющимся в нашей стране и за рубежом документографическим системам.

Интеграцию разнородных БД в общие мультидисциплинарные банки должны обеспечивать мировые центры данных и БнД специальных проектов. При этом БД верхнего уровня должны выполнять роль баз данных и содержать информацию о наличии данных в банках нижнего уровня.

Одной из важнейших проблем , решаемых в ходе разработки ФБнД, является создание экспертной службы (ЭС). ЭС выполняют три функции: сигнальную , аналитическую и справочную. Типичными формами ЭИ являются:

- для сигнальной информации - экспертные рефераты;

- для аналитической информации - текущие и ретроспективные аналитические обзоры;

- для справочной информации - таблицы фактографических данных. Экономический механизм создания и развития ФБнД в науке механизмом финансирования исследований, в результате которых формируется ФБнД (через научные фонды, ассоциации и т.п.).В особых случаях ФБнД в науке могут финансироваться государством. Обслуживание по таким ФБнД должно производиться на бесприбыльной основе (например, в образовании).

ФБнД в науке представляют собой национальное достояние и подлежат экспортному лицензированию.

 
Оригинал текста доступен для загрузки на странице содержания
< Пред   СОДЕРЖАНИЕ   Загрузить   След >