Logo GenDocs.ru

Поиск по сайту:  


Загрузка...

Бейцун С.В. Конспект лекций по Основам компьютерно-интегрированного управления - файл 1.doc


Загрузка...
Бейцун С.В. Конспект лекций по Основам компьютерно-интегрированного управления
скачать (725.5 kb.)

Доступные файлы (1):

1.doc726kb.18.12.2011 00:01скачать

1.doc

1   2   3   4   5   6   7
Реклама MarketGid:
Загрузка...
^

Процессы в информационной системе


Процессы, обеспечивающие работу информационной системы, условно можно представить в виде схемы, состоящей из блоков:





Блок ввода информации предназначен для ввода информации из внешних или внутренних источников. Далее поступившая информация передается в блок обработки информации для обработки и представлении ее в удобном виде. Вывод информации осуществляется через блок вывода для представления потребителям или передачи в другую систему. Блок обратной связи предназначен для коррекции входной информации операторами.
Информационная система определяется следующими свойствами:

  • любая информационная система может быть подвергнута анализу, построена и управляема на основе общих принципов построения систем;

  • информационная система является динамичной и развивающейся;

  • выходной продукцией информационной системы является информация, на основе которой принимаются решения;

  • современная информационная система – это человеко-компьютерная система обработки информации.


Внедрение информационных систем способствует:

  • получению более рациональных вариантов решения управленческих задач за счет внедрения математических методов и интеллектуальных систем и т.д.;

  • освобождению работников от рутинной работы за счет ее автоматизации;

  • обеспечению достоверности информации;

  • замене бумажных носителей данных на магнитные диски или ленты, что приводит к более рациональной организации переработки информации на компьютере и снижению объемов документов на бумаге;

  • совершенствованию структуры потоков информации и системы документооборота;

  • уменьшению затрат на производство продуктов и услуг;

  • предоставлению потребителям уникальных услуг.



Примеры информационных систем: информационные системы, ускоряющие потоки товаров, информационные системы по снижению издержек производства, информационные системы автоматизации технологии.




^

Структура информационной системы



Среди обеспечивающих подсистем обычно выделяют информационное, техническое, математическое, программное, организационное и правовое обеспечение.





^ Информационное обеспечение предназначено для своевременного формирования и выдачи достоверной информации для принятия управленческих решений. Информационное обеспечение — совокупность единой системы классификации и кодирования информации, унифицированных систем документации, схем информационных потоков, а также методология построения баз данных.

^ Техническое обеспечение — комплекс технических средств, предназначенных для работы информационной системы, а также соответствующая документация на эти средства и технологические процессы.

Комплекс технических средств составляют: компьютеры любых моделей; устройства сбора, накопления, обработки, передачи и вывода информации; устройства передачи данных и линий связи; оргтехника и устройства автоматического съема информации; эксплуатационные материалы и др.

^ Математическое и программное обеспечение — совокупность математических методов, моделей, алгоритмов и программ для реализации целей и задач информационной системы, а также нормального функционирования комплекса технических средств.

К средствам математического обеспечения относятся: средства моделирования процессов управления; типовые задачи управления; методы математического программирования, математической статистики и др.

В состав программного обеспечения входят общесистемные и специальные программные продукты, а также техническая документация. К общесистемному программному обеспечению относятся комплексы программ, ориентированных на пользователей и предназначенных для решения типовых задач обработки информации. Они служат для расширения функциональных возможностей компьютеров, контроля и управления процессом обработки данных. Специальное программное обеспечение представляет собой совокупность программ, разработанных при создании конкретной информационной системы.

^ Организационное обеспечение — совокупность методов и средств, регламентирующих взаимодействие работников с техническими средствами и между собой в процессе разработки и эксплуатации информационной системы.

Организационное обеспечение реализует следующие функции:

  • анализ существующей системы управления, где будет использоваться ИС, и выявление задач, подлежащих автоматизации;

  • подготовку задач к решению на компьютере, включая техническое задание на проектирование ИС и технико-экономическое обоснование ее эффективности;

  • разработку решений по составу и методологии решения задач, направленных на повышение эффективности управления.

^ Правовое обеспечение — совокупность правовых норм, определяющих создание, юридический статус и функционирование информационных систем, регламентирующих порядок получения, преобразования и использования информации.

^

Классификация информационных систем по функциональному признаку


По функциональному признаку, который определяет назначение системы, а также ее основные цели, задачи и функции, информационные системы делятся на:

Производственные – связаны с непосредственным выпуском продукции и направлены на создание и внедрение в производство научно-технических новшеств.

Маркетинговые включают в себя:

  • анализ рынка производителей и потребителей выпускаемой продукции, анализ продаж;

  • организацию рекламной кампании по продвижению продукции;

  • рациональную организацию материально-технического снабжения.

Финансовые связаны с организацией контроля и анализом финансовых ресурсов организации на основе бухгалтерской, статистической, оперативной информации.

Кадровые направлены на подбор и расстановку необходимых организации специалистов, а также ведение служебной документации по различным аспектам.

^

Классификация по степени автоматизации


В зависимости от степени автоматизации информационных процессов информационные системы разделяются на:

Ручные ИС характеризуются отсутствием современных технических средств переработки информации и выполнением всех операций человеком.

Автоматические ИС выполняют все операции по переработке информации без участия человека.

^ Автоматизированные ИС предполагают участие в процессе обработки информации и человека, и технических средств, причем главная роль отводится компьютеру. Их классифицируют по характеру использования информации и по сфере применения.




^

Классификация по характеру использования информации


Информационно-поисковые системы производят ввод, систематизацию, хранение, выдачу информации по запросу пользователя без сложных преобразований данных. Например, информационно-поисковая система в библиотеке, в железнодорожных и авиакассах продажи билетов.

Информационно-решающие системы осуществляют операции переработки информации по определенному алгоритму. По степени воздействия выработанной результатной информации на процесс принятия решений разделяют на управляющие и советующие.

Управляющие ИС вырабатывают информацию, на основании которой человек принимает решение. Для этих систем характерен тип задач расчетного характера и обработка больших объемов данных.

Советующие ИС вырабатывают информацию, которая принимается человеком к сведению, но не превращается немедленно в серию конкретных действий. Эти системы обладают более высокой степенью интеллекта, так как для них характерна обработка знаний, а не данных.

^

Классификация по сфере применения


Информационные системы организационного управления предназначены для автоматизации функций управленческого персонала. Основными функциями подобных систем являются: оперативный контроль и регулирование, оперативный учет и анализ, перспективное и оперативное планирование и другие экономические и организационные задачи.

^ ИС управления технологическими процессами (ТП) служат для автоматизации функций производственного персонала. Они широко используются при организации поточных линий, изготовлении микросхем, на сборке, для поддержания технологического процесса в металлургической и машиностроительной промышленности.

^ ИС автоматизированного проектирования (САПР) предназначены для автоматизации функций инженеров-проектировщиков, конструкторов, архитекторов, дизайнеров при создании новой техники или технологии. Основными функциями подобных систем являются: инженерные расчеты, создание графической документации (чертежей, схем, планов), создание проектной документации, моделирование проектируемых объектов.

^ Интегрированные (корпоративные) ИС используются для автоматизации всех функций фирмы и охватывают весь цикл работ от проектирования до сбыта продукции. Создание таких систем весьма затруднительно, поскольку требует четкого определения главной цели.
Достижение высокой эффективности работы информационных систем невозможно достичь только за счет применения современных технических средств. Немаловажными факторами также являются структурные, алгоритмические и языковые вопросы. В настоящее время существует большое количество разнообразных средств программирования информационных систем (CASE-технологии, например, система RTWIN), в состав которых входят средства организации структуры данных, языки запросов и выходных документов, программы ввода информации и т.д. Информационные системы вышли за рамки традиционных сфер применения (справочные службы, различные каталоги и картотеки). Автоматизированные информационные системы широко применяются на производстве: содержат информацию о ходе производственных процессов, наличии на складах инструментов и сырья и т.д. В сфере бизнеса содержат информацию о товарах и фирмах, в сфере обслуживания – продажа билетов и бронирование гостиничных номеров. Имея ПК, пользователь может подключиться к любой из информационных систем и получить нужную информацию.

В рамках развития информационных систем можно выделить пять основных направлений:

  1. Анализ и прогнозирование потоков разнообразной информации с целью ее минимизации и стандартизации для последующей обработки на компьютерах.

  2. Исследование способов представления и хранения информации.

  3. Построение процедур и технических средств для автоматизации процесса получения информации.

  4. Создание информационно-поисковых систем, способных корректно воспринимать запросы к информационным хранилищам.

  5. Создание сетей хранения, обработки и передачи информации, в состав которых входят информационные банки данных, терминалы, обрабатывающие центры и средства связи.


^ ДИАЛОГОВЫЕ СИСТЕМЫ
Поскольку информационная система является человеко-компьютерной системой, важным моментом является правильное построение диалога между пользователем и компьютером. Диалоговые системы составляют основу автоматизированных информационных систем. Основные потоки информации замыкаются внутри ЭВМ и между ЭВМ, а к пользователю поступает переработанная информация в минимальных объемах, необходимых для принятия решений. При этом предполагается не только достаточность информации, но также развитой интерфейс компьютерных систем и умение пользователя вступать в диалог с ЭВМ. Интерфейс – это совокупность технических (аппаратных) и/или программных средств, обеспечивающих сопряжение различных аппаратных средств между собой, а также дающих возможность человеку общаться с этими средствами.

Современный уровень интерфейса – это интеллектуальный интерфейс, обеспечивающий реализацию следующих возможностей пользователя:

  1. поиск в базах данных необходимой документальной и фактографической информации с выходом в библиотечные сети и сети распределенных баз данных;

  2. на основе накопленных знаний в ЭВМ распознавание и диагностика процессов в сложных системах, формирование планов действий, выдвижение и проверка гипотез, выявление закономерностей в результатах наблюдений, логический вывод;

  3. решение проектных, плановых и управленческих задач по их постановкам и исходным данным вне зависимости от сложности математических моделей этих задач.

Под диалогом между человеком и компьютером подразумевается обмен информацией между вычислительной системой и пользователем, проводимый посредством терминала по определенным правилам. Диалог должен обеспечивать выполнение следующих задач: выяснение задания пользователя; прием логически связанных входных данных; выполнение требуемого задания; реакция ДС или вывод результатов обработки по окончании процесса в подходящем для пользователя формате.

Наряду с формой общения важной качественной характеристикой ДС является ее целостность, т.е. сбалансированность поведения системы. В понятие сбалансированности входят следующие факторы поведения ДС:

а) порционность общения;

б) пошаговость решения задачи и связанная с ней возможность доопределения условия задачи.

в) ситуационность диалога должна динамически отражать текущие режимы ситуацию.

Диалоговая система должна удовлетворять следующим условиям:

  • быть представимой в простом и выразительном виде;

  • абстрагироваться от содержательной части диалога (от разделения ролей между человеком и ДС);

  • быть доступной для формально-математической трактовки;

  • быть подходящей для преобразования в программную систему.

В любой ДС можно выделить два рода действий пользователя: получение справок по теме диалога и принятие решений для возобновления вычислений. Причем первое должно быть доступно пользователю в любой момент вычислений, а второе регламентируется и контролируется ДС.

Обмен информацией между участниками диалога происходит в виде сообщений. Существует несколько типов сообщений, среди которых выделяют подсказку, диагностику ошибок, справки.

Подсказка — это выходное сообщение ДС, побуждающее пользователя вводить данные как тексто-числового характера, инициирующие отдельные участки вычислений, так и имеющие характер данных для принятия решений.

^ Сообщение об ошибке — это сигнал ДС о невозможности дальнейшей работы. Обычно введенные пользователем данные проверяются на наличие ошибок. Ошибки разделяются на синтаксические, искажающие структуру и формы представления данных, и семантические, искажающие смысл, содержание информации при сохранении корректности ее структуры и соответствии формальным синтаксическим правилам.

Выделяют следующие методы контроля ошибок, применяемые ДС:

  • контрольное суммирование значений реквизитов (отдельных элементов данных, например, полей записей в СУБД);

  • проверка вхождений сочетаний данных (слов) в список запрещенных (разрешенных) сочетаний значений данных;

  • контроль по модулю;

  • проверка совпадения значений заданных элементов данных;

  • проверка границ согласно указанным диапазонам изменения значений данных;

  • проверка совпадения результата вычислений некоторой агрегатной функции с заданным значением (константой); часто употребляемыми функциями являются сумма и произведение; кроме того проверка нахождения в определенном отношении (больше, меньше) результата вычисления функции с заданным значением;

  • проверка формата, значения элемента данного.

^ Сообщения о состоянии ДС информируют пользователя о том, что произошло или что происходит в системе.

Справочная информация требуется в тех случаях, когда пользователь не может ответить на запрос системы, потому что ему не понятен запрос или он затрудняется, что именно следует предпринимать.
^

Формы заполнения экранов


Для визуализации структур данных и средств управления диалогом применяют экранные шаблоны с полями постоянной и переменной информации, которые называются видеоформой. Как правило, видеоформа содержит следующие области:

  • меню первого уровня (главное меню);

  • рабочая область;

  • строка описания состояния рабочей области;

  • область редактирования;

  • окно сообщений и подсказок.



^

Средства поддержки диалога


Диалоговая обработка информации поддерживается специальными сервисными средствами: экранными редакторами текста, интерпретаторами и отладчиками языков программирования, интегрированными пакетами и т. д.

^ Встроенный язык предоставляет возможность создания пользовательских программ, ввода новых команд, меню и т.п. Он включает:

  • процедуры для форматирования и просмотра окон, создания меню, выдачи ошибок и подсказок, комментариев и звуковых сигналов;

  • средства ввода данных и запоминания их на внешнем носителе для использования другим пакетом;

  • средства создания макрокоманд для вычислительных операторов и мнемонических обозначений клавиш;

  • средства создания собственных функций;

  • арифметические, логические, строковые операции над датой и временем;

  • операторы управления ходом программ (цикла, условный, выбора альтернативы и т.п.);

  • операции над элементами объектов (вставка, удаление, поиск, выбор первого, последнего или следующего элемента);

  • связь с генератором случайных чисел;

  • математические, тригонометрические, статистические функции.

Программа на встроенном языке формируется в окне, запоминается и может быть вызвана для исполнения.

^ Процессор перечней. При обработке документа требуется его схема или структурный план, состоящий из разделов, которые могут включать подразделы. Структурный план формируется в окне и редактируется как обычный текст. Управляет формированием структурного плана процессор перечней.

Клавиатура. Имеются следующие группы клавиш:

  • алфавитно-цифровые для ввода данных;

  • управление курсором;

  • клавиши расширения диапазона действия других клавиш;

  • спецклавиши для управления режимами;

  • функционально программируемые клавиши.

Клавиатура программируется по спец. программе. При нажатии клавиши расшифровывается ее номер и выполняется определенная программа или команда.

Текстовая обработка данных. Традиционно используются следующие базовые функции:

  • создание нового текстового файла;

  • задание формата страницы;

  • ввод и модификация текста;

  • форматирование абзацев;

  • работа с фрагментами текста;

  • контекстный поиск и замена;

  • использование разных шрифтов;

  • связь с другими текстовыми файлами и пакетами.

В зависимости от сложности программы в ней могут содержаться различные дополнительные функции текстовой обработки.

Графическое представление данных. Данные могут быть представлены графиками следующих видов:

  • столбиковая горизонтальная или вертикальная диаграмма;

  • круговая диаграмма;

  • диаграмма соотношения площадей;

  • линейный график;

  • график рассеивания.

Электронные таблицы. В электронных таблицах данные упорядочены в строки и столбцы. Помимо арифметических операций в ЭТ встроен набор различных функций: математических, логических, статистических, финансовых, обработки дат, генерации случайных чисел с указанным распределением и др. Также реализуются операции работы с матрицами и поиска оптимального решения. Данные могут быть представлены в виде различных графиков. ЭТ позволяют создавать и обрабатывать базы данных. Автоматизировать вычисления позволяют встроенные макроязыки. Основным достоинством электронных таблиц является наглядное представление данных и результатов вычислений на экране.

^

Проектирование диалогового интерфейса



Первоначально для разработки ДС не использовались специализированные программные продукты. Создание ДС осуществлялось посредством визуального программирования, что выливалось в длительный и дорогостоящий процесс. В настоящее время для проектирования ДС используются специализированные программные пакеты. Модель ДС компонуется из стандартных блоков с описанием состояний каждого. В отдельных блоках могут выполняться пользовательские программы. Каждый блок может быть запущен в режиме отладки и протестирован.


^

ДОКУМЕНТАЛЬНЫЕ И ФАКТОГРАФИЧЕСКИЕ ИС



В зависимости от характера информационных ресурсов, которыми оперируют ИС, принято различать документальные и фактографические.

^ Документальные системы служат для работы с документами на естественном языке. Они обеспечивают их смысловой анализ при неполном, приближенном представлении смысла. Наиболее распространенный тип документальных систем – информационно-поисковые системы, предназначенные для накопления и поиска по различным критериям документов на естественном языке.

^ Фактографические системы оперируют фактическими сведениями, представленными в виде специальным образом организованных совокупностей формализованных записей данных. Центральным звеном фактографических ИС являются системы управления базами данных (СУБД). Фактографические системы используются как для поиска данных, так и их обработки. Обработка включает такие операции как ввод, хранение, сортировку, отбор и группировку записей данных. В большинстве случаев пользователю представляются итоговые результаты обработки в виде отчетов.
^ Документальные системы
Основной функцией любой документальной информационно-поисковой системы (ДИСП) является информационное обеспечение на основе выдачи ответов на запросы. Основными данными фактографических ИС являются структурированные числовые значения. ДИСП работают с информацией, которая представлена в виде простых текстовых документов. Осуществление выдачи системой требуемых данных реализуется с помощью главной операции ДИСП – проведения информационного поиска. Информационный поиск является процедурой отыскания документов, содержащих ответ на заданные потребителем вопросы. В отличие от фактографических ИС, которые в ответ на запрос потребителя осуществляют выдачу конкретных фактов, ДИСП предоставляют пользователю совокупность документов, смысловое содержание которых соответствует его запросу.

Потребность человека в определенной информации в процессе его практической деятельности носит название информационной потребности. Информационная потребность может быть представлена в виде последовательности ее частных значений в фиксированные моменты времени. Частное значение информационной потребности потребителя в определенные моменты времени, выраженное на естественном языке представляет собой информационный запрос, с которым пользователь обращается к системе.

Информационная потребность не всегда может быть правильно выражена информационным запросом, например, запрос был неправильно сформулирован. Для выражения отношений между информационной потребностью и информационным запросом используют понятия пертинентность и релевантность. Под пертинентностью понимают соответствие смыслового содержания документа информационной потребности потребителя. Документы, содержание которых удовлетворяет информационной потребности, называют партинентными. Релевантность представляет собой соответствие содержания документа информационному запросу, а документы, содержание которых отвечает запросу потребителя, носят название релевантных.

В состав типичной ДИСП входят, как правило, четыре основные подсистемы:

  1. Подсистема ввода и регистрации.

  2. Подсистема обработки.

  3. Подсистема хранения.

  4. Подсистема поиска.

Р
ис. Общая функциональная структура ДИСП

ПП – поисковое предписание;

ПОД – поисковые образы документов;

КСС – критерий смыслового соответствия – это набор правил определения смысловой близости между ПОД и ПП.

Текстовые документы, поступающие на вход системы, могут быть представлены как в бумажном, так и электронном виде. Поэтому подсистема ввода и регистрации решает следующие основные задачи:

  • создание электронных копий бумажных документов (сканирование, ввод с клавиатуры и т.д.);

  • обеспечения подключения к каналам доставки электронных документов;

  • распознавание, а при необходимости и преобразование формата электронного документа;

  • присвоение электронным документам уникальных идентификаторов (регистрация).

Все поступающие документы направляются в подсистему хранения для сохранения в базе документов. Обычно для хранения документов применяют средства сжатия и быстрого поиска информации. Далее документы поступают в подсистему обработки, задачей которой является формирование для каждого документа поискового образа, в который заносится информация, необходимая для последующего поиска. При поступлении на вход запроса пользователя он преобразуется в поисковое предписание ПП и передается в подсистему поиска, задачей которой является отыскание поисковых образов документов ПОД, удовлетворяющих предписанию ПП с точки зрения критерия смыслового соответствия КСС.

Создание запросов на естественном языке (ЕЯ – язык обмена информацией между людьми) имеет существенные недостатки с точки зрения машинной технологии обработки информации:

  1. ^ Многообразие средств передачи смысла. Кроме лексики в передаче смысла могут участвовать такие элементы, как контекст, ссылки на слова, приводимые ранее и т.д.

  2. ^ Семантическая неоднозначность возникает из-за синонимии и многозначности слов естественного языка. Синонимия представляет собой тождественность или близость по значению слов. Многозначность характеризует возможность неоднозначного понимания смысла отдельных слов, например, слова-омонимы.

  3. Эллипсность. Во многих сообщениях встречаются пропуски подразумеваемых слов.

Невозможность использования ЕЯ в ДИСП привела к необходимости применения искусственных средств. ^ Информационно-поисковым языком (ИПЯ) называется специализированный искусственный язык, предназначенный для описания основного смыслового содержания поступающих в систему сообщений, с целью обеспечения возможности последующего поиска. ИПЯ разделяют на классификационные языки и дескрипторные. Принципиальная разница между данными типами языков заключена в процедуре построения предложений языка.

В классификационных языках в лексический состав наряду со словами, выражающими простые понятия, заранее включены также словосочетания и фразы, выражающие сложные понятия. Для записи смыслового содержания сообщений в таких ИПЯ используются только отдельные элементы из этого набора, в том числе и готовые сложные понятия. Наибольшее распространение в классификационных ИПЯ получили рубрикаторы, лексическими единицами которых являются названия тематических рубрик.

В дескрипторных ИПЯ лексические единицы заранее не связаны никакими текстуальными отношениями. Готовых предложений или фраз в таких языках нет, поэтому отсутствуют ограничения на составление сложных предложений. Из небольшого числа лексических единиц данные языки позволяют построить предложения, выражающие любой смысл. Дескрипторные ИПЯ разделяют на языки с грамматикой и без грамматики (отсутствует падежи, времена глаголов, не установлен порядок следования слов), с контролируемой и со свободной лексикой (состав лексических единиц у первых строго ограничен, а у вторых может пополняться).
Модели поиска текстовой информации
Модель поиска текстовой информации характеризуется следующими параметрами:

  • представлением документов и запросов;

  • критерием смыслового соответствия;

  • методами ранжирования результатов запроса;

  • механизмами обратной связи, обеспечивающих оценку релевантности пользователем.

Наиболее распространенными моделями поиска являются:

  • Булева модель представляет документы с помощью набора терминов, присутствующих в индексе, каждый из которых рассматривается как булева переменная. Такие переменные связываются операторами логических операций AND, OR или NOT.

  • ^ Модель нечетких множеств основывается на теории нечетких множеств, допускающей частичную принадлежность элемента тому или иному множеству. Здесь логические операции определены таким образом, чтобы учесть возможность неполной принадлежности множеству, а обработка запросов пользователя выполняется аналогично булевой модели.

Булева модель и модель нечетких множеств не требуют больших объемов вычислений, алгоритмически просты и занимают малые объемы памяти.

  • ^ Пространственно-векторная модель основана на предположении, что совокупность документов можно представить набором векторов в пространстве, определяемом базисом из n нормализованных векторов-терминов. Значение первого компонента вектора представляющего документ отражает вес термина в нем. Достоинствами таких моделей является простота и легкость в реализации обратной связи для оценки релевантности пользователем.

  • ^ Вероятностная модель учитывает все взаимозависимости и связи терминов, а также определяет такие основные параметры, как вес терминов запросов и форма соответствия между запросом и документов. Данная модель базируется на вероятности релевантности и нерелевантности документа запросу пользователя, которые вычисляются на основе вероятностных весовых коэффициентов терминов и фактического присутствия терминов в документе. Кроме того, используются стоимостные параметры, которые характеризуют потери, связанные с включением в результат релевантного документа и пропуском релевантного документа. Сложность применения таких моделей заключается в необходимости введения весовых коэффициентов терминов.



^

Оценка качества ДИСП



Для любой ДИСП присущи два основных типа ошибок:

  • невыдача потребителю фактически релевантных его запросу документов;

  • выдача потребителю нерелевантных которые не отвечают поставленному запросу.

При оценке качества используют следующие параметры:

a – количество выданных релевантных документов;

b – количество выданных нерелевантных документов;

c – количество невыданных релевантных документов;

d – количество невыданных нерелевантных документов.

Существуют следующие показатели эффективности ДИСП:

  1. ^ Коэффициент полноты р, характеризующий долю выданных релевантных документов во всем массиве релевантных документов р = а / (а + с).

  2. Коэффициент точности n, характеризующий долю выданных релевантных документов во всем массиве выданных документов n = a / (a + b).

  3. Коэффициент шума е, характеризующий долю выданных нерелевантных документов во всем массиве выданных документов e = b / (a + b) = 1 – n.

  4. Коэффициента осадка q, характеризующий долю выданных нерелевантных документов во всем массиве нерелевантных документов q = b / (b + d).

  5. ^ Коэффициент специфичности k, характеризующий долю невыданных нерелевантных документов во всем массиве нерелевантных документов k = d / (b + d).

На практике также применяют следующие показатели эффективности ДИСП:

  • быстродействие – интервал между моментом формулировки запроса и получения ответа на него;

  • пропускная способность оценивается количеством вводимых документов и количеством ответов в единицу времени при заданных коэффициентах полноты и точности;

  • производительность оценивается количеством пользователей системы и частотой обращения с их стороны;

  • надежность работы оценивается вероятностью того, что система будет выполнять свои функции при заданных условиях в течении требуемого времени;

  • тип запросов, обслуживаемых системой.


Гипертекстовые системы

Первые информационные системы на основе гипертекстовых (ГТ) моделей появились в середине 60-х, но бурное развитие наступило в 80-е годы после появления первых коммерческих ГТ систем для ПЭВМ.

Гипертекст — форма организации текстового материала, при которой его единицы представлены не в линейной последовательности, а как система явно указанных возможных переходов и связей между ними. Следуя этим связям, можно читать материал в любом порядке, образуя разные линейные тексты. Если речь идет о достаточно обширном материале с большим количеством связей, то возникает гипертекстовая сеть.

Компьютерная технология, ориентированная на работу с гипертекстом, реализуется в специальных гипертекстовых системах. Причем составление гипертекста — это накопление информации в БД, а чтение — обращение к ней через пользовательский интерфейс.

В отличие от обычных БД в ГБД связи носят не только функциональный характер, но и представляют собой самостоятельную специально хранимую информацию. Поэтому в гипертекстовых системах БД не строится в соответствии с какой-либо заранее заданной организационной и изменяемой пользователем сетью, узлы которой соединяются с уже имеющимися в базе узлами. Производится выдача сформированной к данному моменту в базе информации.

Переход по гипертекстовым сетям осуществляется по связям между узлами. Основные функции связей:

  • перейти к новой теме;

  • присоединить комментарий к документу;

  • соединить ссылки на документ с документом, показать на экране графическую информацию (рисунок, чертеж, график и пр.);

  • запустить другую программу и т. д.

Практически все гипертекстовые системы функционируют на основе многооконной технологии (окна экрана соответствуют узлам в БД).

Гипертекстовые системы классифицируют:

  1. библиотечные макросистемы для хранения и актуализации текстов со связями и окнами;

  2. системы исследования проблем, используемые для анализа гипертекстовой сети, выделения в ней некоторых узлов и подструктур по определенным признакам;

  3. системы просмотра БД, обеспечивающие легкость доступа к большим массивам информации и применяемые в обучающих системах;

  4. системы для экспериментирования на различных направлениях применения гипертекста, используемые для исследования возможностей гипертекстовой технологии.

Достоинство гипертекстов заключается в том, что накапливаемая в них информация организуется только по семантическим критериям. В настоящее время не существует стандартизированной технологии разработки ГТ, хотя важна наглядность структуры ГТ.

^ ФАКТОГРАФИЧЕСКИЕ СИСТЕМЫ
Развитие технологии использования ЭВМ для решения прикладных задач и необходимость накапливать и обрабатывать большие наборы данных в вычислительной среде привели к появлению баз данных и необходимости централизованного управления ими. БД – это интегрированное средство, т.е. предназначено для использования всеми пользователями.

Под базой данных (БД) понимается именованная совокупность данных, отображающая состояние объектов и их взаимосвязей. Одно из важнейших качеств БД – это независимость данных.

Система управления базами данных представляет собой совокупность языковых и программных средств, предназначенных для создания, ведения и совместного использования БД многими пользователями. Банк данных (БнД) – система программных, языковых, организационных и технических средств для централизованного накопления и коллективного использования данных. Компонентами БнД являются БД, а также СУБД.

Централизованное управление данными обеспечивает:

  • сокращение избыточности хранимых данных;

  • устранение несовместимости хранимых данных с помощью автоматической корректировки и поддержки всех дублирующих записей;

  • совместное использование хранимых данных, достигаемое необходимой их интеграцией;

  • унификацию представления данных, упрощающую эксплуатацию БД;

  • разграничение доступа к данным;

  • целостность данных, которая достигается с помощью процедур, предотвращающих включение в БД неверных данных и ее восстановление после отказов системы;

  • отсутствие повышенных квалификационных требований к персоналу.

Централизованное управление не может быть реализовано простым объединением файлов в БД. Необходимо ввести центральную функцию, которая сможет обеспечить эффективную структуру данных и их взаимосвязи.

Такую центральную функцию выполняет администратор базы данных (АБД) – лицо или группа лиц, которые несут ответственность за проектирование и общее управление БД.

Проектирование БД представляет собой длительный и трудоемкий процесс. Основными требованиями, которым должна удовлетворять спроектированная БД, являются| обеспечение функциональных требований запросов и высокая производительность СУБД.

Важными аспектами проектирования БД являются обеспечение целостности и согласованности данных: не должно быть случайных потерь или разрушений данных и, кроме того, повторяющиеся данные должны соответствовать одному уровню обновления. К критериям качества БД относится обеспечение секретности и защиты данных от несанкционированного доступа. База данных должна обладать способностью к расширению и возможностью обеспечения изменяющихся требований к данным.

Процесс проектирования обычно складывается из двух этапов создания соответственно логической и физической моделей БД. Проектирование логической модели начинается с исследования требований пользователей и завершается разработкой схемы БД. Физическое моделирование БД заключается в выборе СУБД, который основан на требованиях к обработке данных, и реализации схемы БД на ЭВМ (определение структуры файлов, выбор метода доступа к данным и распределение памяти).

Необходимым средством описания данных является схема БД. Схема определяет логическую структуру информации, хранимой в БД. В иерархических СУБД схема представляет собой дерево, в сетевых – граф, в реляционных – набор отношений. Как правило, схема БД дополняется сведениями о структуре элементов данных. Многоуровневое представление данных основывается на соответствующем описании данных на каждом уровне.

Основным способом управления данными в иерархической и сетевой моделях является переход в БД с помощью программ на процедурных языках. Жесткая связь иерархических и сетевых моделей с путями доступа к данным привела к зависимости прикладных программ от БД и практически исключила возможность непосредственной работы с БД пользователей-непрограммистов. Рост объемов БД, затрат на разработку и модификацию программ, а также необходимость организации взаимодействия с БД поставили проблему разработки подхода, независимого от структур памяти и спецификации конкретных СУБД. В качестве основы такого подхода утвердилась реляционная МД, предложенная Э. Коддом.

Суть реляционного подхода составляют два принципа:

  1. информационное содержание данных рассматривается вне всякой связи со способами их представления в памяти;

  2. БД представляется в виде набора изменяющихся во времени отношений, которые задаются на множестве значений объектов реального мира.

Первый принцип позволяет достичь высокой степени взаимной независимости прикладных программ и БД. Второй принцип позволяет представить БД в виде отношений и применить аппарат современной прикладной алгебры и математической логики.

^

Модели баз данных


Рассмотрим виды моделей данных на примере базы данных выполнения некоторых работ ответственными исполнителями.

Реляционная модель данных. Данная ситуация с конкретными данными описывается в БД, которую представлена в виде трех таблиц: ИСПОЛНИТЕЛЬ, РАБОТЫ и КОЛИЧЕСТВО.


КОЛИЧЕСТВО




РАБОТЫ

ШП (шифр предпр.)

КР (код работы)

КВР (кол-во выполн. работ)




КР

Т (продолж работы)

Q (трудо-емкость)

020

37

50




37

25

300

020

20

50




20

15

200

020

31

65




31

18

250

020

33

65




33

27

180

350

08

60




08

20

210

350

13

100




13

21

320

017

21

70




21

19

330

017

23

70




23

17

200

210

40

100




40

20

180

210

42

100




42

25

220

210

45

100




45

27

300

408

57

95




57

30

320




ИСПОЛНИТЕЛЬ

ШП


НАЗВ (предприятие)

ФИО

(руководитель)

ТЕЛ

(телефон)

020

НИЛ

ПАВЛОВ

711

350

КО

КОЛИН

513

017

ОП

ИВАНОВ

125

210

ДИЛ

ПЕТРОВ

524

408

ОИЛ

МАКИН

619


Эти таблицы рассматриваются как математические отношения. Строки таких таблиц называются записями. Имена столбцов часто называют полями.

В отношении выделяется несколько полей, однозначно идентифицирующих записи и называемых ключами. Так, поля КР и ШП являются соответственно ключами отношений ИСПОЛНИТЕЛЬ, РАБОТЫ, КОЛИЧЕСТВО.

Особенность реляционной МД заключается в том, что в отличие от сетевой и иерархической моделей реальные объекты и взаимосвязи между ними представляются в БД единообразно в виде норм ализованных отношений.

Работать с реляционной МД может не очень опытный пользователь. Также существует ряд преимуществ обработки данных реляционными БД.

  1. Связанность. Реляционное представление дает ясную картину взаимосвязей полей из различных отношений. Логическая схема БД при изображении связей с помощью стрелок выглядит ясной. Использование нормализованных структур данных удовлетворяет всем требованиям к возможности роста и модификации реляционной БД.

  2. Точность. Отношения по своей природе обладают точным смыслом и поддаются математическому описанию.

  3. Гибкость. Операции проекции и объединения позволяют «разрезать» и «склеивать» отношения.

  4. Секретность. Контроль секретности упрощается. Для каждого отношения можно задать правомерность доступа. Засекреченные показатели можно выделить в отдельные отношения с проверкой прав доступа.

  5. Простота внедрения. Физическое размещение однородных (табличных) файлов намного проще, чем размещение иерархических и сетевых структур.

  6. Независимость данных. БД должна допускать возможность расширения, т.е. добавления новых полей и отношений. Здесь независимость данных обеспечить проще, чем в случае иерархических и сетевых структур.

Основным недостатком реляционной модели является более низкая производительность СУБД, которая в условиях применения современных технических средств уже потерял свое значение

^ Иерархическая модель данных. Рассмотрим представление нашей задачи на иерархической модели данных.


ИСПОЛНИТЕЛЬ

ШП

НАЗВ

ФИО

ТЕЛ




020

НИЛ

ПАВЛОВ

711






















РАБОТЫ




37

25

300

50






















КР

Т

Q

КОЛ

20

15

200

50








































31

18

250

65








































33

27

180

65



























































































350

КО

КОЛИН

513










017

ОП

ИВАНОВ

125



















08

20

210

60
















21

19

330

70
















13

21

320

100
















23

17

200

70















































































210

ДИЛ

ПЕТРОВ

524










408

ОИЛ

МАКИН

619



















40

20

180

100
















57

30

320

95
















42

25

220

100




















































45

27

300

100







































1   2   3   4   5   6   7



Скачать файл (725.5 kb.)

Поиск по сайту:  

© gendocs.ru
При копировании укажите ссылку.
обратиться к администрации
Рейтинг@Mail.ru