Logo GenDocs.ru


Поиск по сайту:  


Полевой Н.С. Правовая информатика и кибернетика - файл B2472Part112-275.html


Полевой Н.С. Правовая информатика и кибернетика
скачать (529.8 kb.)

Доступные файлы (25):

B2472Part112-275.html25kb.24.03.2005 14:51скачать
B2472Part12-38.html4kb.24.03.2005 14:47скачать
B2472Part133-323.html9kb.24.03.2005 14:51скачать
B2472Part139-342.html9kb.24.03.2005 14:51скачать
B2472Part1-3.html11kb.24.03.2005 14:46скачать
B2472Part140-345.html28kb.24.03.2005 14:52скачать
B2472Part142-353.html13kb.24.03.2005 14:52скачать
B2472Part143-361.html10kb.24.03.2005 14:52скачать
B2472Part189-506.html27kb.24.03.2005 14:54скачать
B2472Part2-7.html11kb.24.03.2005 14:46скачать
B2472Part30-80.html8kb.24.03.2005 14:47скачать
B2472Part34-84.html8kb.24.03.2005 14:48скачать
B2472Part43-98.html4kb.24.03.2005 14:48скачать
B2472Part45-101.html3kb.24.03.2005 14:48скачать
B2472Part47-104.html6kb.24.03.2005 14:48скачать
B2472Part54-116.html8kb.24.03.2005 14:48скачать
B2472Part56-124.html17kb.24.03.2005 14:48скачать
B2472Part66-151.html6kb.24.03.2005 14:48скачать
B2472Part67-152.html3kb.24.03.2005 14:48скачать
B2472Part69-155.html18kb.24.03.2005 14:49скачать
B2472Part79-185.html14kb.24.03.2005 14:49скачать
B2472Part8-29.html11kb.24.03.2005 14:47скачать
B2472Part86-203.html22kb.24.03.2005 14:49скачать
B2472Part91-221.html12kb.24.03.2005 14:49скачать
B2472Part92-226.html9kb.24.03.2005 14:49скачать


B2472Part112-275.html

Реклама MarketGid:
275 :: 276 :: 277 :: 278 :: 279 :: 280 :: 281 :: 282 :: 283 :: Содержание

XIV.2. Проблемы совершенствования
организации документального массива АИПС
и поиска информации


АИПС "Законодательство" действует в режиме эксплуатации уже несколько лет, осуществляя функции информационно-правового обслуживания своих абонентов.

Вместе с тем состояние работоспособности АИПС "Законодательство" не обеспечивает ту степень эффективности результатов информационного поиска, которую возлагали на систему ее создатели.

Какие проблемы, на наш взгляд, препятствуют решению этой важной задачи?

Специалист, индексируя то или иное предписание нормативного акта, сталкивается с рядом существенных объективных трудностей. В процессе смыслового анализа текста правового акта из него отбираются информативные термины (ключевые слова) и вносятся в поисковый образ документа в той форме записи, в которой они значатся в тезауру се.

275

Однако тезаурус АИПС "Законодательство" в существую^ щем виде не может однозначно реализовывать эту функцию.

Например, в документе содержится предписание о "договорах подряда на капитальное строительство". В тезаурусе в качестве самостоятельных дескрипторов находятся одновременно несколько понятий: "договор подряда на капитальное строительство", "договор подряда", "договор", "подряд на капитальное строительство". В данном случае специалист, индексируя документ, сталкивается с возможностью отразить рассматриваемое понятие в самых различных вариантах форм его записи.

Учитывая, что тексты нормативных актов насыщены подобного рода многословными юридическими понятиями, остается констатировать хронический характер сложных условий, в которые попадает специалист, осуществляя смысловую обработку документов. Объективные трудности использования при индексировании существующего тезауруса определяют в свою очередь субъективный подход каждого специалиста в интерпретации сложных правовых категорий и как следствие разные формы отражения отдельными лицами в поисковых образах документов одних и тех же юридических понятий. Кроме того, в текстах документов часто встречаются словосочетания или термины, которые вовсе не содержатся в тезаурусе. Поэтому специалист вынужден во многих ситуациях описывать то или иное понятие синонимичной или близкой к нему по смыслу терминологией, которая имеется в тезаурусе.

Например, в документе говорится "о внедрении в промышленный цикл малоотходных и безотходных технологических производств". В тезаурусе отсутствуют такие дескрипторы, как: "промышленный цикл", "малоотходное технологическое производство", "малоотходное производство", "безотходное производство". Следовательно, специалист, составляя поисковый образ документа, заменяет эти словосочетания близкими им по смыслу терминами, которые содержатся в тезаурусе в качестве его отдельных дескрипторов. При этом каждый специалист проделывает соответствующую процедуру на основе субъективного толкования ее эффективности. Так, один напишет "промышленность", "малоотходный технологический процесс", "безотходный технологический процесс", "производство"; другой - "промышленное производство", "малоотходная технология", "безотходная технология", "производство"; третий - "промышленность", "безотходная технология", "малоотходная технология", "производственный процесс".

276

На стадии смысловой обработки тематического запроса абонента специалисты попадают в еще более объективно сложные условия.

Индексирование запроса должно проводиться, как уже отмечалось, по тем же правилам, что и правового документа, т. е. в строгом соответствии с тезаурусом. Поэтому на практике с целью обеспечения качественных результатов информационного поиска специалист вынужден составлять поисковое предписание запроса не строго по технологии, а выходя за ее пределы. Формализуя запрос, специалист стремится промоделировать все возможные, на его взгляд, варианты записи тех или иных понятий, пытается предугадать все возможные случаи написания их на этапе индексирования нормативных актов.

Например, необходимо заиндексировать запрос об уже упоминавшейся нами категории "договор подряда на капитальное строительство". Специалист в соответствии с существующей технологией имеет формальное право составить поисковое предписание запроса в таком виде: "договор подряда на капитальное строительство", ибо это понятие имеется в тезаурусе в качестве самостоятельного дескриптора. Однако на практике специалист стремится отразить в поисковом предписании все возможные варианты записи этой правовой категории на основе терминов, которые также содержатся в тезаурусе в качестве отдельных дескрипторов (см. схему 6)

Схема 6
Текст запроса абонента Поисковое предписание запроса
Какие акты регулируют договор под-
ряда на капитальное строительство?
Договор подряда на капитальное строительство + договор подряда &капитальное строительство + договор &подряд на капитальное строительство
 
Такой метод обработки запроса: а) весьма трудоемок; б) длителен по времени; в) часто не в состоянии обеспечить' надлежащую полноту и точность информационного поиска: анализируя в запросе сложное правовое понятие (а нередко их ряд), далеко не всегда удается сконструировать его формализованную модель, предусмотрев не только все возможные варианты записи соответствующего понятия (понятий), но и возможные их сочетания.

277

Автоматизированный поиск в рамках АИПС "Законодательство" проводится не по всему разделу поисковых образов документов, введенных в информационную базу, а с помощью машинного блока тезауруса. В нем за каждым дескриптором закреплена цепочка адресов структурных единиц (пунктов, статей и т. п. конкретных нормативных актов), в которых содержится соответствующий термин или словосочетание. Термины, составляющие поисковое предписание запроса, в процессе информационного поиска находят одноименные дескрипторы в автоматическом тезаурусе, и в результате абоненту выдаются адреса необходимых ему документов. Такая технология обеспечивает достаточную быстроту автоматизированного поиска информации. Однако тезаурус АИПС "Законодательство", на наш взгляд, эффективно выполняет лишь эту, можно сказать, техническую роль. Свои же функции как правового инструментария тезаурус осуществляет не в достаточной степени. Он состоит из лексики в форме информационно-поискового языка, которая имеет внутри себя только парадигматические связи. Иными словами, тезаурус АИПС "Законодательство" построен без учета, что основу системы составляет правовая информация, имеющая комплексный и специфический характер.

Например, в тезаурусе имеются отдельные, независимые друг от друга дескрипторы "источник финансирования" и "капитальные вложения" со своими словарными статьями соответственно: 1) нецентрализованный источник финансирования; централизованный источник финансирования; местный источник финансирования и т. д.; 2) внелимитные капиталовложения; лимитные капиталовложения, дополнительные капиталовложения и т. д.

Эти дескрипторы отражают определенные правовые понятия и должны находиться в тезаурусе, который обеспечит полную выдачу необходимых абоненту документов на запросы отдельно по "источникам финансирования" или "капитальным вложениям".

Однако, как правило, абонент запрашивает более конкретную информацию. Например, его интересуют акты по вопросу "источников финансирования капитальных вложений". Тезаурус же не содержит в качестве самостоятельного дескриптора эту важную юридическую категорию, которая имеет свои внутренние многогранные правовые связи. К источникам финансирования капитальных вложений относятся, в частности: 1) и бюджетные ассигнования; 2) и экономия от снижения стоимости строительно-монтажных работ; 3) и собственные средства отраслей экономики; 4) и долгосрочный

278

кредит объединений и предприятий в банковских органах, и т. д. В условиях технологии эксплуатации АИПС "Законодательство" при индексировании документа и в свою очередь запроса на тему "Источники финансирования капитальных вложений" специалисты вынуждены делить это целостное юридическое понятие на его составные самостоятельные дескрипторы "источник финансирования" и "капитальные вложения", автоматизированный поиск по которым не в состоянии полно обеспечить информационно-правовые потребности абонента.

Выше говорилось о латентных (скрытых) терминах (понятиях), которые непосредственно в тексте нормативного акта не находятся, но имеют прямое отношение к раскрытию его тематического содержания. Например, в тексте говорится о долгосрочном кредите, получаемом объединениями (предприятиями) в банковских органах. В финансовом праве этот вид правовых отношений характеризуется понятием "источник финансирования капитальных вложений", в то время как в тексте документа именно этого словосочетания нет. Поэтому специалист в процессе индексирования нормативного акта должен помимо ключевых слов из текста вносить в поисковый образ и латентные понятия (см. схему 7).

Схема 7
Текст документа Поисковый образ документа
Объединения и предприятия получают долгосрочный кредит в банках Объединение#предприятие#долгосрочный кредит#банк#источник финансирования# капитальные вложения
 
На практике, с учетом разнообразия латентной информации и субъективных возможностей специалистов, эта процедура далеко не всегда проделывается полно и квалифицированно, что в свою очередь влияет на результаты информационного поиска.

В процессе выявления латентных терминов и внутренних смысловых связей юридических понятий для обеспечения высоких результатов информационного поиска важная роль должна отводиться тезаурусу. Однако тезаурус АИПС "Законодательство" не обеспечивает эффективную реализацию своих правовых функций.

В связи с этим представляется целесообразным сформулировать ряд положений, которые являются одним из возможных

279

направлений на пути радикальной технологической перестройки АИПС "Законодательство".

1. Отказаться от индексирования нормативных актов и осуществлять ввод в информационную базу всего текста документа в том виде, в каком его сформулировал законодатель (без перевода терминов в единственное число именительного падежа). По такому пути идут многие зарубежные страны при создании и эксплуатации АИПС, где формирование информационной базы осуществляется методом введения в ЭВМ так называемого полного текста.

2. В условиях этой технологии проводить поиск по корням (или важным частям)1 наиболее информативных слов, составляющих запрос абонента. Применение такого метода информационного поиска устранит проблему буквенного несовпадения, которое имеет место при индексировании в результате различного и разновариантного написания одних и тех же понятий (когда тезаурус допускает множество различных форм их записи). Объясняется это тем, что при поиске информации по корням слов не играет роли, как сформулированы и связаны между собой по смыслу термины (представляют ли они самостоятельные слова или являются составной частью отдельного словосочетания).

В данном случае корень любого выделенного слова из запроса будет представлять самостоятельный поисковый элемент, в то время как при индексировании поисковым элементом выступает дескриптор тезауруса.

3. Информационный поиск в рамках АИПС "Законодательство" по корням слов осуществлять на основе тезауруса с использованием его технических возможностей. К примеру, посмотрим все дескрипторы тезауруса АИПС "Законодательство" по усечению терминов на "малоотход" и "безотход":

а) малоотходная технология,

б) малоотходный технологический процесс,

в) безотходный технологический процесс,

г) безотходная технология,

д) безотходная технология производства.

Выделим далее корни слов, составляющих каждый заглавный дескриптор. В машинном блоке тезауруса закрепим за каждым корнем слова, а также за их суммой цепочку адресов

280

документов, в тексте которых встречается соответствующий корень или их совокупность.


Какие преимущества дает эта методология построения информационного поиска? Вернемся к примеру с "внедрением в промышленный цикл малоотходных и безотходных технологических производств".

Составляя поисковое предписание на этот запрос в условиях действующей технологии АИПС "Законодательство", необходимо промоделировать все возможные варианты написания ключевых слов в форме дескрипторов тезауруса (см. схему 8).

Схема 8
Текст запроса абонента Поисковое предписание запроса
Какие акты регулируют вопросы внедрения в промышленный цикл малоотходных и безотходных производств? / Промышленность + промышленное производство/ &/малоотходнал технология + малоотходный технологический процесс + безотходная технология + безотходная технология производства/
 
При этом, чтобы составить поисковое предписание запроса из схемы 8, необходимо тщательно поработать с тезаурусом.

Поисковое предписание на тот же самый запрос на основе предлагаемой технологии информационного поиска составляется куда более просто (см. схему 9).

Схема 9
Текст запроса абонента Поисковое предписание запроса
Какие акты регулируют вопросы внедрения в промышленный цикл малоотходных и безотходных производств? Промышл &/безотход + малоотход/ 
 
281

Кроме того, составление поискового предписания запроса из схемы 9 не требует работы с тезаурусом. При этой технологии можно организовать информационный поиск, задав соответствующий алгоритм поиска документов по корням слов, входящих в словарную статью заглавного дескриптора. Но чтобы избежать информационного "шума"1, целесообразно внутри словарной статьи дескриптора машинного блока тезауруса закрепить цепочки адресов документов не за каждым корнем информативного слова, а за их суммой. Пример.


4. Включить в тезаурус наряду с простыми понятиями (в словарных статьях которых достаточно и парадигматических связей) и сложные юридические категории, координирующие в своей словарной статье с целостными "родственными" правовыми понятиями на основе их внутреннего взаимодействия. В этом случае тезаурус решал бы и проблему автоматического выявления латентной информации в процессе поиска юридических документов.

Вернемся к понятию "источники финансирования капитальных вложений" и, представив его самостоятельным заглавным дескриптором, попытаемся сформировать его словарную статью на принципах создания правового тезауруса, закрепив цепочку адресов документов в машинном блоке тезауруса за корнями слов по тому же методу:

а) за корнем каждого слова и суммой их корней в заглавном

282

дескрипторе; б) и только за суммой всех корней информативных слов на каждом уровне словарной статьи.

Источники финансирования капитальных алозсений (заглавный дескриптор)
  1. Средства государственного бюджета
  2. Бюджетные ассигнования
  3. Собственные средства предприятий
  4. Собственные средства объединений
  5. Собственные средства отраслей народного хозяйства
  6. Амортизационные отчисления на полное восстановление основных фондов
  7. Средства фонда развития производства
  8. Средства фонда социально-культурных мероприятий
  9. Средства фонда жилищного строительства
  10. Прибыль
  11. Средства от реализации выбывших из эксплуатациии излишних основных фондов
  12. Экономия от снижения стоимости строительно-монтажных работ
  13. Доходы от попутной добычи полезных ископаемых
  14. Средства, полученные в порядке перераспределения части прибыли и амортизации подведомственных предприятий
  15. Долгосрочный кредит объединений и предприятий в банковских органах.

Вернемся к запросу по "источникам финансирования капитальных вложений". Если в тексте нормативного акта, который находится в "памяти" ЭВМ, содержится любое (или несколько их) понятие из словарной статьи (см. выше), а само словосочетание "источники финансирования капитальных вложений" непосредственно в тексте отсутствует, то при информационном поиске с помощью правового тезауруса этот документ будет найден.

В данном случае поисковое предписание составляется: "Источ&финанс&капитал&влож)с заданием при нем алгоритма поиска по всей словарной статье.

В заключение следует сказать, что проблема совершенствования документальной базы АИПС и поиска информации весьма многогранна и требует новых теоретических исследований на пути ее эффективного разрешения.

283

1 В ряде случаев нужно выделять не только корень слова, но и важную его часть, которая определяет основное содержание этого термина. Например, в слове "безотходная" целесообразно выделить не корень этого слова "отход", а его часть "безотход", поскольку именно она определяет основное содержание термина. В дальнейшем любая часть слова, выделенная для информационного поиска, называется условно "корень".
1 Информационный шум - выдача документов, не релевантных запросу.

275 :: 276 :: 277 :: 278 :: 279 :: 280 :: 281 :: 282 :: 283 :: Содержание

Реклама:





Скачать файл (529.8 kb.)

Поиск по сайту:  

© gendocs.ru
При копировании укажите ссылку.
обратиться к администрации
Рейтинг@Mail.ru