Logo GenDocs.ru

Поиск по сайту:  

Загрузка...

Введение - файл


скачать (243.5 kb.)


Введение


Современные информационные системы (ИС) отличаются большим объемом хранимой информации. По оценкам экспертов, совокупный объем данных, хранимый в сети Интернет, удваивается каждые два года. Рост объемов информации ИС, расширение их функциональных возможностей привели к широкому распространению крупных информационных систем, ориентированных на различные категории пользователей. Развитие ИС требует создания эффективных методов обработки и представления информации. Совершенствуются методы и средства обработки текстов на естественном языке, системы автоматизированного анализа и поиска информации, на смену статистическим алгоритмам приходят алгоритмы семантического индексирования.

Семантический анализ понимается разными исследователями по-разному. В сферу семантического анализа входит: построение семантической интерпретации слов и конструкций; установление "содержательных" семантических отношений между элементами текста, которые уже принципиально не ограничены размером одного слова (могут быть больше или меньше одного слова). Результирующее представление, в котором решены эти две задачи, является наиболее глубоким и законченным из тех, которые можно достичь только лингвистическими средствами, не прибегая к внешним источникам, и этим объясняется актуальность семантического анализа.

В рамках данной работы в качестве формата, в который осуществляется преобразование программного кода, выбран Resource Description Framework (RDF). RDF - это разработанная консорциумом Всемирной паутины модель для представления данных, входящая в концепцию семантической паутины, а в особенности - метаданных. Метаданные - это информация о данных. Зачастую это структурированные данные, представляющие собой характеристики описываемых сущностей для целей их идентификации, поиска, оценки и управления ими. Важной особенностью формата RDF является то, что он описывает ресурсы в виде, пригодном (и достаточно удобном) для машинной обработки.

Ресурсом в RDF может быть любая сущность - информационная (сайт, программа, изображение) или неинформационная (человек, город, любое абстрактное понятие). Утверждение о ресурсе строится в виде триплетов и имеет вид «субъект - предикат - объект». Множество RDF-утверждений образует ориентированный граф, в котором вершинами являются субъекты и объекты, а предикаты являются ребрами.






Скачать файл (243.5 kb.)

Поиск по сайту:  

© gendocs.ru
При копировании укажите ссылку.
обратиться к администрации