Logo GenDocs.ru

Поиск по сайту:  

Загрузка...

Анализ текста Словаря русского языка XI-XVII вв - файл 1.doc


Анализ текста Словаря русского языка XI-XVII вв
скачать (48.5 kb.)

Доступные файлы (1):

1.doc49kb.16.11.2011 04:53скачать


1.doc

Курсовая работа


по дисциплине


“Интеграция программного обеспечения АСОИУ”


для студентов групп ИУ5 – 91, 92, 93, 94.


(1999–2000 уч. год)


Вариант 6. — Анализ текста Словаря русского языка XI–XVII вв.


Цель курсовой работы — приобретение навыков разрешения проблем интеграции программного и информационного обеспечения АСОИУ.


Задачи курсовой работы:

изучение материалов лекционных и практических занятий по данной дисциплине (разделы лекционного курса — теория частот слов, формальные языки информационных технологий, структура и состав словарной компоненты баз лингвистических знаний, тезаурус, лингвистические процессоры; практические занятия — исследование частотных характеристик фрагмента естественно-языкового (ЕЯ) описания предметной области (ПО), исследование словаря определений, индексирование фрагмента текста, построение графа дефиниций; специальное информационное программное обеспечение — программные изделия DIALEX, LemmaLex, Interlex, текстовый файл одного тома Словаря русского языка XI–XVII вв.; основная и дополнительная литература — см. список);

приобретение навыков анализа и изучение методов и приемов исследования ЕЯ описания ПО в процессе выполнения заданий курсовой работы;

приобретение знаний и навыков интеграции программного обеспечения АСОИУ (текстовых процессоров, СУБД, электронных таблиц, специального программного обеспечения и других программных средств) для проведения анализа и исследования ЕЯ описания ПО;

приобретение знаний и навыков по оформлению результатов анализа и исследования ПО при оформлении курсовой работы.


Задания курсовой работы


Подготовить текст тома Словаря к анализу.


Составить указатели заголовочных слов, слов и имен цитатного материала Словаря.


Составить конкорданс цитатного материала.


Провести частотный анализ цитатного материала.


Разработать технологический процесс анализа материала Словаря.


Исследовать эффективность технологического процесса.


Разработать технологическую документацию.


Порядок выполнения курсовой работы


Получить у преподавателя вариант курсовой работы (скопировать на дискету текстовые и программные файлы).


Последовательно выполнить задания 1–6 курсовой работы.


Оформить результаты курсовой работы.


Апробировать результаты курсовой работы у преподавателя.


Пояснения, рекомендации и требования к выполнению курсовой работы


После получения (согласования) варианта курсовой работы рекомендуется внимательно прочитать и изучить текстовые материалы, представляющие ЕЯ описание ПО. Хорошее знание текстовых материалов в дальнейшем позволит качественно выполнять задания курсовой работы.


Рекомендуется выполнять задания курсовой работы в указанной последовательности.


Задание 1


При подготовке текста Словаря к анализу рекомендуется выполнить следующие работы:

установить одну колонку и новые значения: формата страницы, полей и отступов, параметры абзацев;

удалить графические элементы;


удалить колонтитулы (без удаления номеров страниц);


заменить разметку страниц в соответствии с требованиями систем: DIALEX, LemmaLex, Interlex (при этом значения номеров страниц печатного издания должны быть сохранены);

установить шрифт введенного текста — Times New Roman Cyr;

выделить в отдельный абзац каждую словарную статью;

сформировать текст цитатного материала Словаря;

заменить символ * (“звездочка”) в словах исходного текста, содержащих надстрочный символ % (титло), на символ $.


Задание 2


В указатель заголовочных слов должны быть включены все заголовочные слова и номер страницы словаря, где они приведены. Указатель заголовочных слов должен иметь следующую структуру записей:


<ЗГЛ.СЛОВО><Tab><Стр.>


<ЗГЛ.СЛОВО><Tab><Стр.>


...


<ЗГЛ.СЛОВО><Tab><Стр.>


Здесь: ЗГЛ.СЛОВО — заголовочное слово; Tab — символ табуляции; Стр. — номер страницы.


В именной указатель включаются все имена собственные, встретившиеся в цитатном материале словарных статей. Указатель должен содержать сведения о заголовочных словах и номерах страниц, где они приведены, и иметь следующую структуру записей:


<ИМЯ СОБСТВЕННОЕ> <Tab> <ЗГЛ.СЛОВО> <Стр.>; <ЗГЛ.СЛОВО> <Стр.>; ... <ЗГЛ.СЛОВО> <Стр.>


Здесь: ИМЯ СОБСТВЕННОЕ — имя собственное, встретившиеся в цитатном материале словаря.


В указатель слов включаются все слова, кроме имен собственных, встретившиеся в цитатном материале словарных статей. Указатель должен содержать сведения о заголовочных словах и номерах страниц, где они приведены, и иметь следующую структуру записей:


<СЛОВО> <Tab> <ЗГЛ.СЛОВО> <Стр.>; <ЗГЛ.СЛОВО> <Стр.>; ... <ЗГЛ.СЛОВО> <Стр.>


Здесь: СЛОВО — слово, встретившиеся в цитатном материале словаря.


Задание 3


Конкорданс цитатного материала должен быть составлен для всех слов кроме заголовочных и состоять из двух частей: конкорданса слов и конкорданса имен собственных. Конкордансы имеют следующую структуру записи:


<СЛОВО / ИМЯ СОБСТВЕННОЕ>


<Tab><ЗГЛ.СЛОВО><Tab><Стр.><Tab><ЦИТАТА>


Здесь: ЦИТАТА — цитата словаря.


Задание 4


При проведении частотного анализа цитатного материала Словаря необходимо выполнить следующие работы:

построить частотный словник;

построить графики ступенчатой функции распределения частот;


вычислить основные частотные характеристики и представить их в таблице;


построить график распределения частот слов.


Задание 5


При разработке технологического процесса анализа Словаря выделяются и описываются этапы, процедуры и отдельные операции. Технологический процесс должен быть представлен в виде схемы.


Задание 6


Исследование эффективности технологического процесса состоит в определении основных характеристик — ресурсных затрат и ограничений на выполнение этапов, процедур и отдельных операций. Данное исследование может проводиться в процессе реализации предыдущих заданий.


Задание 7


Технологическая документация представляет собой:

схему технологического процесса анализа;

описание технологического процесса (этапы, процедуры и операции);


инструкции по выполнению процедур и операций.


Оформление курсовой работы


Результаты выполнения курсовой работы должны быть оформлены в виде технической документации, состоящей из расчетно-пояснительной записки и приложения.


Расчетно-пояснительная записка оформляется в соответствии с требованиями, предъявляемыми к оформлению отчетов по НИР, с выполнением требований соответствующих ГОСТ.


Объем расчетно-пояснительной записки не регламентируется. Работа сдается в напечатанном виде и в виде файла форматов *.doc на дискете. Текстовая часть должна содержать ссылки на используемую литературу с указанием страниц издания. Список используемой литературы приводится в соответствии с требованиями ГОСТ. Текст оформленной курсовой работы не должен содержать орфографических ошибок, сносок, буквиц и быть отформатирован с параметрами: отступы — нулевые, красная строка — 1 см, межстрочный интервал — одинарный, выравнивание — по ширине. Текст должен содержать переносы, а все страницы текста — верхний колонтитул с фамилией и шифром группы исполнителя работы, а также нумерацию страниц с размещением над колонтитулом по центру. Размер основного шрифта — 12.


В отчете рекомендуется иметь: Введение. Шесть разделов, заголовки которых должны соответствовать формулировкам первых шести заданий курсовой работы. Заключение. Литература.


Во Введении перечисляются цели и задачи курсовой работы, дается краткое описание анализируемого материала.


В шести разделах, посвященным выполненным заданиям курсовой работы, приводятся: результаты частотного анализа, схема разработанного технологического процесса, его описание, исследование эффективности технологического процесса.


В Заключении приводятся выводы по результатам исследований, выполненных в курсовой работе.


В разделе Литература указываются использованные источники.


Титульный лист курсовой работы должен иметь следующий вид:


в верхней части листа


Московский государственный технический университет им.Н.Э.Баумана


Кафедра “Автоматизированные системы обработки информации и управления”


в середине листа


Анализ текста


Словаря русского языка XI–XVII вв.


ТТ том.


Папка: DBSL_TT


Расчетно-пояснительная записка


курсовой работы по дисциплине


“Интеграция ПО АСОИУ”


студента группы ИУ5–GG


И.О.Фамилия


Шифр: GG_NN


в нижней части листа


Преподаватель к.т.н., доц. Ю.Н.Филиппович


в последней нижней строке


Москва, 1999 г.


Приложение должно содержать распечатку индексов Словаря.


Апробация курсовой работы


Для апробации курсовой работы у преподавателя необходимо сдать для анализа и оценки: техническую документацию курсовой работы (расчетно-пояснительную записку и приложение), рабочие материалы курсовой работы (исходные, промежуточные и результирующие файлы данных), выданный текстовый материал (книга).


Расчетно-пояснительная записка сдается в стандартном полиэтиленовом файле, приложение — в “папке с завязками”.


Рабочие материалы курсовой работы сдаются на подписанных дискетах. Все файлы собираются в папку с именем GG_NN. В папке должен быть файл с именем Readme.txt, с описанием всех файлов рабочих материалов курсовой работы. Файл расчетно-пояснительной записки должен иметь имя, соответствующее шифру курсовой работы GG_NN.doc (GG — номер группы 91, 92, 93 или 94; NN — номер студента в списке группы), папка с рабочими и результирующими файлами (текстами, индексами и конкордансом) должна иметь имя IDSL_TT (TT — номер тома Словаря русского языка XI–XVII вв.).


Допускается использовать только ARJ-архиватор.


Оценка курсовой работы осуществляется по следующим правилам:


“удовлетворительно” — при условии полного и качественного выполнения пунктов 1–2;


“хорошо” — при условии полного и качественного выполнения пунктов 1–3;


“отлично” — при условии полного и качественного выполнения всех пунктов задания.


Пункт 7 задания выполняется в объеме сделанной работы.


В случае сдачи работы после ее срока оценка снижается на один балл, но не ниже “удовлетворительно”.


Срок сдачи курсовой работы — 16 неделя семестра.


Скачать файл (48.5 kb.)

Поиск по сайту:  

© gendocs.ru
При копировании укажите ссылку.
обратиться к администрации