НАО КАРАГАНДИНСКИЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
ИМЕНИ АБЫЛКАСА САГИНОВА
Кафедра ИВС
Лабораторная работа №1
Дисциплина: Обработка естественного языка
Тема: Технологии обработки, автоматизированного реферирования и аннотирования текстов на естественном языке
Принял:
к.т.н., доцент Томилова Н.И.
(оценка)
(фамилия, инициалы)
(подпись) (дата)
Выполнил:
Лигай В.П.
(фамилия, инициалы)
гр. МОиАДМ-21
Караганда 2022
Лабораторная работа №1
«Технологии обработки, автоматизированного реферирования и аннотирования текстов на естественном языке»
Цель работы: изучить методы и средства автоматизированного реферирования и аннотирования текстов на естественном языке, а также получить навыки работы с подобными системами.
Сеть понятий — это множество терминов из текстов - слов и словосочетаний, связанных между собой по смыслу. В сеть включены не все термины из текста, а лишь наиболее значимые, несущие основную смысловую нагрузку. Сеть понятий представлена на рисунке 1.
Рисунок 1 - Сеть понятий
Тематическая структура описывает содержание анализируемых текстов в виде иерархии связанных тем. Все темы выражены в терминах исходных текстов и соответствуют узлам сети понятий. Тематическая структура текста изображена на рисунке 2.
Рисунок 2 - Тематическая структура
Реферирование текста с различными коэффициентами сжатия. Коэффициент сжатия - 90%, размер текста – 12% от исходного, количество предложений – 30. Результат реферирования текста с коэффициентом сжатия - 90% изображен на рисунке 3.
Рисунок 3 - Коэффициент сжатия - 90%
Коэффициент сжатия - 50%, размер текста – 29% от исходного, количество предложений – 73. Результат реферирования текста с коэффициентом сжатия - 50% изображен на рисунке 4.
Рисунок 4 - Коэффициент сжатия - 90%
Запрос для ассоциативного поиска изображены на рисунке 5. Результаты ассоциативного поиска изображены на рисунке 6.
Рисунок 5 - Запрос для ассоциативного поиска
Рисунок 6 - Результаты ассоциативного поиска
Сформированный гипертекстовый документ изображен на рисунке 7.
Рисунок 7 - Сформированный гипертекстовый документ
Работа со словарями изображена на рисунке 8.
Рисунок 8 – Редактирование словаря
Контрольные вопросы
1. Чем отличается реферат от аннотации?
Аннотация – это статья, которая кратко описывает содержание книги, сборника или дипломного проекта. Реферат – это смысловое изложение.
2. Какие требования предъявляются к реферату?
Реферат должен содержать: титульный лист, оглавление, введение, основную часть (разделы, части), выводы (заключительная часть), приложения, пронумерованный список использованной литературы (не менее 5-ти источников) с указанием автора, названия, места издания, издательства, года издания.
3. Перечислите виды рефератов.
продуктивные:
реферат-доклад;
реферат-обзор;
репродуктивные:
реферат-конспект;
реферат-резюме.
4. Перечислите технологии, реализуемые в TextAnalyst 2.0.
Составление сети понятий и тематическую структуры текста, реферирование текста с различными коэффициентами сжатия, смысловой поиск, формирование гипертекстового документа, работа со словарями.
Достарыңызбен бөлісу: |