Технологии обработки, автоматизированного реферирования и аннотирования текстов на естественном языке



Дата27.11.2022
өлшемі0,65 Mb.
#52960
түріЛабораторная работа
Байланысты:
Лабораторная 1


НАО КАРАГАНДИНСКИЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
ИМЕНИ АБЫЛКАСА САГИНОВА
Кафедра ИВС


Лабораторная работа №1


Дисциплина: Обработка естественного языка


Тема: Технологии обработки, автоматизированного реферирования и аннотирования текстов на естественном языке

Принял:


к.т.н., доцент Томилова Н.И.

(оценка)

(фамилия, инициалы)


(подпись) (дата)

Выполнил:


Лигай В.П.

(фамилия, инициалы)


гр. МОиАДМ-21

Караганда 2022


Лабораторная работа №1
«Технологии обработки, автоматизированного реферирования и аннотирования текстов на естественном языке»

Цель работы: изучить методы и средства автоматизированного реферирования и аннотирования текстов на естественном языке, а также получить навыки работы с подобными системами.


Сеть понятий — это множество терминов из текстов - слов и словосочетаний, связанных между собой по смыслу. В сеть включены не все термины из текста, а лишь наиболее значимые, несущие основную смысловую нагрузку. Сеть понятий представлена на рисунке 1.



Рисунок 1 - Сеть понятий

Тематическая структура описывает содержание анализируемых текстов в виде иерархии связанных тем. Все темы выражены в терминах исходных текстов и соответствуют узлам сети понятий. Тематическая структура текста изображена на рисунке 2.



Рисунок 2 - Тематическая структура

Реферирование текста с различными коэффициентами сжатия. Коэффициент сжатия - 90%, размер текста – 12% от исходного, количество предложений – 30. Результат реферирования текста с коэффициентом сжатия - 90% изображен на рисунке 3.





Рисунок 3 - Коэффициент сжатия - 90%


Коэффициент сжатия - 50%, размер текста – 29% от исходного, количество предложений – 73. Результат реферирования текста с коэффициентом сжатия - 50% изображен на рисунке 4.





Рисунок 4 - Коэффициент сжатия - 90%


Запрос для ассоциативного поиска изображены на рисунке 5. Результаты ассоциативного поиска изображены на рисунке 6.





Рисунок 5 - Запрос для ассоциативного поиска



Рисунок 6 - Результаты ассоциативного поиска

Сформированный гипертекстовый документ изображен на рисунке 7.





Рисунок 7 - Сформированный гипертекстовый документ

Работа со словарями изображена на рисунке 8.





Рисунок 8 – Редактирование словаря


Контрольные вопросы


1. Чем отличается реферат от аннотации?
Аннотация – это статья, которая кратко описывает содержание книги, сборника или дипломного проекта. Реферат – это смысловое изложение.


2. Какие требования предъявляются к реферату?
Реферат должен содержать: титульный лист, оглавление, введение, основную часть (разделы, части), выводы (заключительная часть), приложения, пронумерованный список использованной литературы (не менее 5-ти источников) с указанием автора, названия, места издания, издательства, года издания.


3. Перечислите виды рефератов.

  1. продуктивные:

    1. реферат-доклад;

    2. реферат-обзор;

  2. репродуктивные:

    1. реферат-конспект;

    2. реферат-резюме.


4. Перечислите технологии, реализуемые в TextAnalyst 2.0.
Составление сети понятий и тематическую структуры текста, реферирование текста с различными коэффициентами сжатия, смысловой поиск, формирование гипертекстового документа, работа со словарями.

Достарыңызбен бөлісу:




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет