Концепция семантического портала научных знаний вуза
Одним из основных направлений развития веб-порталов является переход от методов работы с
синтаксисом к методам работы с семантикой [15]. Методы работы с семантикой и их программная
реализация относятся к семантическим технологиям. Использование семантических технологий
рассматривается в качестве средства повышения качества, адаптируемости и функциональности
создаваемых порталов.
Порталы, которые используют для реализации своих функций семантические технологии,
получили название семантических порталов. Основной идеей функционирования разрабатываемого
портала является оперативная интеллектуальная обработка запросов и адаптируемость к
потребностям пользователя. Поэтому возникает необходимость в автоматизации трудоёмких
операций по поиску и анализу данных в процессе формирования и ведения базы научных знаний
вуза. Семантические технологии используются в создаваемых порталах для реализации различных
функций, таких как, организация навигации и взаимодействия пользователей.
Основными компонентами разрабатываемого семантического портала научных знаний вуза
являются: онтология научных знаний, редактор онтологии, модуль классификации и индексирования
информационных ресурсов, модуль навигации и поиска по контенту портала, база данных
онтологической информации. Связь компонентов семантического портала иллюстрирует рисунок 3.
● Технические науки
№5 2014 Вестник КазНТУ
42
Для обеспечения систематизации научных знаний и информационных ресурсов семантический
портал вуза поддерживает следующие функции:
- обеспечение навигации по онтологии научных знаний вуза;
- организация поисковых запросов по понятиям и отношениям онтологии;
- классификация информационных ресурсов с целью определения развития научных школ и
направлений вуза.
Компоненты архитектуры портала обеспечивают пользователю прозрачный семантический
доступ к необходимым данным. Запросы пользователей обрабатываются серверным приложением,
которые связаны семантическими компонентами. Удалённые клиенты работают с порталом во всех
современных браузерах с помощью протокола HTTP. Запросы отправляются на сервер веб-
приложений.
Рис. 3. Компоненты семантического портала научных знаний вуза
В исполняемой среде JavaVM (VirtualMachine) запускается поток обработки запроса. В случае
получения данных с помощью SPARQL или абстрактной модели доступа к данным Jena API,
осуществляется обращение к хранилищу Jena TDB (хранилище RDF-троек), выполняются операции
редактирования (вставки, удаления, обновления), формируется ответ пользователю.
ЗАКЛЮЧЕНИЕ
В данной работе предлагается разработанный технологический подход управления научными знаниями
вуза. В качестве информационной модели СУЗН используется онтология научной деятельности вуза. Описана
процедура обработки информационных ресурсов вуза. Тематическая классификация документов на основе
разработанной процедуры обработки информационных ресурсов позволила построить профили научных
сотрудников и реализовать персонализированную поисковую систему семантического портала вуза. Описана
концепция семантического портала научных знаний вуза. Программная реализации семантического портала
реализует возможность поиска любого объекта онтологии по следующим классам: исследователи, научные
направления вуза, события, ключевые термины, организации, отделы, кафедры, публикации вуза.
Функционирование семантического портала научной деятельности вуза в режиме пилотного проекта позволило
сформировать фрагмент базы научных знаний вуза.
Работа выполнялась в рамках гранта №0213РК00305 «Разработка онтологической базы знаний е-
университета».
ЛИТЕРАТУРА
1. Т.А. Гаврилова. Инженерия знаний //Инновационное развитие: экономика, интеллектуальные
ресурсы, управление знаниями / под ред. Б.З. Мильнера. - М. : ИНФРА-М, 2009. – С. 214-216.
2. А.Ф. Тузовский. Разработка систем управления знаниями на основе единой онтологической базы
знаний. //Известия Томского политехнического университета. – 2007. – Т. 310. – № 2. – C. 182-185.
3. А.Ф. Тузовский, С.В. Чириков, В.З. Ямпольский. Системы управления знаниями (методы и
технологии) – Томск: Изд-во НТЛ, 2005. – 260 с.
4. S. Staab, H-P.Schunurr, R. Studer, Y.Sure. Knowledge processes and ontologies //IEEE Intelligent Systems,
Special Issue on Knowledge Management, 2001. 16(1), P. 26-34.
5. Л.А. Трофимова Управление знаниями : учебное пособие / Л.А. Трофимова, В.В. Трофимов. – СПб. :
Изд-во СПбГУЭФ, 2012. – 77 с
6. Д.В. Кудрявцев. Системы управления знаниями и применение онтологий: учеб. пособие / Д.В.
Кудрявцев. – СПб.: Изд-во Политехн. ун-та, 2010. – 344 с.
● Техникалыќ єылымдар
ЌазЎТУ хабаршысы №5 2014
43
7. Ю.А. Загорулько Информационная модель портала научных знаний. //Информационные технологии. -
2009. - № 12. -С.2-7
8. Alias LingPipe. In: http://alias-i.com/lingpipe/, дата обращения - 23/03/2014.
9. Ch.D. Manning, P. Raghavan, H. Schütze (2009). Introduction to Information Retrieval. Cambridge
University Press. p. 544.
10. Е.И. Большакова, Э.С. Клышинский, Д.В. Ландэ, А.А. Носков, О.В. Пескова, Е.В. Ягунова.
Автоматическая обработка текстов на естественном языке и компьютерная лингвистика – М.: МИЭМ, 2011. —
272 с. ISBN 978–5–94506–294–8.
11. M. Du, X.Chen. Accelerated k-nearest neighbors algorithm based on principal component analysis for text
categorization. In journal of Zhejiang University-Science C-Computers & Electronics, volume: 14, issue: 6, pp. 407-
416, 2013.
12. Журнал “Физики твердого тела”, url:http://journals.ioffe.ru/ftt/ (дата обращения - март 2014).
13. Д.С. Новикова. Автоматическое выделение терминов из текстов предметных областей и установление
связей между ними. //Информационно-телекоммуникационные технологии и математическое моделирование
высокотехнологич-ных систем 2012. РУДН; Россия, url:http://conf.sci.pfu.edu.ru/index.php/ittmm/2012/paper/view/245
(дата обращения - апрель 2014).
14. К.В. Крюков, О.П. Кузнецов, В.С. Суховеров. О понятии формальной компетентности научных
сотрудников. Материалы III международной научно-технической конференции – OSTIS-2013, Минск, -C. 143-
146, 2013.
15. Shengyi Jiang, Guansong Pang, Meiling Wu, Limin Kuang.. An improved K-nearest-neighbor algorithm for
text categorization. In Proceedings of the Expert Systems with Applications 39, pages: 1503–1509, 2012.
REFERENCES
1. T.A. Gavrilova. Inzheneriya znaniy //Innovatsionnoe razvitie: ekonomika, intellektualnye resursy, upravlenie
znaniyami. /pod red. B.Z. Milnera1. INFRA-M, 2009. - s. 214-216.
2. A.F. Tuzovskii. Razrabotka sistem upravleniya znaniyami na osnove edinoy ontologicheskoy bazy znany.
//Izvestiya Tomsk politehnicheskogo universiteta.. – 2007. – Т. 310. – № 2. – C. 182-185.
3. А.F. Tuzovskii, S.V. Chirikov, V.Z. Yampolsky. System upravleniya znaniyami (metody and 1tehnologii) –
Tomsk: Izd NTL, 2005. – 260 s.
4. S. Staab, H-P.Schunurr, R. Studer, Y.Sure. Knowledge processes and ontologies //EEE Intelligent Systems,
Special Issue on Knowledge Management, 2001. 16(1), P. 26-34.
5. L.A. Trofimova. Upravlenie znaniyami: uchebnoe posobie/ L.A. Trofimova, V.V. Trofimov. – SPb. : Izd
SPbGUEF, 2012. – 77 с
6. D.V. Kudryavtsev. Sistemy upravleniya znaniyami and primenenie ontology: ucheb. posobie // D.V.
Kudryavtsev. – СПб.: Izd Politehn. un-tа, 2010. – 344 s.
7. Yu.А. Zagorulko, O.I. Borovikova. Informatsionnaya model portala nauchnyh znany. //Informatsionnye
tehnologii.. - 2009. - no 12. -s.2-7
8. Alias LingPipe. In: http://alias-i.com/lingpipe/, дата обращения - 23/03/2014.8.
9. Ch.D. Manning, P. Raghavan, H. Schütze (2009). Introduction to Information Retrieval. Cambridge
University Press. p. 544.
10. E.I. Bolshakov, E.S. Klyshinsky, D.V. Lande, A.A. Noskov, O.V. Peskov, E.V. Yagunova.. Automatic
obrabotka tekstov na estestvennom yazyke i kompyuternaya lingvistika – М.: MIEM, 2011. — 272 с. ISBN 978–5–
94506–294–8.
11. M. Du, X.Chen. Accelerated k-nearest neighbors algorithm based on principal component analysis for text
categorization. //Zhejiang University-Science C-Computers & Electronics, volume: 14, issue: 6, pp. 407-416, 2013.
12. Zhurnal “ Fizika Tverdogo Tela”, url:http://journals.ioffe.ru/ftt/ (data obrascheniya - mart 2014).
13. D.S. Novikov. Avtomaticheskoe vydelenie terminov iz tekstov predmetnyh oblastey i ustanovlenie svyazey
mezhdu
nimi.
//Informatsionno-telekommunikatsionnye
tehnologii
i
matematicheskoe
modelirovanie
vysokotehnologichnyh sistem 2012. RUDN; Russia, url:http://conf.sci.pfu.edu.ru/index.php/ittmm/2012/paper/view/245
(data obrascheniya - aprel 2014).
14. K.V. Kryukov, O.P. Kuznetsov, V.S. Suhoverov. O ponyatii formalnoy kompetentnosti nauchnyh sotrudnikov.
Materialy III mezhdunarodnoy nauchno-tehnicheskoy konferentsii – OSTIS-2013, Minsk, -S. 143-146, 2013.
15. Shengyi Jiang, Guansong Pang, Meiling Wu, Limin Kuang.. An improved K-nearest-neighbor algorithm for
text categorization. In Proceedings of the Expert Systems with Applications 39, pages: 1503–1509, 2012.
Жомарткызы Г., Балова Т.Г.
Жоғарғы оқу орнында ғылыми білімді басқарудың технологиялық тəсілдемесін жүзеге асыру
Түйіндеме. Бұл жұмыста жоғарғы оқу орнындағы ғылыми білімді басқарудың əзірленген технологиялық
тəсілдемесі ұсынылып отыр. Ғылыми білімді басқару жүйесінің негізі ретінде On-To-Knowledge методология
қолданылды. Онтологиялық ақпараттық модельді əзірлеу мен ақпаратттық ресурсты өңдеу үшін Text Mining
● Технические науки
№5 2014 Вестник КазНТУ
44
жəне Semantic Web технологиялары қолданылды. Жоғарғы оқу орнындағы ғылыми білімнің ақпараттық
моделін əзірлеу, ғылыми профильді құру əдісі жəне семантикалық порталдың концепциясы сипатталған.
Түйін сөздер: білімді басқару жүйесі, білімді түрлендіру үдерістері, интеллектуалды капитал, On-To-
Knowledge методологиясы, семантикалық портал,
kNN əдісі, MI əдісі.
Жомарткызы Г., Балова Т.Г.
Реализация технологического подхода управления научными знаниями вуза
Резюме. В данной работе предлагается разработанный технологический подход управления научными
знаниями вуза. В качестве основы системы управления научными знаниями вуза используется методология
On-To-Knowledge. Для разработки онтологической информационной модели и обработки информационных
ресурсов используются технологий Text Mining и Semantic Web. Описаны разработанная информационная
модель научных знаний вуза, методы формирования научных профилей и концепция семантического портала
научных знаний вуза.
Ключевые слова: системы управления знаниями, процессы преобразования знаний, интеллектуальный
капитал, методология On-To-Knowledge, семантический портал, метод kNN, MI метод.
Balova T.G., Zhomartkyzy G.
The Implementation of the Technological Approach to the University’s Scientific Knowledge Management
Summary. The main aim of this paper is to develop some information support methods and models of the
university’s scientific knowledge management. The On-To-Knowledge methodology is used as the basis for the
university’s knowledge management. TextMining and SemanticWeb technologies are used to develop the ontological
information model and for the processing of information resources. The paper describes the developed information
model of the university’s scientific knowledge, the methods of forming scientific profiles, and the concept of the
university’s scientific knowledge semantic portal.
Key words: knowledge management system, knowledge transformation processes, intellectual capital, On-To-
Knowledge methodology, semantic portal, kNN method, MI method.
УДК 004.94
Д.Р. Рашидинов, А.К. Мамырова, Д.Р. Тусупова
КазНТУим. К.Сатпаева, Алматы, Республика Казахстан
ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ ИНФОРМАЦИОННОЙ
СИСТЕМЫ АНКЕТИРОВАНИЯ
Аннотация. При необходимости опроса значительного количества человек – от 800 и более – на поздних
стадиях проведения исследования обычно применяется анкетирование. Этот метод позволяет с меньшими
затратами получить значительный объем данных. Анкетирование востребовано для уточнения имеющейся
информации, при необходимости отслеживания эффекта каких-либо акций, например при запуске рекламы,
продажи товара, прогнозирования в социальной, экономической и многих других аспектов нашей жизни.
Информационные системы анкетирования приобретают всю большую популярность и необходимости для
опроса населения.
Ключевые слова: Анкетирование, респондент, веб-сервер, алгоритм, сети Петри, запросы.
Формализованное описание функционального процесса анкетирования
В информационной системе анкетирования сам опрос представляется в виде анкеты.
Анкета должна быть составлена таким образом, чтобы вопросы не могли повлиять на
поведение лица, которое будет опрошено. Хорошая анкета должна:
облегчить ответ опрашиваемого лица;
сформулировать вопрос с учетом его влияния на ответ опрашиваемого;
позволить легко провести анализ.
Процесс анкетирование можно представить в виде множества А и описать с помощью формулы (1):
А = {
;
;
;
;
;
1
1
1
ÀÐ
OP
ÀÎ
ÑÎ
ÇÏ
m
j
m
k
n
i
} (1)
где
n
i
ÇÏ
1
– сумма задач проверки состоящая из следующих элементов:
● Техникалыќ єылымдар
ЌазЎТУ хабаршысы №5 2014
45
уточнить содержание вопросов;
уточнить формулировки вопросов;
проверить полноту набора вопросов;
проверить набор вариантов ответов;
выявить лишние вопросы;
уточнить последовательность вопросов;
выяснить, не утомляет ли респондентов предлагаемое число вопросов;
определить, какие вопросы являются наиболее трудными для респондентов;
выяснить, какие мысли возникают у респондентов при ответе на тот или иной вопрос;
узнать, почему они отвечают "не знаю", "не понял";
выяснить, почему у них появляется нежелание отвечать;
определить, насколько правильно респонденты поняли правила заполнения анкеты;
проверить, достаточно ли оставлено в анкете места для ответов.
где
m
k
ÑÎ
1
- m – количество респондентов в анкетирование;
Затем нужно обобщить полученные ответы на вопросы. В случае опроса большего числа
людей, нужно использовать информационные системы анкетирования.
где
m
j
ÀÎ
1
- анализ ответов m - числа участников;
Каждый ответ нужно тщательно проанализировать и в случае надобности отбросить, если ясно,
что он заведомо неверный, из него невозможно что-либо понять или же если опрашиваемый ответил
просто "для галочки", не зная предмета.
OP – {МО, ФО} (1.1)
Обработка результатов представлена в виде формулы (1.1);
После того, как ответы проверены и в случае необходимости исправлены, нужно обработать
результаты и представить их в простой форме, обычно в форме таблиц, графиков. Методы обработки
результатов представлены в виде (1.2):
МО {МПО, МВО} (1.2)
Где МПО – методы первичной обработки и состоят из следующих видов обработки:
табулирование - представление количественной информации в табличной форме;
построение диаграмм;
гистограмм;
полигонов распределения;
кривых распределения.
Где МВО – методы вторичной обработки:
статистический анализ;
индуктивная статистика;
корреляционная статистика
Из формулы (1.1) данные делятся на формы обработки ФО {простой, графика, таблица} –
форма обработки;
Из формулы (1) АР – анализ результатов.
Системы анкетирования, представленные в настоящее время на рынке, в своем большинстве
поставляются в рамках корпоративных платформ, либо являются узкоспециализированными и
рассчитаны на работу с определенными программно-аппаратными комплексами, либо обладают
ограниченным набором средств анализа и визуализации собранной информации [1, 2 ].
Для моделирования информационных систем класса «клиент-сервер» наибольшее
распространение получили подходы, основанные на положениях теории систем и сетей массового
обслуживания, теории сетей Петри. Анализ информационной системы аналитическими методами
выполняется на основе дискретных и непрерывных цепей Маркова. При представлении используются
классические, стохастические и раскрашенные сети Петри. При этом применяются аналитические
методы и методы имитационного моделирования.
Комплекс разработанных программных средств системы анкетирования позволяет сократить
время прохождения анкеты по цепочке: интервьюер → анкетируемый (эксперт) → заполненная анкета
(выполненная экспертная оценка) → введение информации в базу данных → анализ → представление
результатов в графическом виде → статистический анализ в сторонних программных пакетах.
● Технические науки
№5 2014 Вестник КазНТУ
46
Разработка имитационной модели системы анкетирования с клиент-серверной архитектурой
Целью проведения моделирования информационной системы анкетирования является
определение вероятностей отказа обслуживании системы в зависимости от числа используемых
каналов. Оценка этой характеристики позволяет сделать выводы о требованиях к системе при
проведении анкетирования.
Концептуальная модель информационной системы анкетирования имитирует потоки запросов
заявок трех типов: запрос на получение статического содержимого сайта, запрос на получение
информации из базы данных и запрос получения статистики прохождения анкетирования.
Имитационная модель информационной системы представляем собой стохастическую сеть
Петри.
Сеть Петри представляет собой двудольный ориентированный мультиграф, состоящий из
вершин двух типов — позиций и переходов, соединённых между собой дугами. Вершины одного
типа не могут быть соединены непосредственно. В позициях могут размещаться метки (маркеры),
способные перемещаться по сети.
Для моделирования обработки сервером запросов разного типа в модель введены маркеры
разной формы; где маркеры обозначают:
▼ -запрос тип 1
♦ - запрос тип 2
■ - запрос тип 3
Маркеры в виде кружка отражают состояние обработки запроса каналом сервера.
Модель приведена на рисунке 1.
Рис. 1. Модель WEB-сервера в виде сети Петри
Переход сети Петри t
1
, t
2
, t
3
ассоциирована с источниками заявок, интенсивность поступления
которых на выходы сервера приложений составляют λ
1
, λ
2
, λ
3
соответственно. Множество М каналов
сервера разбито на подмножество загруженных каналов М
1
и подмножество свободных каналов М
2
.
При этом М
1
М
2
= Ø и
М
= (М
1
М
2
) Моменты инициирования обработки запросов сервером
приложений имитируется переходами t
4
, t
5
,…, t
18
. При поступлении очередного запроса в момент
времени τ
i
запускается канал обслуживания K
q
М
2
с наименьшим номером. Время запуска канала
K
q
определяется временем
. Окончание обслуживание запросов имитируется переходамиt
19
,
t
20
,…, t
33
. Время окончания обслуживания запроса с iканалом K
q
задается выражением:
(2)
По умолчанию Web-сервер настроен для работы с 15 одновременными соединениями,
принимаем п- 15. Статистика собиралась на тестовой сборке системы, при этом имитировалась
нагрузка, сопоставимая с одновременным прохождением анкетирования 20 пользователями.
Интенсивность поступления заявок на обслуживание составила λ = 10. Среднее время обработки
одной заявки без учета раскраски, равно 0,4 с. Средняя интенсивность обслуживания1 заявок при
этом составляет µ = 2,5. С учетом раскраски заявки на получение статического содержимого сайта
(картинки, статические НТМL-страницы, стилевые таблицы) приходились интенсивностью λ
1
= 5,
среднее время обслуживания составило t
1
= 0,15с интенсивность обслуживания была равна µ
1
= 6,7.
Заявки, на получение информации из базы данных приходили с интенсивностью λ
2
= 2, среднее время
|