соответствуют изучаемому материалу, известны в начале семестра,
но могут видоизменяться в зависимости от направленности курсо-
вой работы студента. Таким образом, при серьезном отношении к
своей основной специальности студент сокращает свои непроизводи-
тельные затраты, используя материалы докладов в дальнейшем в
курсовой или дипломной работе и углубляет знания в информаци-
онной области.
Кроме этого, готовя свои доклады, студенты должны подгото-
вить 15 тестовых вопросов по исследуемой проблеме. После коррек-
тировкой их преподавателем формируется фактически силами сту-
дентов тестовая база по изучаемой теме. Тестирование на основе та-
кой тестовой базы не ставит своей целью провести, таким образом,
экзамен по изучаемой дисциплине, а, скорее, позволяет лучше усво-
ить пропущенный или непонятый материал (тесты рекомендуется
372
пройти несколько раз, каждый раз после подготовки недоученного
материала). С другой стороны, анализ ответов может помочь препо-
давателю оценить степень усвоения студентами разделов предмета и
подобрать подход к лучшему усвоению материала. Тестовая оболоч-
ка, используемая для этого довольно проста, позволяет запрещать
или давать возможность тестирования без преподавателя, оставляя
тем не менее информацию об успехах студента. Кроме того, мож-
но использовать тестовые оболочки, помещаемые на сайтах. Такое
использование тестирования вполне соответствует идее распаралле-
ливания образовательного процесса.
Параллельное сравнительное изучение элементов языков про-
граммирования (С и JavaScript).
Изучение языков программирования на гуманитарных факульте-
тах студентами востребовано, хотя идет несравнимо медленнее, чем
на естественных. Специального времени для изучения языков не от-
водится. Поэтому в рамках информационных дисциплин, а также
спецкурсов по выбору в качестве пробной методики студентам пред-
лагалось сравнительное изучение конструкций языков программиро-
вания С и JavaScript, формально разнесенное по двум дисциплинам.
Надо отметить, что в школах программирование изучали едини-
цы, поэтому, прежде чем переходить к структуре языка, необходимо
было дать начала теории представления данных на одной из дисци-
плин. Зато впоследствии экономилось время на объяснении функци-
онирования элементарных конструкций. Практически преподавание
велось одним и тем же преподавателем на 2 парах практик, поэтому
студенты изучали работу аналогичных конструкций, выполняя одно
и то же задание на обоих языках последовательно. По мере услож-
нения материала дифференцировались успехи студентов и увеличи-
валась доля самостоятельной работы с языками в дистанционном
режиме, что позволяло в большей мере преподавателю применить
технологию распараллеливания образовательного процесса, комби-
нируя дистанционный и индивидуальный режим работы со студен-
тами.
С аналогичной целью, но, с гораздо большим наглядным yспехом,
в рамках информационных дисциплин преподается практическое
изучение основ работы с научными пакетами MAPLE, MATHLAB.
Чтобы несколько расширить знания студентов о работе с издатель-
373
скими пакетами, в отчет о работе с вышеуказанными пакетами вклю-
чена работа с графическим пакетом для MathType MS Windows. Та-
ким образом, студенты выполняют индивидуальные работы, как на
практическом занятии, так и в дистанционном режиме, используя
те же принципы, что и при выполнении работ по Web-верстке, т. е
параллельные технологии.
Кроме этого, при изучении тем, в которых описывается приме-
нение каких-либо современных пакетов, полезных для основной спе-
циальности, например, по моделированию процессов с использова-
нию нейросетей, поощряется индивидуальное изучение доступных
пользователю прикладных пакетов, используемых в настоящее вре-
мя по изучаемой дисциплине с последующим докладом для студен-
тов группы (обмен информацией по поводу анализа использования
пакета) на семинаре. В частности, подобная исследовательская ра-
бота с пакетами для построения и анализа когнитивных методов в
социологии вывела на контакт с лабораторией ИПУ РАН в Москве
и дальнейшему сотрудничеству.
Литература
1. Воеводин В. В., Воеводин Вл. В. Параллельные вычисления.
СПб.: БХВ-Петербург, 2002. 608 с.
2. Немнюгин С. А., Стесик О. Л. Параллельное программирова-
ние для многопроцессорных вычислительных систем. СПб.: БХВ-
Петербург, 2002. 400 с.
3. Материалы XIII Всероссийской научно-методической конферен-
ции "Телематика"(2004, 2005). СПб.: СПбГУ ИТМО. М.: ГосНИИ
ИТиТ "Информика".
374
Михайлов О.Ф.
Санкт-Петербургский государственный университет
Некоторые аспекты разработки систем
мониторинга для распределённой
IT-инфраструктуры
Рекомендовано к публикации доцентом Сергеевым С.Л.
Введение. IT-инфраструктура – это совокупность программно-
аппаратных средств, обеспечивающих выполнение прикладных про-
граммных комплексов, используемых для управления операционны-
ми и производственно-технологическими процессами. Внедрение си-
стем управления и мониторинга становится необходимым, когда воз-
растание количества клиентов IT-инфраструктуры и использование
разнообразных программных сред в работе специалистов приводит
к снижению производительности сети, нередким простоям в работе
целых подразделений.
Реализация системы управления и мониторинга включает следу-
ющие цели и задачи:
• создание
интегрированной,
стабильной
и
управляемой
IT-среды;
• обеспечение динамического взаимодействия между бизнес и IT-
структурами предприятия;
• оптимизация использования информационных реcурсов;
• повышение эффективности работы IT-структур;
• повышение качества работы IT-служб и оперативность устра-
нения сбоев в системе.
Существуют программные продукты, например, HP OpenView,
представляющие собой инструментарий для построения масшта-
бируемых систем управления территориально распределенной IT-
инфраструктурой. Такие системы позволяют создать комплексное
решение и обеспечить управление всеми составляющими процесса
работы предприятия.
Однако необходимо помнить, что такие системы – это только ин-
струмент, и результат его применения в значительной степени опре-
деляется теми действиями и решениями, которые осуществляет че-
ловек – интегратор системы на конкретном предприятии. Для того,
375
чтобы процесс интегрирования прошел успешно, т.е. в результате
максимально полно были реализованы поставленные задачи, необ-
ходимо тщательно разработать принципы и шаги, следуя которым
человек сможет с уверенностью получить удовлетворительную по
всем параметрам систему мониторинга и контроля IT-среды.
Анализ бизнес-правил и логики. Первый этап построения си-
стемы мониторинга – это исследование бизнес-правил и логики, на
которых основывается структура информационной среды предприя-
тия. Здесь необходимо учитывать то, что эта структура, во-первых,
отражает процессы, присущие данной области рынка в целом и дан-
ной компании в частности, т.е. находится под влиянием экспертов
предметной области; а во-вторых, является информационной, т.е.
в известной степени ограничена, наблюдается и может быть пере-
строена IT-менеджерами. Поэтому интегратор должен непрерывно
находиться во взаимодействии с обеими влияющими сторонами и
при проведении анализа помнить о том, что бизнес-правила могут
быть реорганизованы с целью улучшения параметров выполнения
различных операций, таких, как, например, скорость и качество вы-
полнения (инициатива предметных экспертов), что подразумевает
соответствующую перестройку информационной системы. Таким об-
разом, построенная система должна обладать достаточной степенью
гибкости.
В результате анализа бизнес-правил и логики должна быть вы-
строена система иерархических зависимостей подсистем, выяснены
признаки приоритетности и критичности каждой из них.
Замечание. Система HP OpenView, как и другие системы того
же назначения, позволяет настроить корреляцию и эскалацию раз-
личных сообщений, событий и пр., что позволяет быстро увидеть и
оперативно среагировать на нежелательные события. Для удовле-
творительной работы этих механизмов крайне важно правильно и
полно описать деревья зависимостей и иерархий.
Анализ аппаратно-программных условий работы систе-
мы. Совместно с производителем (поставщиком) программно-аппа-
ратных средств, используемых на предприятии, специалист должен
исследовать возможность интеграции каждой из подсистем в общую
систему. Для этого необходимо:
• определить условия работы каждой из подсистем: нормальный
режим работы, загруженность (нормальную и максимальную),
376
критичность выхода из строя, условия обновления, возмож-
ность замены (временной или постоянной) и т.д.;
• заранее определить возможные негативные последствия сов-
местной работы различных подсистем;
• проанализировать возможность удаленного доступа к каждой
из подсистем (определить рамки действия различных догово-
ров и лицензий);
• выяснить степень конфиденциальности данных, обрабатывае-
мых каждой системой и, соответственно, политики допуска к
ним.
На основе полученных данных интегратор составляет возможную
схему общей системы аппаратно-программных средств, подлежащих
мониторингу.
Выбор метода обработки данных внутри системы мони-
торинга. Следующим важным этапом является выбор реализации
системы обработки и передачи данных, находящихся под мониторин-
говым контролем, для каждой подсистемы, детально исследованной
на предыдущих шагах. Это может быть передача данных с обра-
боткой их серверами мониторинга, или предварительная обработка
данных на самом компоненте с передачей статистики в структуру
мониторинга, или же удалённый опрос системой мониторинга.
В зависимости от выбранного метода интегратор окончательно
определяет механизмы и набор компонент из большого инструмен-
тария (например, HP OpenView) для реализации системы монито-
ринга.
Внедрение и тестирование компонент. Внедрение системы
мониторинга производится поэтапно. Предварительно проводится
тестирование работы каждой компоненты. Такое тестирование опти-
мально проводить в два этапа: сначала созданная система внедряет-
ся на тестовый сервер, а после успешного завершения тестирования
и отладки устанавливается уже на рабочую систему, без взаимодей-
ствия с другими компонентами мониторинга, могущими в дальней-
шем работать на этом же физическом сервере.
Замечание. Данный этап должен быть подготовлен с особым
вниманием и тщательностью, поскольку в реальной ситуации, как
правило, тестовая эксплуатация идет на рабочих серверах, и сбой в
377
работе системы может привести, в конченом итоге, к финансовым
потерям.
Добавление дополнительных сервисов. Добавление допол-
нительных элементов в программный комплекс мониторинга позво-
ляет оперативно принять все необходимые меры для более глубокой
диагностики проблемной зоны, чем предоставляет общая система.
Такими элементами могут служить соответствующие проблеме ко-
манды операционной системы, отдельно написанные скрипты или
любая другая команда, позволяющая произвести вывод на экран ре-
зультатов опроса систем на предмет причины сбоя.
Создание системы отчетности. Необходимым элементом си-
стемы мониторнига является внедрение автоматической системы от-
четности, позволяющей выделять проблемные области и реорганизо-
вывать IT-структуру, устраняя причины сбоев системы мониторин-
га.
Заключение. В результате выполнения этих шагов может быть
посроена полноценная система мониторинга IT-инфраструктуры
предприятия.
Литература
1. Моделирование бизнес-процессов.
http://valex.net/articles/process.html
2. Особенности построения автоматизированных систем мониторин-
га. http://www.gaw.ru/html.cgi/txt/publ/micros/ehelon.htm
3. Технологии построения систем мониторинга.
http://www.intelcom.ru/s3/monitor.html
4. Управление в рамках концепции Adaptive Enterprise.
http://www.hp.ru/openview/library/Adaptive
378
Мозговой М.В.
Санкт-Петербургский государственный университет
Контекстно-ориентированный тезаурус
русского языка
Рекомендовано к публикации профессором Тузовым В.А.
Введение. Большую помощь в создании и редактировании тек-
стов, как художественных, так и технических, могут оказать сло-
вари синонимов — тезаурусы. Например, среди филологов широ-
кой известностью пользуются словари З.Е. Александровой [1] и
Ю.Д. Апресяна [2]. С развитием компьютерных технологий стали
появляться электронные версии тезаурусов. Так, в настоящее вре-
мя существует и постоянно развивается словарь ASIS [3]. Достаточ-
но развитый тезаурус входит в поставку текстового процессора MS
Word.
Всем существующим электронным словарям свойственен один и
тот же недостаток: отсутствие учета контекста слова при подборе
его синонимов. Так, если в MS Word выделить слово коса во фразе
вдали виднелась песчаная коса, будут выведены все найденные сино-
нимы слова коса для каждого из возможных его трактовок, хотя из
контекста ясно, что речь идет об отмели около берега водоема. Невоз-
можность распознать правильное значение многозначного слова, ве-
роятно, не столь критична, поскольку количество разных значений
одного и того же слова обычно невелико. Однако список неверно вы-
бранных синонимов пополняют и другие слова, в какой-либо форме
совпадающие с анализируемым. Так, в приведенном выше примере
в список синонимов попадет и слово коса в значении косоглаза.
Разрешить эту проблему можно при помощи алгоритмов, опреде-
ляющих смысл слова в данном контексте (см., напр., [4]). Для русско-
го языка можно применить, в частности, семантический анализатор
В.А. Тузова [5]. Кроме модуля определения смысла слова, семанти-
ческий анализатор содержит формальный словарь, который может
быть использован в качестве словаря синонимов.
379
Данная работа посвящена изучению применимости семантиче-
ского анализатора в задаче построения качественного тезауруса для
русского языка.
Выявление значения слова анализатором. В процессе ана-
лиза предложений входного текста семантический анализатор ге-
нерирует два информационных блока. Первый блок содержит ско-
бочное описание каждого предложения, отражающее его структуру.
Второй блок с помощью специального формального языка описыва-
ет значение каждого отдельного слова документа с учетом контек-
ста. Так, слово коса в контексте вдали виднелась песчаная коса будет
описано с помощью формулы:
КОСА S1>Copul(S1:БЕРЕГ\$122416(Z1,Z2),УЗКИЙ\$12/01406)
Другим значениям слова коса сопоставлены другие семантические
описания.
Этот пример показывает, каким образом можно использовать се-
мантический анализатор в качестве модуля, выявляющего коррект-
ное значение слова в данном контексте. Подключив анализатор к
любому существующему электронному словарю, можно сделать его
контекстно-ориентированным.
Семантический словарь как словарь синонимов. Семан-
тически близким словам (синонимам) в словаре В.А. Тузова сопо-
ставлены схожие семантические формулы. Поэтому, располагая се-
мантической формулой некоторого слова, можно автоматически из-
влечь схожие по смыслу слова из семантического словаря. Впервые
эта идея была описана в работе [6], однако в ней не рассматривался
контекстно-ориентированный поиск и, кроме того, не был предло-
жен общий алгоритм построения запросов для извлечения синони-
мов произвольного слова.
Задача определения семантической схожести слов в рамках мо-
дели В.А. Тузова сводится к определению близости семантических
формул. Хотя в общем случае задача определения эквивалентности
выражений неразрешима (по Тьюрингу), в нашей ситуации даже
сравнительно простые эвристические алгоритмы приводят к хоро-
шим результатам.
380
Семантическая формула характеризуется прежде всего двумя ос-
новными видами своих составляющих: номерами классов и списком
базисных функций. Например, в приведенной выше формуле сло-
ва коса присутствуют номера 122416 и 12/01406, а также базисная
функция Copul (слова БЕРЕГ и УЗКИЙ являются всего лишь рас-
шифровками значений номеров классов). Аналогично, слово косой в
смысле «косоглазый» описано с помощью базисной функции Hab и
классов 124, 12/02051 и 124/4112:
КОСОЙ S1>Hab(S1:ЖИВОЙ$124,КОСОЙ$12/02051(ГЛАЗ$124/4112))
Таким образом, можно составить упрощенное описание слова, пере-
числив номера классов и базисные функции, входящие в его семан-
тическую формулу. Сначала указываются классы, затем — функции:
КОСА 122416 12/01406 Copul
КОСОЙ 124 12/02051 124/4112 Hab
Теперь близость семантических формул можно оценить, используя
расстояние Левенштейна [7]. Эксперименты показывают, что рассто-
яние, равное нулю (точное совпадение упрощенных формул), почти
всегда сигнализирует о найденных синонимах. Расстояние, равное
единице, в ряде случаев также обеспечивает хорошее смысловое при-
ближение. Расстояние, превосходящее или равное двум, обычно уже
свидетельствует об отсутствии синонимичности (см. табл. 1).
Таблица 1. Примеры найденных синонимов
Слово
Найденные синонимы
коса (песчаная)
0: —
1: крутобережье крутояр рабатка
косой (косоглазый)
0: косоглазый
1: кривоглазый
девушка
0: дивчина
1: кралечка русалочка снегурочка (и др.)
ключ (источник)
0: родничок фонтанчик
1: прудик ручеек речка (и др.)
Интересно отметить, что «близость» в терминах семантического
словаря далеко не всегда совпадает со смысловой близостью, отра-
женной в обычных словарях синонимов. Например, слову косой (в
381
смысле косоглазый) достаточно близки слова криворогий и карегла-
зый. Семантическая формула слова косой может быть расшифро-
вана как «некто, имеющий косые глаза». Эта формула достаточно
близка к схожим формулам «некто, имеющий карие глаза» и «некто,
имеющий кривые рога».
Практическая реализация тезауруса. Расстояние Левенштей-
на интересно для экспериментирования, однако для практических
целей его постоянное вычисление может оказаться слишком ресур-
соемким. Поскольку большинство синонимов извлекаются при нуле-
вом расстоянии между упрощенными семантическими формулами,
в первой версии тезауруса можно ограничиться точным равенством
формул.
Для описываемой программы семантический словарь был пре-
образован в таблицу формата MS Access. Первый столбец таблицы
содержит некоторое слово, а второй — упрощенную семантическую
формулу из словаря. Имея упрощенную формулу анализируемого
слова, получаемую с помощью простого преобразования полной фор-
мулы, предоставляемой семантическим анализатором, с помощью
простого SQL запроса
select * from MainTable where descr=’ФОРМУЛА’
можно получить список его синонимов.
Заключение. Качество существующих словарей синонимов мо-
жет быть повышено с помощью модулей, определяющих смысл сло-
ва в заданном контексте. Для русскоязычных текстов в роли такого
модуля может выступать семантический анализатор В.А. Тузова.
В своей работе семантический анализатор использует формализо-
ванный семантический словарь, который может быть использован
также в качестве словаря синонимов, легко подключаемого к лю-
бым программным продуктам. Семантический словарь, однако, не
разрабатывался специально для этой цели, поэтому более качествен-
ного результата можно добиться при помощи связки семантического
анализатора с каким-либо известным существующим словарем сино-
нимов. С другой стороны, информация из словаря синонимов также
может быть добавлена в семантический словарь.
382
Литература
1. Александрова З.Е. Словарь синонимов русского языка. М.: Рус-
ский язык, 2001. 495 с.
2. Новый объяснительный словарь синонимов русского языка / Под
ред. Ю.Д. Апресяна. М.: Языки славянской культуры, 2003. 624 с.
3. Голубицкий С. Побочный продукт // Компьютерра, 2004.
№ 26–27.
4. Edmonds Ph., Kilgarriff A. (Eds.) Journal of Natural Language
Engineering (special issue based on Senseval-2), 2003. V. 9(1).
5. Тузов В.А. Компьютерная семантика русского языка. СПб.: Изд-
во СПбГУ, 2004. 400 с.
6. Коробейникова О.В., Порошин В.А. Использование компьютер-
ных словарей русского языка — поиск синонимов посредством
SQL-запросов // Процессы управления и устойчивость: Труды
34-й научной конференции аспирантов и студентов / Под ред.
Н.В. Смирнова, В.Н. Старкова. – СПб.: Изд-во СПбГУ, 2003.
С. 379–384.
7. Левенштейн В.И. Двоичные коды с исправлением выпадений,
вставок и замещений символов // Докл. АН СССР, 1965. Т. 163.
Вып. 4. С. 845–848.
383
Мышков А.С.
Санкт-Петербургский государственный университет
Обеспечение безопасности в малобюджетных
интернет базах данных
Рекомендовано к публикации доцентом Сергеев С.Л.
Введение. Системы управления базами данных (СУБД) и сред-
ства разработки современных приложений по технологии "кли-
ент/сервер" играют доминирующую роль в технической реализа-
ции передачи и хранения больших объемов данных. Многие пере-
даваемые и хранимые данные носят конфиденциальный характер.
Поэтому перед проектировщиками и программистами интернет при-
ложений на основе баз данных возникают вопросы обеспечения со-
хранности содержащейся в них информации, а также обеспечение
Достарыңызбен бөлісу: |