Литература
:
1.
Т.С.
Бимагамбетов, В.И.
Одинцов. Исследование вынужденного излучения и ВКР и ИК области спектра при
нерезонансном заселении уровней атомов
Rb
и
Cs
. Вестник МГУ: серия физика. Астрономия, 29, №2, 81
-83,
1988.
2.
Т.С.
Бимагамбетов. Теоретический расчет характеристики ВКР в условиях ОС заселения исходного уровня. //
Труды Х Юбилейной международной научной конференции «Наука и образование –
ведущий фактор».
Караганда. 2007. С. 22
-23.
3.
Аканаев Б.А., Бимагамбетов Т.С. Расчет порога возбуждения и энергии ИК излучения в условиях
ступенчатого нерезонансного заселения исходного уровня. // Известия министерства науки АН РК. Серия
физико
-
математическая. 1998, №2, С. 80
-84.
Гульмира Ермагамбетова
(Костанай, Казахстан)
ПРОЕКТИРОВАНИЕ РЕЧЕВЫХ ТЕХНОЛОГИЙ В ЦЕНТРАХ ОБСЛУЖИВАНИЯ НАСЕЛЕНИЯ
Диссертационная работа посвящена разработке теоретических основ и выработке практических
решений проблемы применения речевых технологий в центрах обслуживания населения (ЦОН) с целью
повышения открытости и облегчения доступа населения к информации и услугам, а также рассматриваются
вопросы применения казахского жестового языка для возможности построения комплексных точек доступа,
позволяющих обращаться в ЦОН гражданам
-
инвалидам для получения государственных услуг. Актуальность
проблемы доступа людей к информации на переходном этапе продвижения страны и мира к информационному
обществу не вызывает сомнений. Быстро развивающиеся информационные и телекоммуникационные
технологии проникают во все сектора экономики: в производство, в сферу услуг, в образование, в
государственное управление, банковскую сферу, в частный бизнес и др. Наблюдается тенденция к социализации
информации –
нарастанию количества информации, которая необходима людям в их повседневной жизни.
Помимо наличия знаний и информации, для развития информационного общества необходимо создание
условий для того, чтобы члены общества имели доступ к информации и могли ее использовать. Бурное развитие
технологий обостряет существующую во всем мире проблему информационного неравенства. Для Казахстана
сложилась ситуация, когда темпы роста информатизации оказались выше, чем темпы развития
компьютеризации и коммуникаций. Это привело к обострению проблемы неравного доступа граждан к
информации, особенно малообеспеченных людей и населения отдаленных регионов. В качестве одного из
средств смягчения этой трудной проблемы в диссертации рассматриваются речевые технологии, достигшие за
последние годы достаточно высокого уровня качества и способные обеспечить гражданам дополнительный, а
иногда и единственный, канал доступа к информационным и сервисным системам. Создание телефонных
сервисов самообслуживания, речевых порталов и речевых браузеров повышает эффективность и открытость
ЦОН и решает актуальную
народнохозяйственную и социальную задачу облегчения доступа населения к
информации и услугам и обуславливает важность и необходимость
выполнения исследований в данной
области.
Речевые технологии применяются для создания нового типа интерфейса пользователей с
информационно
-
справочными и управляющими системами с целью повышения эффективности этих систем.
Наибольший интерес в этой связи представляют технологии распознавания и синтеза речи и
идентификации голоса.
Распознавание речи
–
это преобразование акустического сигнала с человеческой речью в текст.
Несмотря на несколько десятилетий исследований в этой области, практические результаты были достигнуты
лишь в 1980
-
е годы, когда удалось перейти от распознавания отдельных слов к распознаванию слитной речи. В
1990-
х годах благодаря качественному скачку в развитии компьютерной техники и применению ряда новых идей
в алгоритмах обработки речи удалось добиться результатов, обеспечивающих уже приемлемую для разработки
коммерческих интеллектуальных приложений точность распознавания, и создать дикторонезависимые
распознаватели, в том числе с поддержкой русского языка.
Интернет
-
консорциум W3C (Word Wide Web Consorcium) разработал ряд стандартов, относящихся к
распознаванию речи:
SRGS 1.0
–
Speech Recognition Grammar Specification [1], формализующий процесс
создания грамматик для приложений, SISR 1.0 –
Semantic Interpretation for Speech Recognition [2], определяющий
процессы семантической интерпретации, и некоторые другие.
Синтез речи
–
это процедура превращения входного орфографического текста в звучащую речь.
Простейшие синтезаторы осуществляют конкатенацию и воспроизведение предварительно записанной речи и
имеют в связи с этим ограничения по количеству воспроизводимых слов и фраз.
В синтезаторах с неограниченным словарем (программы text
-to-
speech) элементами речи являются
фонемы или слоги, и в них применяется метод синтеза по правилам, а не компоновка фраз из отдельных слов.
Для многих языков, созданы "искусственные дикторы", которые вполне удовлетворительно имитируют
произвольную слитную речь человека и могут успешно работать в практических применениях для озвучивания
произвольного, динамически меняющегося текста. Для описания особенностей воспроизведения речи, таких как
громкость, высота звука, скорость, фонетическая транскрипция (произношение) и т.д., был разработан стандарт
SSML 1.0
–
Speech Synthesis Markup Language [3].
Идентификация голоса личности –
это определение соответствия поступившего речевого сигнала
индивидуальному образцу речи (отпечатку голоса), хранящемуся в памяти системы идентификации.
Существуют текстозависимые методы идентификации и методы идентификации голоса личности по
произвольной слитной речи. Было предложено много идей по преодолению сложностей, возникающих из
-
за
неустойчивости речевого сигнала, влияния шумов, эмоционального состояния диктора, состояния его речевого
«Проблемы и перспективы развития науки в начале третьего тысячелетия в странах СНГ»
289
аппарата, что позволило достичь к настоящему времени уровня надежности, достаточного для применения этой
технологии в практических системах верификации и защиты от несанкционированного доступа. Применение этой
технологии может оказаться целесообразным при организации телефонных речевых интерфейсов к услугам
центров обслуживания населения.
Речевые технологии значительно расширяют возможности по созданию интеллектуальных телефонных
приложений, которые дают возможность пользователям по телефону получать информацию и заказывать услуги
самостоятельно, без участия оператора, в интерактивном режиме самообслуживания. Так, применение
распознавания речи позволит абоненту осуществлять выбор в меню не тональным набором, а произнося
голосовые команды, что сделает общение с системой более привлекательным за счет более дружественного и
естественного интерфейса.
Использование в приложениях синтеза речи даст возможность абонентам получать в автоматическом
режиме, без участия операторов, динамическую информацию.
Применение средств идентификации личности по голосу предоставит абонентам дополнительную
защиту при доступе к конфиденциальной информации.
Наконец, использование автоматического распознавания речи позволяет создавать такие системы,
которые было практически невозможно реализовать, имея в качестве интерфейса только тональный набор.
Принципиальной особенностью таких систем является их ориентирование на понимание речи самых
разных дикторов, разного возраста, мужчин, женщин и молодежи, и даже говорящих с акцентом. Такое свойство
позволяет организовать активный двухсторонний диалог и в режиме реального времени формировать и
обрабатывать результаты серии запросов к удаленной базе данных, хранящей актуальную информацию
предметной области знаний. Конечной целью диалога может являться получение актуальной информации в
реальном времени или формирование заявки на оказание услуг, а в системах управления –
получение
информации о состоянии объекта и формирование команды или распоряжения. Информация, полученная из баз
данных или от систем управления, анализируется, обрабатывается и доставляется абонентам или персоналу в
виде аудио сообщений.
Взаимодействие с хранилищами контента и сервисными системами может быть реализовано с помощью
разнообразных интерфейсов: путем непосредственного доступа в базы данных, через web
-
сервисы, с
использованием электронной почты и др.
Сценарий ведения диалога настраивается специально под нужды конкретного приложения. По желанию
заказчика кроме русскоязычного диалога система может быть настроена на ведение диалога на других языках,
например казахском, английском, немецком, турецком, китайском и т.д.
Достоинства центра обслуживания населения с речевыми технологиями
Применение речевых технологий в центрах обслуживания населения дает следующие преимущества:
обеспечение непрерывного цикла работы –
7x24;
снижение затрат, за счет более эффективного использования телефонных каналов связи;
сокращение времени обслуживания входящих заявок;
повышение качества обслуживания клиентов;
для заказа услуг клиенту не требуются какие
-
либо специфические технические средства, для диалога
может быть использован любой телефон;
возможность интеграции с существующими в организации автоматизированными информационными
системами;
создание единого технологического цикла прием –
исполнение заявки;
возможность интеграции с различными Интернет технологиями;
снижение влияния человеческого фактора;
сокращение затрат на подготовку и обучение персонала;
сокращение численности персонала;
экономия за счет сокращения производственных площадей.
Литература
:
1. http://www.w3.org/TR/speech-grammar/
2. http://www.w3.org/TR/semantic-interpretation/
3. http://www.w3.org/TR/speech-synthesis/
4.
Жожикашвили В., Петухова Н., Зацепин А., Азаров В. Современные технологии управления в диспетчерской
службе такси // Проблемы управления, 2006, № 2, c. 32
-35.
5.
Билик Р., Мясоедова З., Неснова Н., Шпанов С. Электронные платежные системы и речевые технологии //
Проблемы управления, 2006, № 2, с. 35
-38.
6. Zhozhikashvili V., Farkhadov M., Petukhova N. and Zhozhikashvili A. The first voice recognition applications in
Russian language for use in the interactive information systems // Proceedings of the Ninth International Conference
“Speech and Computer” SPECOM’2004, Saint
-Petersburg, 2004, pp. 304-307.
Научный
руководитель:
кандидат технических наук, доцент
,
зав. кафедры информатики и математики Костанайского
государственного
университета
им. А. Байтурсынова
Кудубаева Сауле Альжановна
.
290
«Проблемы и перспективы развития науки в начале третьего тысячелетия в странах СНГ»
Манат Иманқұл
(Астана, Қазақстан
)
МИКРОКОНТРОЛЛЕРЛЕРДІҢ ДАМУЫ
Микроконтроллердің (МК) процессорлық ядросы ортақ процессорлық құрылғы архитектурасының, МК
жартылай өткізгішті үлкен ИС (интегралдық схема) өндіру технологиясының, архитектураның сұлбатехникалық
орындалуының бірігуінің көрінісін береді. МК архитектурасы –
ішкі және сыртқы программалық қолжетімді
ресурстардың, командалар жүйелерінің, үзілу жүйелерінің, енгізу/шығару функцияларының және магистраль
бойынша алмасу хаттамаларының жиыны.
МК нарығында бір уақытта әр түрлі архитектуралы процессорлар өмір
сүреді.
МК
-
ң негізгі классификациялық белгісі –
процессордың разрядтылығы. 4
-, 8-, 16-, 32-
разрядты және
DSP
(Digital Signal Processor)
МК ажыратылады.
Процессордың разрядтылығына МК
-
ң ішкі жадының максимал көлемі, бағасы мен өнімділігі тәуелді,
шамамен разрядтылықтың әрбір еселенуіне екі реттен. Кондырылған жады көлемін ұлғайтқан кезде процессорға
кететін шығын азаяды. Сондықтан қондырылған жады көлемінің белгілі бір мәнінде жоғары разрядтылы
процессорға көшу үнемді болады.
4-
разрядты МК
микроконтроллер өндірісінің
10%
алады
[1].
Негізінен олар
-
электрондық сағаттарда,
калькуляторларда, сондай
-
ақ тұрмыстық аппаратура контроллерлерінде және көліктік электроникада қолданылу
үшін өндірілген бұйымдар.
Микроконтроллер шығару көлемінің негізгі үлесі 8
-
разрядты МК
-
ға тиеді, себебі мұнда баға және
техникалық сипаттамалар қатынасы тиімді қарастырылған. Заманауи 8
-
разрядты МК
-
лер 100 МГц
-
ке дейінгі
жиілікте жұмыс істей алады, бұл оларға тек қана логикалық және цифрлық басқару мәселелерін емес, сонымен
қатар сигналдарды цифрлы өңдеу мәселелерін де шешуге мүмкіндік береді. Жылдамдықтарын шектейтін негізгі
фактор жадыға қатынау уақыты болып табылады.
8-
разрядты МК ядросы СISС
(Complex Instruction Set Computer)-
архитектурасы және RISС (Reduced
Instruction Set Computer)-
архитектурасы негізінде жүзеге асырылады.
16-
разрядтылы МК нарықта микроконтроллер өндірісінің үштен бір бөлігін алады. Алайда кейінгі кезде
сигналдарды цифрлы өңдеудің құрылғыларының кең шығарылуына байланысты жоғары өнімділікті қамтамасыз
ететін 32
-
разрядты МК
-
ға жол береді [2].
8-
разрядты МК өнімділігі жеткілікті болатын қолданыс аяларының саны баршылық, сондықтан осы арзан
МК кең қолданылып келеді. Гарвардтық RISC
-
архитектуралы 8
-
разрядты МК
-
лер CISC
-
архитектурасымен
салыстырғанда программа орындалуының және мәліметтерді өңдеудің жоғары жылдамдығын қамтамасыз етеді.
8-
разрядты МК
-
мен салыстырғанда 16
-
разрядты МК өңделетін мәліметтердің үлкейтілген
разрядтылығымен, командалардың кеңейтілген жүйесімен және адрестелу әдістерімен, регистрлардың
көбейтілген тобымен және адрестелетін жады көлемімен сипатталады.
RISC-
архитектураның артықшылығы –
оның қарапайым командалары машиналық циклдардың аз
санында жүзеге асырылады. RISC
-
архитектурада әрбір команда минимал уақыт ішінде орындалады (1
-2
машиналық цикл, такт), процессордың жалпы регистрларының максимал мүмкін саны (бірнеше мың),
процессордың үлкейтілген разрядтылығы (12, 14, 16 бит). Үлкен ИС тығыз құрастырылуының нәтижесінде көп
көлемді командаларды жүзеге асыру мүмкін болды.
Өзінің өнімдерін тұрақты түрде дамытып отыратын Аtmеl (Advanced Technology MЕmory and Logic)
фирмасының өнімдері ортақ базалық архитектура шеңберінде 8
-
шығысты арзан шағын tinyAVR™
-
дан (1 Кбайт флэш
-
жадысы) басталып, күрделі қосымшалар үшін арналған megaAVR™
-
мен (128 Кбайт флэш
-
жадысы) аяқталады.
AVR МК тобына программаны әлсіз МК
-
ден күшті МК
-
ге ауыстыру кезінде командалар жүйесінің үйлесімділігі тән
[3]. Бір топқа бірдей ядросы болатын бұйымдарды жатқызады. Бұл жерде бірдей ядро дегеніміз командалар
жүйесі, орталық процессор жұмысының циклограммасы, программа жадысы және мәліметтер жадысының
ұйымдастырылуы, үзілулер жүйесі және перифериялық құрылғылардың негізгі жиыны. Қайта программалау
мүмкіндігі жобаланып жатқан құрылғыда МК
-
ң барлық шығыстарын максималды тиімділікпен қолдануға жағдай
жасайды.
Әмбебап
16
–разрядты МК орта өнімділік көрсететін нақты уақыт жүйесінің жұмысы үшін қолданылады.
Олардың құрылымы және командалар жүйесі сыртқы оқиғаларға жылдам жауап беруіне бағытталған. Олар
электрқозғалтқыштарды басқару жүйелерінде көбірек қолданылады. 16
-
разрядты МК
-
ң ортақ ұқсастықтары
ретінде жоғары өнімділікті 16
-
немесе 32
-
разрядты процессорлық модульдің қолданысы (жылдам әрекеттілік 10
-
50 MIPS (Millions Instructions per Second); цифрлық ақпаратты өңдеудің жылдамдығын арттыратын
арнайыландырылған
құрылғылар мен ішінде 16
-
разрядты жүйелік магистральдің (16
-
разрядты мәліметтер
шинасы) қолданысын айтуға болады.
32-
разрядты МК кристалында МП
-
дан басқа ондаған Кбайтқа дейінгі көлемі бар командалардың ішкі
жадысы, бірнеше Кбайтқа дейінгі мәліметтер жадысы, таймерлік және коммуникациялық процессорлар,
тізбектелген алмасу модулі және т.б. орналасады. Ішкі құрылымда принстондық немесе гарвардтық архитектура
қолданылады. Заманауи 32–разрядты МК ARM (Advanced RISC
-machine)-
архитектураны қолдайды. Құрамына
кіретін процессорлардың CISC
-
немесе RISC
-
архитектурасы болады, ал олардың кейбіреулері суперскалярлы
архитектура құрайтын бірнеше атқарушы конвейерлерге ие [3].
Көптеген заманауи Intel x86 архитектурасын қолдайтын МП
-
ң ядролары мультискалярлы конвейерлі
өңдеуді және сыртқы Intel х86 интерфейсін қолдайтын
RISC-
архитектура бойынша орындалған. RISC
-
ядросының
кішкентай өлшемдері құрамында оперативті және тұрақты жадысы, DSP, қосымша логика және қосымша
элементтері болатын үлкен тапсырысты сұлбаларды біріктіре алады [3].
Flash Memory (
флэш
-
жады
)
–
энергияға тәуелді қайта жазылатын жадының технологиялық түрі. Қазір ол
соншалықты арзандады, тіпті жадының басқа альтернативті түрлері қолданыстан шықты. Flash Memory үлкен
көлемді ақпараттармен жұмыс істеген кезде жылдамдық жағынан салмақты артықшылық береді (мысалы,
цифрлық камераларға немесе МР3
-
плеерлерге тән ағындық оқу/жазу кезінде).
«Проблемы и перспективы развития науки в начале третьего тысячелетия в странах СНГ»
291
Flash-
микроконтроллері және программалатын логиканың микросұлбаларын шығаруда әлемдік
көшбасшылардың бірі болып табылатын Atmel корпорациясының жоғарыда аталған сұлбаларынан басқа өзінің
МК
-
не уақыттың нақты масштабындағы эмуляцияны кірістіреді, өзіндік программалау функцияларын жүзеге
асырады, перифериялық модульдердің санын кеңейтеді және дамытады, арнайыландырылған құрылғыларды
ендіреді (радиожиілікті таратқыш, USB (Universal Serial Bus)
-
контроллер, сұйықкристалды көрсеткіш драйвері,
программаланатын логика, DVD контроллер, деректерді қорғау құрылғылары) және т.б.
Қарқынды өндіріс темпіне ие және Atmel компаниясы шығаратын АVR МК келесілердің үйлесімділігін
қолданады: жартылай өткізгіштерді дайындаудың энергияны үнемдейтін технология CMOS (Complimentary Metal
-
Oxide Semiconductor), прогрессивті RISС
-
архитектура және
Flash-EPROM (Erasable Programmable Read-Only
Memory) немесе
Flash-EEPROM (Electrically
EPROM) типті жүйелікті программаланатын жады. Осының нәтижесі
ішкіплаталық басқару мәселелерінің тиімді шешімі және қонымды баға/сапа қатынасы болып табылады.
EEPROM кез келген кездейсоқ ұяшыққа жеке қолжетімділікті рұқсат етсе, флэш
-
жады тек толық
блоктарға қолжетімділікті рұқсат етеді. EEPROM flash
-
жадымен салыстырғанда көлем бойынша кіші (килобит
бірліктері
-
мегабит бірліктері) және бағасы жағынан қымбат. Flash пайда болғаннан бері компьютердің BIOS (Basic
Input Output System)
программалық жаңартуын немесе тұрмыстық электрондық құрылғылар үшін басқарушы
программаларды қайта жазу мүмкіндігі пайда болды.
Микросұлба логикасының күрделенуі және жақсырақ технологияның келуімен Майкл Слейтер
(Microprocessor Report журналдың негізін қалаушы)
болашақта транзисторлардың тығыздығын (МП өнімділігі) екі
еселеу үшін 18 айдан көп уақыт керек қажет дейді, себебі үлкен ИС
-
ды дайындау, жобалау және дұрыстау кезінде
пайда болатын маңызды технологиялық бөгеттерді жою уақыты көбейеді. Әсіресе жылу бөлу және қуаттың берілу
мәселелері асқындайды. Бүгінгі таңда транзисторлардың ауысып қосылуына қажетті жылдамдыққа жету
бекітпеде оқшаулағыш тотықтың ені бірнеше молекулаларға дейін өзгеруіне алып келеді және кристаллда тесіп
өтуді (breakdown) болдырмау үшін төмен қоректендіруші кернеуді қолдану қажет. Intel фирмасы микросұлбалар
болашақта шамамен 1В кернеумен жұмыс істеп, 50 А ток күшіне сәйкес болатын 40
-
50 Вт қуат қоректенеді деп
болжайды.
Кристалл құрылымының ішінде көлемді токтың біркелкі үлестірілуі және жылудың үлкен көлемінің
шашырауы күрделі мәселе болып табылады. Мамандардың айтуынша кремний құралдарын заманауи
дайындаудың әдістердің физикалық шегі 2017 жылға қарай қамтылады. Микросұлбалардың физикалық өндірісінің
технологиясының ауысуы программалық қамтама жасау технологиясында да өзгерістерді талап етеді, МК және
МП архитектураларында үлкен өзгерістерге алып келеді.
Қалыптасқан тәжірибеге сәйкес көптеген МК өндірушілер қолданушы қосымшаларын жасау кезінде
өздерінің өнімдері негізінде басқа өндірушілердің программалық (мысалы: Keil software фирмасының µVision3 IDE
(Integrated Development Environment)
программалық ортасын; Metaware фирмасының MetaDeveloper пакетін) және
аппараттық құралдарды қолданады. IAR Embedded Workbench™ (IAR EWARM) өңдеу біріктірілген ортасы
-
әр
түрлі
8/16/32-
биттік МК негізінде аяқталған қолданбалы жобалар жасауға рұқсат беретін қуатты дайындау
-
дұрыстау құрал [3]. Бұл
-
кең танымал профессионалды программалық унифицирленген орта, жақсы
жаңартылатын, жұмыстың қарапайым ережесіне және Windows ортасында жұмыс істейтін ыңғайлы терезелік
интерфейсі бар бірегей программа
-
қабықшаға біріктірілген инструменталды құралдардан тұратын жинаққа ие.
IDE IAR EWARM қарапайым және кеңейтілген жобалық моделдер жасауға мүмкіндік береді. Құрамында
қолданбалы кітапханалық жобалар үшін дайын шаблондар бар [3].
Жобаның әрбір типі үшін бір немесе бірнеше
құрастыру конфигурациялары анықталуы мүмкін.
МК көптеген түрлерін талдау нәтижесінде өзінің дамуында МП
-
ң алдыңғы эволюциясына сүйенген түрлер
салыстырмалы түрде ұзақ өмір сүретінін көрсетті. Талдау нәтижесінде тәжірибемен тексерілген тұрақты
құрылымдық шешімдер мен жаңа МК түрлері пайда болады.
Мобильді байланыстың кең қолданысы заманауи объектілерде МК жасанды интеллектісінің жиірірек
қолданылуына
алып келді. МК программаторларында әдетте өздерінің жеке басқару программасы болады. МК
-
мен шешілетін тапсырмалардың диапозоны соншалықты кең, олардың өндірушілері қолданушылардың әр түрлі
сұраныстарын қанағаттандыру үшін көптеген өзгертулер енгізуге тырысады. Бұрынырақ
өзіндік құрастыруды
орындау үшін микроконтроллерлік құрылғының жұмыс істеу процесін анықтау керек болды, программалық және
аппараттық қамтаманың әрбір құрылысын түсіну қажет етілді. Программаларды жасаудың біріктірілген
орталарының (қабықша) пайда
болуы МК үшін программа жазудың тиімділігін арттырды, командалар жүйесін
жаңа нұсқаулықтармен толықтыруға және жүзеге асырылып жатқан қызметтердің өсуіне септігін тигізді. Сонымен
қатар
жобалаушыға шешілуі тиіс тапсырманың орындалуының нақты бөліктерін ойластырмай, олардың мәніне
ғана көңіл аударуға мүмкіндік берді.
Достарыңызбен бөлісу: |