СЪВРЕМЕННИ ТЕХНОЛОГИИ НА ИНФОРМАЦИИ
КОМПЮТЪРНОТО ИНЖЕНЕРСТВО
*193405*
Антипенко Г.А. , Дубовик Т.Н.
Украинский государственный химико-технологический университет
РАЗРАБОТКА РЕГИОНАЛЬНОЙ СЕТИ
ДЛЯ ДНЕПРОПЕТРОВСКОГО ФИЛИАЛА АПТЕК
ООО «РЕНИЙ ФАРМ» (С ДОСТУПОМ К СЕТИ ИНТЕРНЕТ)
По мере того как размеры предприятия увеличиваются и его подразделения
приходится располагать в разных местах, возникла необходимость в соединении
между собой локальных сетей этих подразделений и создание распределенной
сети (wide – area network – WAN ) предприятия [3].
Под распределенной сетью WAN понимается коммуникационная сеть,
которая функционирует на территории, географически превышающей сферу
работы локальной сети (local area network LAN). Основное отличие
распределенной сети от локальной состоит в том, что для использования
распределенной сети коммерческая компания или организация должна
заключить договор с внешним провайдером службы распределенных сетей для
того, чтобы воспользоваться его услугами. Как правило, сеть WAN соединяет
между собой филиалы одной или нескольких организаций, предоставляет доступ
к внешним службам (таким как базы данных) и обеспечивает доступ удаленным
пользователям. По сетям WAN передаются данные различных типов, такие как
голосовые, обычные цифровые или видео [2,4].
Распределенные сети используют различные типы устройств, включая сле-
дующие:
1. Маршрутизаторы, которые выполняют различные функции, в частности,
регулирование сетевых процессов и управления портами интерфейсов.
2. Коммутаторы, осуществляющие передачу голосовых, цифровых и видео-
сигналов в пределах полосы пропускания распределенной сети.
3. Модемы, которые реализуют интерфейс для служб голосовых данных.
Модемы включают в себя устройства CSU / DSU и ТА / NT1, поддерживающих
интерфейс со службами ISDN.
4. Коммуникационные серверы, основной задачей которых является уста-
новление и отключения связи с пользователем [1].
Постановка задачи. На основании существующих приборов, методик и то-
пологий создать функционирующую сеть для обеспечения работы фирмы, с ми-
нимальными накладными расходами на передачу информации.
«Ключови въпроси в съвременната наука – 2015» • Том 18. Съвременни технологии на информации
51
recognize already only information about the formant structure. In fact, a man equally
recognizes normal speech and voice whisper, although the latter is not the source of the
voice. Voice source provides additional information in the form of intonation (pitch
change over statements), and this information is very important at the highest levels of
speech processing. But in the first approximation, we can confine ourselves to give the
formant structure, and for this purpose, taking into account compression uninformative
spectrum sufficient number of inputs selected in the range of 50 ~ 100.
Neural network has a fairly simple structure and consists of three layers: an input
layer, a layer of character and effector layer (Fig. 4). Each subsequent layer neuron is
connected to all neurons in the previous layer. The transfer function in all linear layer,
the input layer of the simulated competition.
Literature:
1. NM Amos and others. «Neurocomputers and intelligent robots» -Kiev:
Naukova Dumka, 1991
2.Speech
Analysis
FAQ
–
http://svr-
www.eng.cam.ac.uk/~ajr/SA95/SpeechAnalysis.html
*193549*
Елдеева Динара Кенжебайқызы
Қазақ гуманитарлық заң және техникалық колледжі,Қызылорда
СТУДЕНТТЕРДІҢ АҚПАРАТТЫҚ-МӘДЕНИ
КӨЗҚАРАСЫН ЖЕТІЛДІРУ МӘСЕЛЕЛЕРІ
Бүгінгі таңда басты мәселелерді ақпараттық технологиялар көмегімен
шешу, жұмыс барысын оңтайлы ұйымдастыруға қабілетті кәсіби маман даярлау
жүйесін жетілдіру өзекті мәселелердің бірі. Ақпараттық технологиялар
аймағында педагогикалық сала мамандарын оқыту мазмұнын қалыптастырудың
келесі мақсаттарын қолдануға әкеледі:
- ақпараттық технологиялар аймағында оқыту мазмұнын анықтаудың
маңызды факторы оның бағыттылығы;
- оқыту
мазмұны
педагогикалық
мамандықтар
студенттерін
ақпараттарды, ақпараттық технологияларды пайдалану арқылы өңдеуді
талап етіп,өз бетінше педагогикалық мәселелерді шешуге жеткілікті білімдер
мен оларды қолдану дағдыларын меңгеруді қамтамасыз етуі тиіс;
- мазмұн студентте педагогикалық мәселелерді шешуде пәнаралық
байланыстың негізінде өзінің педагогикалық қызметіндегі білімдерді
комбинациялауда пайдаланылатын білімдер жүйесін тұтас қабылдауын
қалыптастыруы тиіс.
Материали за XI международна научна практична конференция
50
After that, the discrete Fourier transform is calculated by fast Fourier transform
algorithm ([XX]). As a result, the real and imaginary coefficients obtained amplitude
spectrum and phase information. Phase information is discarded and the calculated
energy spectrum:
(2)
Since the processed data do not contain imaginary part, by the properties of the
DFT result is symmetric, ie, E [i] = E [N-i]. Thus, the size of the informative part of
the spectrum NS is equal to N / 2. All calculations are performed on a neural network
in the floating-point numbers and the majority of signals limited by the range [0.0,1.0],
so that the resulting spectrum is normalized to 1.00. For each component of the vector
is divided by its length:
,
(3)
(4)
Informativeness of different parts of the spectrum is not the same: in the low-
frequency region contains more information than in the high. Therefore, to prevent
excessive consumption of inputs neural network is necessary to reduce the number of
items that receive information from the high-frequency region, or, equivalently, to
compress the high-frequency region of the spectrum in the frequency space. The most
common method (due to its simplicity) – logarithmic compression [2], «Non-linear
frequency scales»:
,
(5)
f – frequency spectrum Hz,
m – the frequency of the new compressed frequency space
After normalization and compression range is applied to the input of the neural
network. Inputs neural network does not perform any critical function, and only transmit
signals on a neural network. Select the number of inputs – a difficult task, because with
a small amount of input vector may lose important to recognize information, and with a
large computational complexity is significantly increased (only in the simulation on the
PC, in real neural networks this is not true, because all elements work in parallel) . At
high resolution (more) inputs can be released harmonic structure of speech and as a
consequence the definition of voice pitch. At low resolution (small number) I can only
definition of formant structure. As demonstrated by further study of this problem, to
«Ключови въпроси в съвременната наука – 2015» • Том 18. Съвременни технологии на информации
39
Создание сети осуществлялось с помощью серверов, маршрутизаторов,
коммутаторов, хабов, экранированых и оптоволоконных кабелей, а также других
приборов. Так как предприятие имеет территориально разрозненную структуру,
а максимальное расстояние между аптеками достигает 180 км. Для предоставле-
ния полосы пропускания заключен договор с интернет-провайдером.
Созданная сеть (рисунок 1) обеспечивает доступ между 7 аптеками, находя-
щихся в разных городах области. Таким образом, было связано 7 серверов, более
35 компьютеров, 45 IP-камер и 8 принтеров в общую сеть, с выходом в сеть Ин-
тернет.
Рисунок 1 – Схема разработанной региональной сети
Главным качеством разработанной сети является ее относительная про-
стота, дешевизна и производительность. Созданная сеть сделана таким образом,
что возможно расширение сети в будущем.
Материали за XI международна научна практична конференция
40
ЛИТЕРАТУРА
1. http://www.intuit.ru/studies/courses/3688/930/info
2. http://net.e-publish.ru/p216aa1.html
3. Уэнделл О. Компьютерные сети. Первый шаг = Computer Networking
First-step. – М.: «Вильямс», 2005. – С. 432.
4. В. Г. Олифер, Н. А. Олифер «Основы сетей передачи данных. Курс лек-
ций» – 2007
*193656*
Красноруцкая Н.С., Кочковая Н.В.(рук)
Филиал ДГТУ в городе Волгодонске, Россия
АНАЛИЗ СОВРЕМЕННЫХ ТЕНДЕНЦИЙ 2015 ГОДА
«Если мы перестанем предлагать новые решения, чтобы соответствовать запро-
сам потребителей и технологическому прогрессу, нас в любое время могут вытес-
нить из бизнеса» – Джефф Рейкс, президент «Microsoft Business Division» [1]
В настоящее время большое разнообразие трендов представлено на рынке.
Данные тренды помогают в повседневной жизни, значительно улучшая и облег-
чая её. Технологии из профессиональной эксплуатации все больше переходят в
индивидуальное использование. Этим новинкам присуща мобильность, помощь
в принятии решений и визуализация.
1)
«Умные» машины
Всепроникающая аналитика совместно с технологиями анализа контекста яв-
ляются предпосылками для возникновения мира умных машин. Эта база комбини-
руется с высокоразвитыми алгоритмами, которые позволяют системам понимать
обстановку, самообучаться и самостоятельно действовать. Прототипы автономных
транспортных средств, сложно организованные роботы, виртуальные личные по-
мощники и умные консультанты уже существуют и будут стремительно разви-
ваться, являясь проводниками в новую эру машинных помощников. [2] Из послед-
них примеров можно отметить «Умное» зеркало от Panasonic, которое дает советы
по поводу внешности, браслет Cicret, превращающий руку в Android-смартфон,
«Умные» очки Microsoft для работы с дополненной реальностью.
Специальная технология «умного» зеркала распознает лицо и фигуру, под-
мечая недостатки: от морщин до сухости кожи. А электронный советчик реко-
мендует диеты, упражнения или косметологические процедуры. А еще – позво-
ляет примерить на себя разные образы. [3]
«Ключови въпроси в съвременната наука – 2015» • Том 18. Съвременни технологии на информации
49
Figure 1. Entering audio
When processing a file on it moves the input window size equal to the size of the
window of a discrete Fourier transform (DFT). The offset relative to the previous
position of the window can be adjusted. In each position of the window is filled with
data (the system only works with sound, in which each sample is encoded by 16 bits).
When you enter the sound in real time he writes a block of the same size. After entering
the data in the window before computing the DFT window superimposed on it
smoothing Hamming:
,
(1)
N – size of the window DFT
Hamming window overlay slightly increased contrast range, but allows the
elimination of sharp frequency sidelobes (Figure 2), while particularly well manifested
harmonic structure of speech.
without smoothing window with a window smoothing Hamming
Figure 2. The effect of smoothing the Hamming window (logarithmic scale)
Материали за XI международна научна практична конференция
48
features in the N-dimensional space. To store such a signal must be N elements. Thus
at the design stage we do not know the specifics of the signal, or it is so complicated
that it is difficult to consider. This leads to the fact that the representation of the signal,
we use redundant. Next, assume that we have the ability to synthesize the same signals
(ie, synthesized speech), but the synthesized signal is a function of the parameter vector
in the M-dimensional space, and M << N (indeed, the number of model parameters for
speech synthesis is much less than the number of primary characteristics of speech
recognition models). But then we remember the input signal is not in its primary
features in the N-dimensional space, and the parameters model synthesis in M-
dimensional space. The question arises: how to translate the signal from one of the
parameter space to another? There is every reason to believe that this transformation
can be carried out using a fairly simple neural network. Moreover, in my opinion, such
a mechanism of storing works in real biological systems, particularly in humans. The
following describes a model of automatic speech recognition and synthesis. Provides a
mechanism for sound input into the neural network model of speech synthesis, a neural
network model, the problems encountered in the model. Sound input is performed in
real time through your sound card, or through the Microsoft Wave files encoded in
PCM (16 bit, 22050 Hz sample rate). Working with files is preferable because it allows
multiple processes to repeat processing neural network, which is especially important
when teaching. To the sound can be fed to the input of neural network, you must carry
it over the conversions. Obviously, the representation of the sound in the temporary
shape is inefficient. It does not reflect the characteristics of the audio signal. Much
more informative spectral representation of speech. To obtain a spectrum using a set
of bandpass filters tuned to different frequencies isolation or discrete Fourier transform.
Then, the resulting spectrum is subjected to various transformations, such as a
logarithmic scale change (amplitude in space and in frequency space). This allows to
take into account some of the features of the speech signal – lowering high information
content portions of the spectrum, the logarithmic sensitivity of the human ear, etc.
Typically, a complete description of only the speech signal spectrum is not
possible. Along with the spectral information is needed and more information about
the dynamics of speech. To obtain it uses delta-parameters, which are the time
derivatives of the basic parameters. The thus obtained parameters of the speech signal
are considered the primary features and it represents the signal levels on further
processing. Sound information input process shown in Fig. 1:
«Ключови въпроси в съвременната наука – 2015» • Том 18. Съвременни технологии на информации
41
Рис.1 – «Умное» зеркало от Panasonic
Браслет Cicret,в буквальном смысле превращающий руку пользователя в
сенсорную панель для отображения и ввода данных, браслет имеет восемь бес-
контактных датчиков: приближения, акселерометр, вибромодуль, адаптеры бес-
проводной связи Wi-Fi и Bluetooth. Предусмотрен флеш-накопитель вместимо-
стью 16 или 32 Гбайт, порт Micro-USB и светодиоды для индикации статуса. [4]
Рис. 2 – Браслет Cicret
Надев очки, пользователь сможет видеть перед собой, к примеру, «парящего»
в воздухе собеседника в Skype, прогноз погоды или виртуальный телевизор с транс-
ляцией футбольного матча. Вокруг «голограмм» можно не только ходить и наблю-
дать их с разных ракурсов, но и взаимодействовать с ними – перемещать, растяги-
вать, уменьшать или вовсе убирать из поля зрения. Область применения HoloLens
далеко не ограничена потребительским сектором. К примеру, благодаря «умным»
очкам инженеры будут постоянно иметь перед глазами детальную инструкцию по
сборке того или иного механизма, дизайнеры интерьеров смогут составлять 3D-
планировку дома вместе с клиентом, а хирурги перестанут отвлекаться на рентген,
так как снимок может быть визуализирован прямо на пациента.
Для работы HoloLens не нужны ни провода, ни наушники, ни смартфон, ис-
полняющий роль дисплея или «раздатчика» Wi-Fi. Гаджет ни от чего не зависит:
он несет на борту собственный процессор, названный HolographicProcessingUnit
Материали за XI международна научна практична конференция
42
(HPU), видеоускоритель, камеры с углом обзора 120°x120° и акустическую си-
стему. [5]
Рис. 3 – «Умные» очки Microsoft
2)
Беспроводной режим
Зарядка смартфона или ноутбука в беспроводном режиме, подключение док
станций и мониторов без проводов уже очень скоро станет реальностью. Беспро-
водные технологии предлагают пользователям существенно большую свободу
перемещения, удобство и гибкость использования цифровых устройств на ра-
боте и дома. Согласно отчету компании IHS, мировой рынок решений для бес-
проводной передачи электроэнергии вырастет к 2019 году на 140%. [6] Приме-
ром данного тренда является WattUp – беспроводная зарядка для всего.
Компания Energous представила на CES 2015 инновационную зарядку
WattUp, которая позволяет посредством радиоволн заряжать смартфоны, план-
шеты, электробритвы и зубные щетки в пределах до 5 метров.
Головная зарядка (ею на CES управляли с помощью iPad) использует
Bluetooth, чтобы определить состояние батареи и в оснащенных беспроводными
приёмниками гаджетах, в случае обнаружения разряженного смартфона или
планшета автоматически инициирует процесс подзарядки. [7]
Рис. 4 – Зарядка смартфона с помощью WattUp
«Ключови въпроси в съвременната наука – 2015» • Том 18. Съвременни технологии на информации
47
Attempts to create such systems were made by many researchers, including with
the use of neural networks. One example – created at the Kiev Institute of Cybernetics
in the 70-ies of the layout of the transport integral autonomous robot (TAIR) [1]. This
robot was trained to find their way on some areas and could then be used as a vehicle.
That's what properties, in my opinion, should have such a system:
Development of a system is only in the construction of its architecture.
In the process of creating a system developer creates only a functional part, but
does not fill (or fill in the minimum volume) system information. The main part of the
system receives information in the learning process. The ability to control their actions
with subsequent correction. This principle suggests the need feedback [Action] –
[Result] – [Correction] in the system. Such chains are very common in complex
biological organisms and are used at all levels – from the control of muscle contraction
at the lowest level to the management of complex mechanisms of behavior. The
possibility of accumulation of knowledge about the objects of the workspace.
Knowledge about the object – is the ability to manipulate his image in memory that is
amount of knowledge about the object is determined not only set its properties, but also
information about its interaction with other objects, behavior under different
treatments, being in different states, etc., ie, its behavior in the external environment
(eg, knowledge Geometric objects are assumed to predict the form of its perspective
projection for any rotation and lighting). This feature gives the system the ability to
abstract from real objects, ie the ability to analyze the object in its absence, thus
opening up new opportunities in teaching. Autonomous systems
When integrated set of actions that the system is able to perform, with a set of
sensors that monitor their actions and the environment, endowed with the above
properties of the system will be able to interact with the outside world at a fairly
sophisticated level, ie adequately respond to changes in the external environment (of
course, if it is included in the system during the training phase). The ability to adjust
their behavior depending on external conditions will partially or completely eliminate
the need for external control, ie, the system will become autonomous. To study the
features of machine learning model speech recognition and synthesis were combined
into a single system, which allowed give her some properties of self-learning systems.
This association is one of the key properties of the new model. What was the cause of
this association? Firstly, the system has the ability to perform actions (synthesis) and
analyze them (recognition), ie, Property (2). Secondly, there is a property (1), as in the
development of the system does not pledge any information, and the possibility of
recognition and synthesis of speech sounds – it is the result of learning. The advantage
of our model is the ability to automatically synthesize learning. The mechanism of this
training is described below. Another very important feature is the ability to transfer a
memorable image of a new parameter space with a much smaller dimension. This
feature is currently in the developed system has not been implemented in practice has
not been verified, but nevertheless I will try to summarize it using the example of
speech recognition. Suppose the input signal is given by the vector of the primary
Материали за XI международна научна практична конференция
46
them with other classes representing a different type of information – in fact, give them
a sense). Any voice signal can be represented as a vector in any parameter space, then
this vector can be stored in the neural network. One model of a neural network, a
learning without a teacher – a self-organizing feature maps of Kohonen. In it for a
variety of input signals generated neuronal ensembles representing these signals. This
algorithm has the ability to statistical averaging, ie, solved the problem with the
variability of speech. Like many other neural network algorithms, it provides parallel
processing of information, ie simultaneously work all neurons. Thereby solving the
problem with the speed of recognition – usually while the neural network is a few
iterations. Further, based on neural networks can be easily constructed multilevel
hierarchical structure, while retaining their transparency (the possibility of separate
analysis). As in fact it is a component, ie, divided into phrases, words, characters,
sounds, and then the speech recognition system to build a hierarchical logical. Finally,
another important property of neural networks (and in my opinion, is the most
promising of their property) is a flexible architecture. Under this may not be entirely
accurate term I mean that in fact the algorithm of the neural network is defined by its
architecture. Automatic creation of algorithms – a dream for decades. But the creation
of algorithms in programming languages until only by man. Of course, created a special
language that allows you to perform automatic generation of algorithms, but they are
not much easier task. A new algorithm for the generation of neural networks is achieved
by simply changing its architecture. It is possible to get a brand new solution to the
problem. Enter the correct selection rule that specifies better or worse a new neural
network solves the problem, and modification rules neural network, you can eventually
get a neural network, which will solve the problem correctly. All the neural network
model, a paradigm combined form a set of genetic algorithms. It is very clearly a
correlation of genetic algorithms and evolutionary theory (hence the typical terms:
population, genes, parent-child, crossover, mutation). Thus, there is the possibility of
creating such neural networks that have not been explored by researchers or not
amenable to analytical study, but nonetheless successfully solve problems. What
distinguishes the work being done by robots that can perform a man? Robots can have
qualities far superior ability of people: high precision, strength, reaction, lack of
fatigue. But at the same time they are just tools in the hands of man. There are jobs that
can only be done by man, and which can not be performed by robots (or need to create
unnecessarily complex robots). The main difference between man and robot – the
ability to adapt to changing conditions. Of course, almost all the robots there ability to
operate in several modes, to handle exceptions, but it was originally laid in a man.
Thus, the main drawback of robots – is the lack of autonomy (requires human control)
and the lack of adaptation to changing conditions (all possible situations laid him in
the making). In connection with this urgent problem of creating systems with such
properties. One way to create an autonomous system with the ability to adapt – is to
give it the ability to learn. At the same time, unlike conventional robots created with
pre-calculate the properties of such systems will have a certain degree of universality.
«Ключови въпроси в съвременната наука – 2015» • Том 18. Съвременни технологии на информации
43
3)
«Большие данные» в здравоохранении
Сегодня на анализ генома одного человека требуется целый месяц. Благо-
даря успехам в области анализа данных, скоро может наступить день, когда для
анализа одного человека потребуется всего лишь один день и начать индивиду-
альное лечение можно будет мгновенно. Значительные шаги в этом направлении
будут сделаны уже в 2015 г.
Изначально рассматриваемые как нечто узко-научное, «большие данные»
теперь стали практической вещью, которая способна спасать жизни. Возмож-
ность собирать, управлять и понимать смысл огромного объема данных о паци-
ентах позволяет определять тенденции, которые раньше нельзя было предста-
вить без технических достижений последних лет.
Все большее количество медицинских учреждений и специалистов внедряет
новые методики, включая использование устройств с расширенными сетевыми
возможностями для удаленного контроля состояния пациентов в домашних
условиях. Это не только повышает уровень удовлетворенности больных, но и со-
здает источники данных для анализа более широких тенденций, которые могут
привести к новым открытиям в области медицины. [8] Одним из последних но-
винок в этой сфере является гаджет, который способен поставить диагноз всего
за 15 минут заболеваний ВИЧ и сифилис.
Исследователи из Колумбийского университета в Нью-Йорке разработали
гаджет, который при подключении к смартфону способен диагностировать забо-
левания при помощи всего одной капли крови. Для диагностирования гаджет ис-
пользует специальные сменные пластиковые кассеты, которые заполнены реа-
гентами для обнаружения антител к ВИЧ, а также специфических антител к си-
филису. [9]
Рис. 5 – Гаджет, способный диагностировать заболевания ВИЧ и сифилис
Материали за XI международна научна практична конференция
44
Таким образом, был проведен обзор перспективных трендов из разнообраз-
ного количества новинок, которые производят фурор на рынке. Сегодня гаджеты
– это не только средства развлечения, а реальная помощь в различных сферах.
Время и технологии не стоят на месте, а все более развиваются и дают толчок
для развития более мощных и новых технологий.
Литература
1. URL:http://www.aphorism.ru/author/a8299.shtml
2. URL:http://club.cnews.ru/blogs/entry/strategicheski_vazhnye_tendentsii_201
5_goda_v_it
3. URL:http://www.liveinternet.ru/users/5205670/post349708399/
4. URL:http://www.3dnews.ru/906440 (дата обращения 18.02.2015)
5. URL:http://hitech.vesti.ru/news/view/id/6299
6. URL:http://remmag.ru/upload_data/files/01-2015/Intel.pdf
7. URL:http://www.macdigger.ru/iphone-ipod/besprovodnaya-zaryadka-wattup-
pozvolyaet-zaryazhat-gadzhety-na-rasstoyanii-do-5-metrov.html
8. URL:https://ru.intel.com/business/community/?automodule=blog&blogid=77
07&showentry=5132
9. URL:http://hi-news.ru/technology/razrabotan-gadzhet-kotoryj-sposoben-
postavit-diagnoz-vsego-za-15-minut.html
«Ключови въпроси в съвременната наука – 2015» • Том 18. Съвременни технологии на информации
45
РАБОТА С КОМПЮТЪР ИНЖЕНЕРСТВО
И ПЛАНИРАНЕ
*193496*
Kameshova S.S.
master of natural sciences
Kostanay state university named after A. Baytursynov, Kostanay, Kazakhstan.
THE POSSIBILITY OF UTILIZATION NEURON NETWORKS
FOR CONSTRUCTION SYSTEM IDENTIFICATION SPEECH
What is meant by speech recognition? This can be a speech-to-text recognition
and command execution, allocation of any speech characteristics (eg, speaker
identification, determination of his emotional state, gender, age, etc.) – all in different
sources may fall under this definition. In this paper, a speech recognition refers to the
assignment of speech sounds or sequences (phonemes, letters, words) to any class.
Then this class can be compared alphanumeric characters – we get a system convert
speech to text, or certain actions – get the system performance of voice commands. In
general, this method of processing speech information can be used on the first level of
a system with a much more complex structure. And the effectiveness of the classifier
performance will depend on the overall system.What problems arise in the construction
of a speech recognition system? The main feature of the speech signal that it varies
greatly on many parameters: duration, tempo, voice pitch, the distortions introduced
by the large variability in the human vocal tract, various emotional states of the speaker,
a strong difference of votes different people. Two temporary speech sound
representation even for one and the same person, recorded in the same time, will not
match. We must look for such parameters of the speech signal, which is fully described
by him (ie, allowed to distinguish one sound from another speech), but would have
been in some measure invariant with respect to the above-described variations of
speech. The thus obtained parameters must then be compared with the samples, and
this should be a simple comparison for coincidence and best fit search. This forces
them to seek the desired shape in the distance results parametric space.
Further, the amount of information that can store system, is not unlimited.
Remember how the almost infinite number of variations of speech signals? Obviously,
we can not do without some form of statistical averaging. Another problem – is the
speed of the database search. The more its size, the slower will be searched – this
statement is true, but only for ordinary sequential computers. And what else the
machine will be able to solve all the above problems? That's right, this neural network.
Classification – is one of the «favorite» for neural network applications. Moreover, the
neural network can perform classification even during training without a teacher (but
at the same time form a class do not make sense, but nothing prevents further associate
Достарыңызбен бөлісу: |