(НКРЯ - ОТҰК) құрамындағы мультимедиялық шағын корпусты
(субкорпусты) атауға болады.
Электрондық форматтағы ауызша жәнә жазбаша
материалдарға қолжетімдік теңгерімі әлі де ұзаққа
созылады. Оның себебін әртүрлі себептермен ауызша
тіл корпустарын құрастыру жазба тіл корпустарын
құрастырудан барынша баяу жүріп жатқандығымен
түсіндіруге болады. Мұны жолға қою үшін ең алдымен,
ауызша тілді жазып алудың (есте сақтаудың) бір
амалын табу керек - мысалы, магниттік лента
көмегімен, цифрлік жазбалар арқылы немесе
видеокассеталарға жазу. Содан кейін, оларды
әріптермен жазып алу қажеттігі туындайды, әрине
мұндай әрекет барынша жалықтыратын жұмыс болуы
және қымбатқа түсуі мүмкін, себебі, ондай жазбаның
сапасы табиғи жағдайдағы сырт ортаның шулы-шусыз
жағдайына байланысты болады.
1. Транскрипциялау үшін қандай алгоритм қолдану
қажет?
2. Айтылу кезінде сөйлеуші факторы есепке алына ма?
3. Ауызша мәтін толық ескерілу керек пе, әлде тек оның
фрагменті ғана ма?
4. Сөздің айтылуында диалектілік варианттар ескеріле ме?
5. Айтылу кезінде сөздердегі екпін ескеріле ме?
6. Фразалар айтылғанда просодиялық белгілер ескеріле
ме?
7. Тыңдау кезінде танылмаған сөздерді арнайы белгілеу
қажет пе?
8. Фонетикалық корпус үшін паралингвистикалық
құбылыстарды, ілеспелі дыбыстарды (кідіріс, күлкі,
жөтел, міңгірлеу және т.б.) белгілеу қажет пе?
Фонетикалық лингвистикалық ресурстарды
құрастырудағы басты күрделілік ауызша тілді
транскрипциялау қажеттігіне байланысты. Мұндай
жағдайда келесі мәселелер туындайды:
|