«Метаразметка текстов является существенной частью поискового аппарата
Корпуса. Под метаразметкой понимается приписывание тексту атрибутов, характе-
ризующихобстоятельства его создания, автора, тематику, жанровые особенности и
др. Метаразметканеобходима прежде всего для того, чтобы исследователь мог сос-
тавлять по своему желаниюпроизвольные выборки текстов с заданными внешними
параметрами: например, текстымемуарного характера, тексты, написанные мужчи-
нами, тексты, написанные авторами, родившимися между 1940и 1960 гг., тексты
автобиографий, тексты проповедей, текстыроманов и повестей, и т. д., и т. п» [1].
Метабелгіленімдер ғылыми-зерттеу жұмыстарында белгілі бір кезеңге, стильге,
авторға, тақырыпқа т. б. қатысты материалдар жинаудың таптырмас дереккөзі де-
сек те болады.
Метабелгіленімдер қойылған корпустардан зерттеушілер өзіне қажетті стиль, ке-
зең, автор т. б. ақпараттар бойынша мәлімметтерді тез тауып алуына мүмкіндік ала-
ды. Ал бұл жетістік қазіргідамыған еліміздің ғылыми-зерттеушілік әлеуетін, ғылым
мен білімді жан-жақты дамытатынбірден-бір күш екендігі сөзсіз. Корпустың қандай
мәтінмен жұмыс жасасақ та ең алдымен жинақталған мәтін туралы ақпарат беретін
метамәтіндік параметрлер нақтылануы қажет. Метамәтіндік белгіленімдер корпус-
тың қай түріне болмасын енгізілуге тиісті маңызды ақпараттар болып табылады
Жартылай метабелгіленім енгізу бағдарламасы 23 параметрден тұрады:
1) Автордың аты-жөні. Бұл параметрде автордың толық аты-жөні, болмаған жағ-
дайда бос қалдырылады.
2) Құрастырушы. Ұжымдық, жеке құрастырушылардың аты-жөні беріледі.
3) Мәтін аты. Бұл жерде мәтіннің атауы беріледі. (Мәтін оқулық ішінен алынған
тақырыптан алынса, тақырып атауы жазылады. Ал оқулық атауы дереккөзде көр-
сетіледі).
4) Мерзімі (жазылған уақыты). Мұндай белгіленімдер автордың шығарманы жазу
барысында мәтіннің соңында қалдырған мәліметтерден алынады.
5) Белгілеуші. Бұл жерге метабелгіленімді жасаған адамның аты-жөні жазылады.
6) Аудармашының аты-жөні. Мәтін аударма болған жағдайда аудармашының
аты-жөні көрсетіледі.
7) Автордың жынысы. Автордың жынысы мәтін авторы біреу болған жағдайда
көрсетіледі; яғни ер не әйел деп біреуі қойылады. Ұжымдық мәтін авторлары әр
түрлі жынысты болған жағдайда «ер/әйел» деген белгіленім қойылады.
8) Автордың туған уақыты. Автордың туған жылы, күні туралы нақты мәлімет-
тер көрсетіледі. Ұжымдық авторлар болған жағдайда бос қалдырылады.
9) Серия аты. Мәтін телеарна, радиодан алынған (ауызша, жазбаша) болса, бағ-
дарлама сериясы жазылады.
10) Аудитория жасы. Мектепке дейінгі, бастауыш мектеп жасы, жасөспірімдік
кезең, жастар әдебиеті, бейтарап.
11) Субкорпус. Газет мәтіндері, ауызша, мультимедиялық, көркем мәтіндер, поэ-
тикалық мәтіндер, оқыту, ғылыми-техникалық корпус, ісқағаз мәтіндері.
260
12) Мәтін хронотопы. Мәтінде суреттелген оқиғамен шамамен алғандағы мерзі-
мі, өткен орны көрсетіледі.
13) Стиль. Көсемсөз (публицистикалық), ғылыми-көпшілік, ғылыми стиль, ара-
лас, көркемсөз, ісқағаз, сөйлеу стильдері көрсетіледі.
14) Мәтін типі. Белгілі бір стильдің типтері көрсетіледі.
15) Сөзформа саны. Жеке файлда тұрған әрбір мәтінді ашқанда компьютер экра-
нының төменгі жағында сол мәтіндегі сөз саны шығып тұрады, осы сан метабелгі-
ленімге енгізіледі.
16) Таралым типі. Мәтіннің қай жерден алынғаны жазылады (газет, журнал, ға-
ламтор-ресурс, кітап, мультимедиа)
17) Мәтін формасы. Мәтіндер жазбаша мәтіндер болса, «жазбаша», егер видео/
аудио жазбалар болған жағдайда «ауызша»деген белгіленім қойылады.
18) Графика. Мәтіннің қандай графикада жазылғандығын көрсетеді (кирил жа-
зуы, латын жазуы, төте жазуы).
19) Мәтін тақырыбы. Тақырып белгілі бір салаға байланысты қойылады. Тақы-
рып көркем әдебиетке қойылмайды.
20) Мәтін көзі. Бұл жерде мәтін алынған дереккөзі көрсетіледі (баспа, көшірме
(сканер), интернет-ресурс, электронды көшірме, қолмен терілген, қағаз көшірме).
21) Корпусқа енгізілу уақыты. Мәтіннің корпусқа енгізілген мерзімі жазылады.
22) Жарық көрген уақыты. Кейбір мәтіндер (шығарма, монография, оқулық т.
б.) жазылған уақытында жарық көрсе, кейбірі кейін өңделіп қайта басылады. Бұл
жерде кітаптың жарыққа шыққан, яғни қайта басылып шыққан уақыты көрсетіледі.
23) Дереккөзі. Мәтіннің дереккөзі ретінде ол туралы толық ақпарат жазылады
(жері, баспа, жылы).
Жоғарыда аталған метабелгіленім параметрлері бойынша корпусқа енгізілетін
мәтіндерге белгіленім осы жартылай автоматты метабелгіленім қою бағдарламасы
арқылы жүзеге асады (1-сурет).
1-сурет –23 параметр енгізілген Метабелгіленім бағдарламасы
Демек, корпустың қандай түрін алсақ та, қандай мәтінмен жұмыс жасасақ та ең ал-
261
дымен жинақталған мәтін туралы ақпарат беретін метамәтіндік параметрлер компь-
ютерлікбазаға салынуы қажет. Сондықтан корпус құрастыруда метабелгіленімдер
(шығарма атауы, авторы, жылы, шыққан орны, стилі, жанры, көлемі т. б.) жасаудың
әдіс-тәсілдерін, түрлерін, компьютерлік бағдарламаларын т. б. зерттеудің маңызы зор.
Қазақ тілінің үлттық корпусы тиімді құрастырылып, өз дәрежесінде қолданыс-
қаенгізілуі үшін әлемдік тәжірибедегі метабелгіленімдер қоюдың ортақ ұстаным-
дары мен әдіс-тәсілдерін зерттеу қажет. Ал бұл жетістік қазіргі дамыған еліміздің
ғылыми-зерттеушілік әлеуетін, ғылым мен білімді жан-жақты дамытатын бірден-
бір күш екендігі сөзсіз.
жүктеу/скачать Достарыңызбен бөлісу: |