Орындаған: Иемберді Инабат


Цифрлендірілген мəтіндердің базасы корпус белгісінің көмегімен арнайы өңделеді, ал электронды кітапханалар мұндай өңдеуден өтпейді



бет3/5
Дата31.12.2021
өлшемі21,25 Kb.
#23380
1   2   3   4   5
Байланысты:
Иемберді Инабат 15-семинар инв тех

Цифрлендірілген мəтіндердің базасы корпус белгісінің көмегімен арнайы өңделеді, ал электронды кітапханалар мұндай өңдеуден өтпейді. Дəл осы белгі корпусты түбегейлі тілдің қолданылуы мен өзгеруі жайлы ақпараттың жаңа жəне объективті дереккөзіне айналдырады. Белгі (аннотация, код) – мəтіндердің жəне олардың бірліктеріне тəн қасиеттер жайлы арнайы лингвистикалық ақпарат беретін корпустың негізгі сипаттамасы. Корпустың белгісі дəлірек жəне əрқилырақ болған сайын оның əлеуметтік, ғылыми жəне оқыту құндылығы жоғарырақ болады. Кейбір корпустар аз ғана белгімен қанағаттанса, кейбіреулерін де белгі ұдайы жетілдіріліп отырады, мы салы, Орыс тілінің ұлттық корпусы [www.ruscorpora.ru] метамəтіндік (мəтіндерге авторы, тақырыбы, жанры, жазылған уақыты жəне орны т.б. жайлы атрибуттарды қосып жазу, олар сұрыптау өлшемдерін беруге мүмкіндік береді, мысалы, ер адам жазған мəтіндер, нақты

бір кезеңде жазылған мəтіндер, көбелек жайлы жазылған мəтіндер жəне т.б.сондай-ақ корпустың шағын бөліктерімен жұмыс істеуге жағдай жасайды), морфологиялық (омонимияны алу, əрбір бірлікке арнайы жасалған таңбалар жүйесінің көмегімен морфологиялық белгілерді қосып жазу, мысалы, сөз таптарына тиесілілігі, сөзформасының грамматикалық белгілері (септеу, көптік, вид, шақ, рай жəне т.б.), акценттік (корпус бірлігіне екпін жəне басқа просодиялық сипаттамаларды қосып жазу), лексика-семантикалық (бірлікке семантикалық белгілерді қосып жазу, мысалы, 'лицо', 'вещество', 'пространство', 'скорость', 'движение', 'обладание', 'свойство человека', 'отглагольное имя' жəне т.б., сөйтіп бір бірлік бірнеше кластың фасеттік сипаттамаларын алуы мүмкін), синтаксистік белгілерге (тəуелдік ағашы, синтаксистік қатынас атаулары жəне т.б.) негізделген.

Мəтіндердің белгісі интерактивті режимде бірнеше кезеңде автоматты түрде немесе жартылай автоматты түрде арнайы құрылған программалардың көмегімен жəне толықтырылып отыратын жұмыстық сөздіктерді қолдана отырып жүзеге асырыла алады.





Достарыңызбен бөлісу:
1   2   3   4   5




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет