119
бұл түндi ұйқысыз өткiздi
деген
сөйлемдегі сөздерге жеке-жеке
морфологиялық талдау төмендегіше жасалды:
таң
{
таң
– зат: жалпы, дара,
түбір, дерексіз + Ø жекеше + Ø септік, ілік};
алдында
{
алд
– көмекші есім:
дара, түбір + Ø жекеше + тәуелдік, 3-жақ + септік, жатыс};
бiр
{
бiр
– сын:
дара,
түбір,
есептік}
ғана
{
ғана
– шылау: дара, түбір, демеулік};
сағат
{
сағат
– зат: жалпы, дара,
түбір, деректі + Ø жекеше + Ø септік, ілік};
мызғығаны
{
мызғы
– етістік:
дара, түбір, негізгі, салт + есімше + тәуелдік, 3-жақ + Ø септік, атау};
болмаса
{
болмаса
– шылау: дара, түбір, жалғаулық};
Абай
{
Абай
– зат:
жалқы, дара, түбір, деректі + Ø жекеше + Ø септік, атау};
бұл
{
бұл
– есімдік:
дара,
түбір,
сілтеу
+
Ø
жекеше
+
Ø
септік,
атау};
түндi
{
түн
– зат: жалпы, дара, түбір, дерексіз + Ø жекеше + септік, табыс};
ұйқысыз
{
ұйқысыз
– сын: дара, туынды, қатыстық};
өткiздi
{
өт
– етістік:
дара, түбір, негізгі, салт + функционалды жұрнақ + жедел өткен шақ + Ø рай,
ашық + Ø жіктік, 3-жақ, Ø жекеше}. Осы сөйлемдегі жеке сөздерге жасалған
морфологиялық талдаудың негізгі принциптері мен қойылған шартты
белгілерге төмендегідей түсініктеме беріледі:
-мәтіндегі
сөздер
қара
бояумен
(
мызғығаны)
бөлек алынады;
- одан кейін ирек жақша қойылып, осы сөздің реестрге енетін тұлғасынан
кейін
«–»
белгісі
арқылы
негізгі
грамматикалық
сипаттамасы
беріледі:
мызғы
– етістік: дара, түбір, негізгі, салт;
- «+» белгісі қойылып, осы сөзге жалғанған (жалғануы мүмкін)
грамматикалық форма (бірнешеу болса, араларына «+» белгісі қойылады)
беріледі: «+ есімше + тәуелдік, 3-жақ + Ø септік, атау». Мұндағы «+» белгісі
сөздің түбіріне немесе оған жалғанған қосымшаға жұрнақ немесе жалғау
жалғанып тұрғандығын, ал «Ø» символы атау септік тұлғасының контексте
әрқашан «нөлдік формада» тұратындығын білдіреді;
- сөз құрамындағы барлық грамматикалық формалар берілгеннен кейін
ирек жақша жабылады (3).
Мәтіндегі сөздерге морфологиялық талдау жасағанда қойылатын шартты
белгілер сөз табының ерекшеліктеріне байланысты. Мәселен, «Ø»
морфологиялық белгі шартты түрде «нөлдік форма» орнына қолданылады.
Жалпы
лингвистикалық корпусы жасалған тілдер қатарынан ағылшын
ұлттық тілі корпусын, неміс ұлттық тілі корпусын
жатқыза аламыз
,
сондай-ақ
орыс ұлттық корпусы, қытай тілінің ұлттық корпусы, португал тілінің
корпусы, хорват ұлттық корпусы, чех ұлттық корпусы, қырым татарлары
тілінің корпусы жасалған.
Лингвистикалық корпус түрлерін төмендегі сайттардан көруге болады:
Достарыңызбен бөлісу: