3. Қазақ күрделі сөздерін формалдауережелері Күрделі сөздер жасалу жолына қарай кіріккен сөздер (бүгін, жаздыгүні, биыл), біріккен
сөздер (баспасөз, елтаңба, елбасы, Темірқазық), қос сөздер (үлкен-кіші, аяқ-табақ), қысқарған
сөздер (ЕҰУ, АҚШ, БҰҰ), тіркесті сөздер (таң намаз, қара торғай, қара көк, жүз бес) болып
бөлінеді.
Таңбалық амалдардың барлығы «Компьютерлік лингвистика» деген тiлдiң құрамы мен
қасиеттерiн зерттейтiн ғылым саласында анықталған. Таңбаларда анықталған амалдар
арқылы таңбалық өрнектер құрастырылады. Таңбалық өрнектерді өңдеп көрсету үшін таңбалық амалдардың ассоциативтік,
дистрибутивтік және басқа заңдылықтары пайдаланылады /13/, /14/, /15/. Осындай
заңдылықтар берілген күрделі өрнектерді қарапайымдап, ондағы амалдар санын қысқартады
және олардың орындалуын жеңілдетеді. Олардың практикадағы маңызы өте зор.
Таңбаларда берiлген екi таңбалық тiзбеден бiр таңбалық тізбе құруға мүмкiндiк беретiн
құрастыру амалдары анықталған.
Күрделі сөздердің жасалу жолдарын компьютерлік лингвистика көмегімен формалдауды
қарастырайық. Кез келген тілден таңба ретінде бөлінбейтін бірлік (фонема-дыбыс, графема- әріп, цифр, тыныс белгісі, жақша және т.б.) немесе құрылымдық бірлік (морфема, лексема және т.б.) алынады. Берiлген таңбалармен жұмыс істеу үшін осы таңбаларға амалдар қолдану керек. Ал амалдарды қолдана бiлу үшiн олардың анықтамаларын, белгiлерiн және
қасиеттерiн бiлу қажет.
Таңбаларда берiлген екi таңбалық тiзбеден бiр таңбалық тізбе құруға мүмкiндiк беретiн
құрастыру амалдары анықталған.
Құрастыру амалдарының iшiнде ең қарапайымы – конкатенация (тiркеу) амалы. Егер бұл
амалды ‘
’ таңбасымен белгiлесек, онда оны берілген екі айнымалы таңбалық шамалар