Реформа казахского языка: от варваризмов – к кодифицированности
2025 ж. 27 маусым
166
0

Последние годы примечательны тем, что для развития казахского языка были обозначены многие конкретные вопросы и проблемы, научное их освещение, пути их решения, которые реально стали решаться. Например, при решении некоторых проблем началось увеличение информационного контента на казахском языке, идёт работа по созданию корпуса казахского языка, цифровизации языковой среды, развитию функции межнационального языка и др.
НАУЧНЫЕ МЕТОДЫ РЕШЕНИЯ ЯЗЫКОВЫХ ПРОБЛЕМ
Следует отметить, что больше стали использоваться научные методы и пути решения языковых проблем вместо ранее принятых научно необоснованных, непродуманных проектов, программ, популистских предложений расширения сфер использования государственного языка, политизации языковых процессов, митингов, лозунгов и т.д.
Вспомним хотя бы культурный проект «Триединство языков», негативно повлиявший на учебный процесс в школах страны в тот период: на его продвижение было потрачено вхолостую много средств и времени. В итоге основное внимание государства, общества и специалистов было уделено повсеместному изучению английского языка в ущерб государственному, когда учителей отправляли на курсы переподготовки для преподавания на английском языке четырех предметов с 2019 года.
Ведь языковую ситуацию осложняло то обстоятельство, что проект «Триединство языков» официально подавался как трехъязычие (триединство языков), т.е. обязательное, массовое знание трех языков, хотя научно должно было как трехъязычное образование – два обязательных языка и английский как иностранный.
После отмены проекта «Триединство языков», принятия «Концепции развития языковой политики в Республике Казахстан на 2023 – 2029 годы» и других мероприятий казахский язык постепенно, планомерно стал расширять сферы своего применения. Ныне формируется национальный словарный фонд казахского языка, разрабатывается электронный фонд языка, с 22 февраля 2025 года вступили в силу новые правила, способствующие использованию искусственного интеллекта для генерации контента на казахском языке, что должно привести к единообразию употребления государственного языка и т.д.
Например, кыргызский депутат Нуржигит Кадырбеков посетовал на то, что его дочери начали разговаривать на казахском языке. Об этом он сказал в 2022 году на заседании Жогорку Кенеша. По его словам, дочери смотрят казахский канал «Балапан», который вещает только на казахском языке, поэтому они быстро его выучили.
С позиции социальной лингвистики, в последние годы появились базовые основы для изучения государственного языка: сформирована языковая среда, сфера обслуживания сегодня почти везде на государственном языке. Создана языковая инфраструктура: во всех регионах Казахстана в том или ином формате действуют бесплатные и коммерческие клубы разговорного казахского или специальные курсы.
Сформирована методическая база: появилось немало неплохих учебников, пособий по изучению казахского, в том числе электронные ресурсы, где можно бесплатно, не выходя из дома, обучаться языку. Эти несомненные достижения дают возможности для обучения.
В 2024 году Институт умных систем и искусственного интеллекта (ISSAI) при Назарбаев университете представил первое многофункциональное казахстанское приложение Soyle App, которое можно использовать для распознавания речи, синтеза голоса и перевода текста и речи на четырех языках.
В настоящее время правительством большое внимание уделяется созданию национального корпуса казахского языка и развитию казахского как языка науки.
Ещё в 2012 году я поднимал проблему создания национального корпуса казахского языка в статье «Как можно развивать язык без науки?». В ней, в частности, сказано: «Статусному положению языка, политическим и законодательным мерам должно быть соответственное сугубо лингвистическое наполнение, и в этом плане появилась проблема корпусного планирования – попытки стандартизировать, упорядочить и систематизировать язык. Т.е. статус языка предполагает соответствующий корпус языка. В последнее время под корпусом языка понимается и информационно-справочная система, основанная на собрании текстов на некотором языке (в электронной форме). Туда попадает то, что считается характерным для данного языка. Должны быть представлены все жанры: художественные, нехудожественные тексты, юридические, публицистические и т.д. Если нужно серьезно изучать язык, то для этого нужен корпус. Другими словами, это реальное состояние и функционирование языка в жизни общества, государства, его функциональные возможности» (Как можно развивать язык без науки? 19.06.2012, https://qazaquni.kz/kogam/12528-kak-mozhno-razvivat-yazyik-bez-nauki).
ИИ ДЛЯ РАЗВИТИЯ КАЗАХСКОГО ЯЗЫКА
В условиях глобализации и повсеместной цифровизации, информатизации любой язык, чтобы выжить и развиваться, должен войти в компьютерные технологии, программы как язык хранения, обработки и передачи информации, стать языком доступной информации, необходимой для работы, обучения, науки, экономики, политики, решения различных задач, без излишних сложностей и барьеров, коммуникации в мировой компьютерной сети интернет.
Эта информация должна быть представлена в понятной форме и легко доступна для тех, кому она необходима. Сегодня концепция цифровой доступности затрагивает практически все сферы, от образования и трудоустройства до социальных взаимодействий и развлечений.
Раз идёт тенденция к расширению сферы применения казахского языка, то надо изучить все проблемы, которые мешают ей, и по мере возможностей разрешать их.
В этом отношении активная работа ведётся «Национальным научно-практическим центром «Тіл-Қазына» имени Ш. Шаяхметова», где разрабатываются разнообразные проекты и исследования, в частности по развитию казахского языка в цифровом пространстве, внедрению искусственного интеллекта во все сферы жизнедеятельности и др.
Как сообщил в 2023 году официальный информационный ресурс Премьер-министра РК, около 170 тысяч пользователей прошли обучение на отечественных языковых онлайн-платформах «Тіл құрал» (5-ти уровневая система) и «Бала тілі» (ориентирована на детей до 9 лет). Еще одно новшество – платформа «Termincom.kz», которая уже насчитывает около 400 тысяч терминов. Портал представляет собой базу для их систематизации. В данную работу вовлечены специалисты соответствующих отраслей.
Предстоит работа и над юридической терминологией на казахском языке. Основная задача – унифицировать термины при составлении нормативно-правовых актов и в делопроизводстве.
IT-проекты и различные платформы развития казахского языка разработаны в центре «Тіл-Қазына», как «Emle.kz», «Termincom.kz», «Sozdikqor.kz», «Qazcorpora.kz», которые удобны в использовании в повседневной работе различных специалистов, журналистов, а также Telegram боте на казахском языке Speech to Text & Text to Speach.
Генеральный директор республиканского национально-научно-практического центра «Тіл-Қазына» Макпал Жумабай рассказала, что для обучения искусственного интеллекта нужно большое количество данных. Тогда он сможет правильно использовать казахский язык. В общей сложности требуется как минимум 40 миллиардов токенов информации – то есть 40 миллиардов случаев, когда слова используются в разных контекстах.
Макпал Жумабай заявила: «За год мы собрали около 2 миллиардов. Это хороший старт для Казахстана, но по мировым меркам мало. Чтобы улучшить ситуацию, важно создавать больше контента на казахском: писать книги, выпускать статьи, добавлять любые качественные данные в общий банк знаний.
Уже собрали материалы за последние 30 лет: книги, научные статьи, телевизионные программы, газеты, журналы, методические пособия и диссертации. Обработали все доступные данные, которые не относятся к государственным секретам. Мы завершили анализ текстов XX века и сейчас по собственной инициативе начинаем работать с текстами XIX века» (https://digitalbusiness.kz/2024-11-22/pochemu-vazhno-razvivat-tehnicheskiy-kazahskiy-yazik-mnenie-ekspertov/).
Министерство науки совместно с Министерством цифровизации создало крупный консорциум, в который вошли Казахский национальный университет имени аль-Фараби и Евразийский национальный университет имени Л.Н. Гумилева, а также организация «Тіл-Қазына».
Сейчас формируется база на казахском языке, включающая 48 тысяч шаблонов документов: заявления, жалобы, автобиографии. На их основе обучат языковые модели, чтобы в будущем они могли без ошибок справляться с запросами пользователей. Над этим работают лингвисты, привлекаются узкие специалисты, которые могут разъяснить нюансы и применение терминов.
РЕФОРМА: ОТ ВАРВАРИЗМОВ – К КОДИФИЦИРОВАННОСТИ
Новые правила, способствующие использованию искусственного интеллекта для генерации контента на казахском языке, должны привести к единообразию употребления государственного языка и т.д. В то же время они должны сопровождаться введением новых слов и терминов лингвистами, профильными специалистами, писателями, журналистами и т.д.
Если рассматривать казахский язык через призму новых слов, терминов, заимствований, то ему необходима государственная научная, цифровая и информационная поддержка. Для этого необходимо развитие научной базы языка, развитость корпуса языка (и корпусной лингвистики), нормированность и кодифицированность языка и др. В этом направлении начата большая работа.
Один из главных признаков литературного языка – его нормированность (наличие норм) и кодифицированность (описание норм в справочниках, словарях). Нормированность подразумевает наличие правил и предписаний, регулирующих использование языковых средств (произношение, грамматика, лексика) в литературном языке.
Кодифицированность языка – это процесс упорядочения и фиксации норм языка в специальных источниках, таких как словари, грамматики и справочники, с целью придания ему стабильности и единообразия. То есть кодифицированный язык – это язык, подвергшийся обработке в соответствии с языковыми нормами.
Стандартизированность языка (или языковая стандартизация) – это процесс приведения языковых норм к единому, кодифицированному образцу, который считается нормой для данного языка.
Например, русский язык – нормированный, кодифицированный, и для него разработаны компьютерные программы, которые показывают в любом тексте при его наборе орфографические, грамматические и стилистические ошибки и погрешности.
И комплексная реформа казахского языка с изменением лексики, стилистики, орфографии и т.д. должна в итоге сделать язык кодифицированным, для которого будут «подвластны» многие компьютерные программы.
В данное время Google Переводчик с казахского на русский и с русского на казахский нередко выдает тексты, которые трудно понять по смыслу, некоторые слова не переводятся, часто даётся дословный перевод и т.д.
В то время как онлайн переводчик с английского на русский выдаёт адекватный, идентичный текст по смыслу первоисточнику. По этой причине можно читать новости, рефераты и т.д. в переводе с английского языка на русский без редактирования.
Нейросети, обученные казахскому языку, для автоматического перевода тоже нередко выдают тексты, которые трудно понять. Это взаимосвязанный процесс: искусственный интеллект не создаёт новые слова, термины, выражения, он использует устоявшиеся в печатной литературе языковые явления, поэтому переводчики часто сталкиваются с неточным, дословным переводом, когда используют онлайн переводчик.
Научная лексика в развитых языках является неотъемлемой частью лексического состава и играет большую роль в развитии языка, не говоря об образовании, самой науке и экономике. Логика научного подхода требует, чтобы эту проблему решали специалисты различных отраслей науки, – какие отраслевые термины нужны.
Ведь в казахском языке очень много русских слов и терминов, которые пишутся не по нормам, законам казахской фонетики и орфографии. Это так называемые варваризмы, которые из-за своей многочисленности являются препятствием для развития языка в плане формирования национального корпуса, становления норм, развития стандартизации и кодифицированности.
Варваризмы – это иностранные слова или выражения, которые используются в речи и не полностью адаптированы к нормам заимствующего языка. Они могут восприниматься как чужеродные элементы и, как правило, не соответствуют общепринятым языковым нормам. Понятно, что отдельные из них со временем могут войти в лексический состав языка.
Варваризмы, в отличие от заимствований, не всегда полностью ассимилируются в языке. Они могут сохранять свою оригинальную форму и графику, и их использование может рассматриваться как стилистическая ошибка или намеренное нарушение языковой нормы.
Например, в русском языке слова и выражения: «de facto» вместо «фактически» «ланч» вместо «обед», «о'кей», «Как денди лондонский одет» (А. С. Пушкин, «Евгений Онегин») и др.
Важно отличать варваризмы от заимствований. Заимствования, как правило, проходят процесс адаптации и становятся частью словарного состава языка. Варваризмы же часто остаются чужеродными элементами, не полностью интегрированными в язык, как русские слова в казахском языке.
Но когда слишком много варваризмов (иностранных слов), сразу употреблённых вместе, как в казахском языке, в рамках одного текста, сделают высказывание совершенно непонятным. Не говоря о том, что это ведёт к снижению уровня культуры речи, обеднению языка, к его ненормированности и т.д.
Например, при попытке перевести «обычные» слова – троллейбус, ванна, коньки, плинтус, куртка, костюм, юбка, туфли и др. – с помощью русско-казахского словаря или Google Переводчика на казахский язык получите «казахские» слова без изменений. А ведь в казахском кроме «обычных» слов – сотни тысяч терминов из русского языка.
ПОЧЕМУ ОСТАНОВИЛАСЬ ЛЕКСИЧЕСКАЯ РЕФОРМА?
Поэтому актуальна замена русских слов, которые не являются заимствованиями, на казахские варианты. В своё время ввели небольшое количество новых слов (ұшақ, сынып, пайыз, әуежай, мұрағат, мұражай, әнұран, елтаңба и др.), и они удачно вошли в лексический состав казахского языка и обогатили его. Хотя это было только начало, эту работу надо продолжить – огромное количество так называемых заимствований из русского языка (а на деле – русских слов) необходимо менять лексически, фонетически, грамматически и т.д.
Возможности большие: можно брать аналоги из староказахского, тюркских, древнетюркских, европейских, арабских, русского и др. языков. При реформировании турецкого языка знатоки ездили по отдаленным районам и собирали диалектные слова, брали слова из тюркских, европейских языков, нередко просто придумывали новые слова.
Возможно, из-за критики некоторых неудачных новых слов остановили лексическую реформу. Но без «смешных» нововведений не бывает реформ – и русский язык в своё время прошел через мокроступы (калоши), шаротык (бильярд) и т.д.
Однако впоследствии выяснилось, что неизвестные шутники перевели слово «баклажан» как «жертатақ», «балкон» как «қылтима» (то, что торчит), «банан» как «сарықисық» (в дословном переводе означает «желто-кривой»). В итоге в СМИ подали эти «нововведения» как работу языковедов, оценив их как насмешку над языком. А вот перевод слова «фонтан» («шаптырма») действительно предлагался официально, но не был утвержден.
Поэтому по-прежнему очень актуален вопрос, кто или что мешал изменению произношения букв и слов согласно казахской фонетике и орфоэпии: кінәз (князь), туфіли (туфли), фантан (фонтан), дұш (душ, ср. дұшпан), балқон (балкон, ср. бал, қон), стақан (стакан, ср. тостаған) и т.д.?
Ведь это к тому же освобождение казахского языка от неприсущих ему букв (ь, ъ, ё, щ, э и др.) русского алфавита, которые разрушают фонетическую природу языка, ведут к обеднению лексики и эрозии языка. Можно было их не использовать в новых словарях, но этого не произошло: мол, сложилась привычка так писать (например, туфли) – мол, будут смеяться, если будем писать: төпли, белесепед, подиез, енергетік, естетік, інстетөт и т.д.
Между тем в социальных сетях, мессенджерах, статьях знатоки казахского языка без всякой боязни используют такие и другие казахские варианты слов вместо русских оригиналов.
По этой причине обсуждение языковых проблем надо вынести на суд общества, на широкую общественную площадку: обсуждать на сайтах с комментированием, на страницах газет и журналов, в социальных сетях (например, в Facebook создать группу) и т. д. С привлечением казахскоязычных специалистов разных отраслей, языковедов, писателей, поэтов, журналистов, знатоков казахского языка, чтобы всем миром искать пути и решения языковых проблем и добиться соответствующего финансирования. И есть надежда, что в ходе дискуссий будут предложены решения лексических проблем, национальные термины, эквиваленты русских слов и терминов в казахском языке, появятся реформаторы казахского языка в научной сфере и т. д.
Достаточно просмотреть, к примеру, орфографический словарь под редакцией профессора Р.Сыздык на буквы «в», «ё», «ф», «ц», «ч», «щ», «э», «ю», «я» – все слова в русской орфографии! На буквы «г», «б», «д», «и», «к», «л», «п», «р», «х» – внушительное количество русских слов, порой около половины! Эти слова заметно «подтачивают» язык. Такая же картина и в казахско-русских словарях.
СДЕЛАТЬ КАЗАХСКИЙ ЯЗЫК НОРМИРОВАННЫМ
В казахском языке сложились два противоречащих принципа заимствования: естественный или научный – түрме (тюрьма), жәрмеңке (ярмарка), пәтер (квартира), кәмпит (конфета) и т.д. и советский «насильственый» – велосипед, циркуль, объект, тротуар, чемодан и др.
Ранние заимствования, вроде кереует (кровать), самауыр (самовар), Мөскеу (Москва), Ресей (Россия), бөтелке (бутылка), бөрене (бревно) и т.д., вошли в лексический состав языка. В советское же время в нарастающем темпе в казахском языке образовался целый пласт русских слов. Он не только обеднил язык и превратил его в «казахско-русский диалект», но и вызвал «эрозию» языка.
Это небывалый случай – «подтягивать» фонемный строй языка до строя иноязычных слов! Заимствования из русского языка остались таковыми – чужеродными; по этой причине большинство из них не используются в поэзии, художественной прозе, заметно обедняя ее язык.
Кроме нарушения фонетической, синтаксической, орфоэпической и др. системы казахского языка, эти слова снижают функциональные возможности языка и препятствуют естественным заимствованиям из других языков, в том числе и русского.
Требования советских идеологов «не извращать в национальных языках советизмы и интернациональные слова» в сфере языкового заимствования приобрели следующие ненаучные принципы: заимствовать новые слова только из русского языка, писать в русской орфографии, не переводить их. В итоге в казахском образовался «миниязык», целый пласт русских слов, которые засорили язык.
Между заимствованиями в русском языке и их европейскими оригиналами есть фонетические, морфологические отличия: семинар – seminarium, лауреат – laureates, мавзолей – mausoleion и т.д. Конечно, в русском много заимствований без изменений, когда есть фонетическое соответствие.
Близость в морфологии, словообразовании позволила русскому языку заимствовать и некоторые приставки, суффиксы из европейских языков. Система же казахского языка (фонетическая, морфологическая, словообразовательная и т.д.) сильно отличается как от русской, так и европейской.
Казахский относится к агглютинативному типу («приклеивание»), при котором к неизменяемой основе или корню присоединяются однозначные стандартные аффиксы: бала-лар-ыңыз-ға (вашим детям). Русский – к флективному (взаимопроникновение морфем), когда к изменяемой основе или корню присоединяются «сложнозначные» аффиксы: мужик+ск(ий)> мужицкий. Поэтому аффиксы в этих типах не равнозначны.
Слово псевдопатриотизм – русское слово, хотя все морфемы (псевдо-, патриот, -изм) из европейских языков, потому что эти морфемы участвуют в русском словообразовании. В казахском же они чужеродны фонетически и морфологически.
И до сих пор в казахской лингвистике не разработаны научные принципы заимствования. Проблема заключается в необходимости заимствования терминов и «обычных» слов из языка оригинала, а не из русского языка-посредника, замены русских слов подходящими словами из тюркских, европейских и других языков или их переводом на казахский.
Для развития казахского языка лучше реформировать его на нынешней графике: убрать ненужные буквы вроде ъ, ь, ё, щ, привести термины и заимствованные слова в соответствие с казахской фонетикой, орфографией, перевести или оставить в международной форме.
При переходе на латинский алфавит наши языковеды в большей степени опирались на алфавит Ахмета Байтурсынова начала ХХ века: латиница состоит из 30 букв и двух диграфов, остальные буквы из нынешнего алфавита не вошли в нее. Для художественной литературы алфавит начала ХХ века был оптимален.
Если ориентироваться на этот алфавит, то необходимы заимствования из современного турецкого, тюркских, европейских языков.
За прошедший век произошли заметные изменения в науке, образовании, экономике, промышленности и т.д., существенно изменился образ жизни казахов. Эти изменения отразились и в языке, перенявшем большое количество международных терминов и слов. Это обогатило язык, с ними появились и новые фонемы, такие как «в», «ф», «ц» и др.
Казахский язык конца ХХ и начала XXI века существенно изменился по сравнению с языком XIX века по своей фонетической основе.
Здесь есть вроде противоречие: русские слова заметно обедняют казахский язык, в то же время международные термины и слова вошли в лексический состав казахского языка. И это действительно так: многие слова вошли в лексику, в то же время другие вызывают «эрозию» языка.
Проблема состоит в определении таких тонкостей, а также в том, чтобы ввести языковые нормы и написать Орфографический словарь казахского языка с навсегда закрепленными языковыми стандартами, например «туфіли» вместо «туфли», «белесепед» вместо «велосипед» и т.д.
В последние десятилетия ускорились глобализационные процессы: интернет, новые технологии, новые виды связи вносят массу новых понятий, слов и терминов. Будет большая проблема с функционированием международных терминов и слов в казахском языке, проблемы для развития науки и образования, если ориентироваться на алфавит Байтурсынова. И для их «переваривания» необходима развитая фонетическая и графическая система языка.
По этой причине необходимо обсуждение в обществе, среди специалистов: какая должна быть фонетическая основа казахского языка? Оставить ли в ней из-за международных терминов такие фонемы (буквы), как «в», «ф», «ц», «я», «ю» и др. Из этих букв больше споров по букве «ц».
Кстати, я противник полного перевода медицинских терминов на казахский язык – вся терминология, как в целом сама медицина в основном из западных стран, и основные термины необходимы для взаимопонимания медиков при лечении больных, а также для адекватного понимания объекта или явления медицины. И здесь надо дать слово специалистам, знатокам из отечественной медицины.
Вместо заключения. Реформировать казахский язык на основе кириллического алфавита, сделать казахский язык кодифицированным (нормированным), узаконить написание большинства слов, довести до конца работу с международными терминами по международным правилам и т.д. Это научный и осмысленный подход к решению языковых проблем.
Дастан ЕЛДЕС