Падлічыць усе словы мовы

09.03.2016

Напярэдадні прэзентацыі Канкарданса беларускай мовы ХІХ стагоддзя — ўнікальнага для Беларусі электроннага выдання, якое змяшчае абсалютна ўсе словы тэкстаў беларускай літаратуры за азначаны перыяд, Наука Беларуси пагутарыла з аўтарам праекта – навуковым супрацоўнікам аддзела славянскага і тэарэтычнага мовазнаўства Інстытута мовазнаўства імя Якуба Коласа Нінай Міхайлаўнай Сянкевіч аб тым што такое Канкарданс і чым ён можа быць цікавым, як даследчыкам беларускай мовы, так і простым чытачам.

— Ніна Міхайлаўна, што такое наогул «канкарданс» беларускай мовы, для чаго і каму ён можа быць патрэбны?

— Канкарданс – гэта даведнік, які змяшчае ўсе без выключэння словы тэксту (ці корпуса тэкстаў) з поўным пералікам іх кантэкстаў і дакладных адрасоў. Складальнікі канкардансаў могуць уключаць у канкарданс самую разнастайную інфармацыю, якую можна “выцягнуць” з тэксту (колькасныя паказчыкі, граматычную інфармацыю аб слове, спісы амонімаў і г.д.), але вызначальным з’яўляецца менавіта поўны спіс словаўжыванняў і кантэкст для кожнага з іх. Канкарданс беларускай мовы ХІХ ст. уяўляе сабой комплекс слоўнікаў, які, акрамя ўласна канкарданса, уключае частотныя слоўнікі (як агульны, так і асобныя для празаічных і вершаваных твораў), паказальнік слоў і адваротны слоўнік, а таксама тэксты усіх твораў, на якіх ён пабудаваны, і спісы гэтых твораў.

Сенкевич Нина МихайловнаКаму Канкарданс можа быць патрэбны? Па-першае, мовазнаўцам, якія ствараюць слоўнікі рознага кшталту (тлумачальныя, этымалагічныя, анамастычныя, слоўнікі мовы пісьменніка і інш.). Канкарданс, які змяшчае поўны спіс словаўжыванняў тэксту, дазваляе лёгка знайсці слова, якое цікавіць лексікографа, а поўны пералік кантэкстаў дапамагае семантызаваць яго. Таму канкарданс з’яўляецца добрай альтэрнатывай традыцыйным картатэкам. З яго дапамогай значна лягчэй сфарміраваць рэестр слоўніка. Таксама канкарданс будзе карысны тым, хто праводзіць рознабаковыя даследаванні беларускай літаратурнай мовы і мовы асобных аўтараў, таму што ў склад канкарданса ўваходзяць аўтарскія канкардансы В. Дуніна-Марцінкевіча, А. Ельскага, К. Каганца і К. Каліноўскага. Мову іншых аўтараў можна прааналізаваць, вылучыўшы неабходныя звесткі з агульнага канкарданса.

Не буду пералічваць усе напрамкі даследаванняў, якія можна правесці на аснове канкарданса. Прывяду вось такі прыклад. На нядаўняй навуковай канферэнцыі даследчыца мовы У. Караткевіча расказала пра праведзены аналіз ужывання пісьменнікам назваў колераў у сваіх творах. Толькі пошук усіх выпадкаў ужывання такіх назваў запатрабаваў у даследчыцы напружанай працы на працягу года, ці нават болей. Аднак нельга быць упэўненым, што былі знойдзены ўсе без выключэння такія выпадкі. З дапамогай канкарданса (калі б ён існаваў), такую працу можна было б зрабіць за 1 дзень, не сумняваючыся ў дакладнасці вынікаў працы.

Доказам запатрабаванасці канкарданса з’яўляецца той факт, што яшчэ задоўга да таго, як ён быў выдадзены, да мяне нярэдка звярталіся  з просьбай паглядзець, ці ёсць тое ці іншае слова ў канкардансе, гэта значыць ці ўжывалася яно ў ХІХ ст. і ў якіх значэннях, які пісьменнік яго ўжываў.

Канкарданс беларускай мовы 19 стагоддзяАкрамя таго, канкарданс можа быць цікавы літаратуразнаўцам і шырокаму колу чытачоў, якія цікавяцца беларускай літаратурай. У канкардансе ўпершыню сабраныя практычна ўсе вядомыя творы беларускай мастацкай літаратуры ХІХ ст., якія захаваліся да нашага часу. Пераважная большасць тэкстаў падаюцца ў выглядзе, максімальна прыбліжаным да арыгіналу.

Можна меркаваць, што цікавай для даследчыкаў будзе і бібліяграфічная інфармацыя.  Усе назвы твораў, прозвішчы іх аўтараў, месца і час выдання і іншыя  звесткі прыведзены ў 2 спісах тэкстаў, якія маюць рознае прызначэнне і таму адрозніваюцца паміж сабой як па змесце, так і па форме падачы матэрыялу. Комплекс гэтых двух спісаў можна разглядаць як сістэматызаваны бібліяграфічны даведнік беларускамоўнай мастацкай літаратуры ХІХ ст.

— У агульных звестках аб Канкардансе сказана, што «гэта адноўлены і дапоўнены варыянт канкарданса, створанага ў 1985 годзе ў Інстытуце мовазнаўства Акадэміі навук Беларусі» — што змянілася за гэты час, якія дапаўненні былі ўнесеныя?

— Па-першае, амаль удвая павялічыўся корпус тэкстаў, паводле якога складаўся канкарданс. За апошнія дзесяцігоддзі даследчыкі беларускай літаратуры знайшлі першакрыніцы многіх літаратурных твораў гэтага перыяду. Імі мы дапоўнілі корпус тэкстаў. Трэба адзначыць, што корпус тэкстаў, створаны ў 80-я гады, уключае толькі аўтэнтычныя тэксты. Пры пашырэнні корпуса мы вырашылі ўключыць у яго і тыя добра вядомыя ў наш час творы, арыгіналы якіх мы не здолелі знайсці. Мы зыходзілі з таго, што асноўнай мэтай канкарданса з’яўляецца адлюстраванне лексічнага складу мовы тых часоў, і ўключэнне ў корпус тэкстаў у адаптаваным выглядзе толькі павялічыць яго прадстаўнічасць. Такім чынам, колькасць тэкстаў у корпусе павялічылася з 283 да 497, а іх аб’ём са 145 тыс. словаўжыванняў да 257 тыс.

Канкарданс пячатныДругім важным момантам з’яўляецца дапаўненне агульнага канкарданса канкардансамі мовы асобных аўтараў – В. Дуніна-Марцінкевіча, А. Ельскага, К. Каганца і К. Каліноўскага. Крытэрыем выбару была іх роля у грамадскім жыцці краіны і ў фарміраванні сучаснай беларускай літаратурнай мовы, а таксама колькасць твораў і аўтэнтычнасць тэкстаў.

Ёсць таксама некаторыя дробныя дапаўненні і карэктывы тэхнічнага характару.

— Чаму менавіта ХІХ ст. было абрана для стварэння першага канкардансу?

— ХІХ стагоддзе – вельмі важны перыяд у развіцці беларускай мовы. Менавіта ў той час, нягледзячы на ўсе неспрыяльныя ўмовы, пачала фарміравацца новая літаратурная мова. Галоўная роля ў працэсе яе станаўлення належала мастацкай літаратуры, таму і даследаванне асаблівасцей мовы гэтага перыяду павінна грунтавацца на тэкстах літаратурных твораў. Але да нядаўняга часу даследчыкі не мелі магчымасці прааналізаваць з’явы, якія іх цікавяць, на вялікім тэкставым матэрыяле. Больш-менш поўнага збору твораў беларускай мастацкай літаратуры ХІХ ст. да выхаду ў свет у 2012–2013 г. 3–5 тамоў Залатой калекцыі беларускай літаратуры не існавала. Дапамагчы ім ў гэтым і павінен быў канкарданс.

— Ці існуюць зараз іншыя канкардансы беларускай мовы?

— Акрамя Канкарданса беларускай мовы ХІХ ст., створаны канкарданс мовы Кандрата Крапівы, які быў выдадзены ў 2011 г. таксама ў электронным фармаце.Канкарданс Кандрата Крапівы

— «123 тыс. словаўжыванняў у тэкстах празаічнай формы і 134 тыс. вершаванай» — ці можна сказаць, што беларуская мова таго перыяду багатая? Як можна параўнаць стан беларускай мовы ХІХ ст. з сучасным станам? З іншымі мовамі?

— Адказаць на гэтыя пытанні, абапіраючыся толькі на паказчыкі колькасці словаўжыванняў, немагчыма. Патрэбна асобнае даследаванне, якое дапаможа правесці створаны намі канкарданс.

— «Корпус налічвае 309 тэкстаў, транслітараваных з лацінкі, і 188 нетранслітараваных тэкстаў на кірыліцы» — ці можна па гэтых лічбах зрабіць выснову, што для ХІХ ст. лацінка была для беларускай пісьмовай мовы больш натуральнай? І калі большую частку зараз навукоўцы былі вымушаныя транслітараваць, ці не маглі згубіцца ў гэтым працэссе пэўныя сэнсы/словаформы/гучанні?

— Перш за ўсё хачу адзначыць, што названыя вамі лічбы не адлюстроўваюць колькасных суадносін аўтэнтычных тэкстаў, напісаных кірыліцай, з тэкстамі на лацінцы. Як вядома,  не заўсёды алфавіт, які выкарыстоўваў аўтар пры напісанні твора, захоўваўся пры яго публікацыі, нават калі гэта быў першадрук. Гэтыя лічбы паказваюць, колькі тэкстаў мы транслітаравалі з лацінскага алфавіта на кірылічны перад уключэннем іх у корпус. Але калі ўсё ж прааналізаваць колькасць аўтараў, якія выключна ці часткова карысталіся лацінскай графікай, то можна прыйсці да высновы, што іх у ХІХ ст. было значна больш, чым тых, хто карыстаўся кірыліцай. Прыхільнікамі лацінскага пісьма былі В. Дунін-Марцінкевіч, Ф. Багушэвіч, А. Гурыновіч, Я. Чачот, Я. Баршчэўскі, А. Абуховіч, Ф. Тапчэўскі, У. Сыракомля, А. Вярыга-Дарэўскі і інш. Лацінскімі літарамі друкавалася беларускамоўная газета “Мужыцкая праўда” і яе папярэдніца “Гутарка двух суседаў”. Сярод тых, хто карыстаўся кірыліцай, можна назваць Я. Лучыну, К. Каганца, А. Пшчолку, М. Косіч. Сваю схільнасць да лацінскага пісьма аўтары тлумачылі тым, што большасць пісьменных людзей сярод простага люду Беларусі, якім яны адрасавалі свае творы, ведалі менавіта лацінскі алфавіт. Кірыліцу яны не ведалі, бо асноўным матэрыялам для чытання былі так званыя “кантычкі” – зборнікі каталіцкіх царкоўных песень. Што тычыцца ананімных твораў, то я дакладна не лічыла, якая частка іх напісана лацінкай. Але на першы погляд выглядае, што перавагу мае кірылічнае пісьмо.

Я не думаю, што нешта важнае было страчана пры транслітарацыі тэкстаў. Мы ставілі перад сабой задачу адлюстраваць перш за ўсё лексічны склад тагачаснай беларускай мовы, і транслітарацыя не магла гэтаму перашкодзіць.

— «У некаторых тэкстах разам з літарамі беларускага алфавіта ўжываліся рускія літары ъ, и, щ. Асобныя аўтары выкарыстоўвалі свае літары і знакі для абазначэння тых ці іншых фанетычных з’яў» — ці можаце прывесці нейкія цікавыя прыклады?

— Найбольш цікавыя прыклады можна знайсці ў тэкстах Каруся Каганца, які для перадачы спецыфічных гукаў беларускай мовы прапанаваў літары і знакі, якіх няма ў кірылічным алфавіце. Так, у рукапісных тэкстах пісьменніка мы сустрэлі такія непрывычныя для нас літары, як ѡ, ö, ü, ë, є і знак ʼ, які пазначае мяккасць. Вось як бы вы прачыталі такое слова:   ѣд́ ’ ?Едзь

Згодна з алфавітам Каруся Каганца, так было б напісана слова едзь.  Яшчэ адзін прыклад. У тэкстах розных аўтараў, напісаных лацінкай, мы зафіксавалі па меншай меры 4 графічныя варыянты, якія адпавядаюць кірылічнай літары ж: ź, ż, ž, ẑ.

— Пры рэдагаванні тэкстаў былі прынятыя некаторыя спрашчэнні. Ці не маглі такія спрашчэнні спрасціць агульны выгляд мовы таго перыяду? Напрыклад, магчыма «ъ» на канцы слова, у адрозненні ад рускай мовы, у нас яшчэ працягваў чытацца?

— Як я ўжо казала, мэтай канкарданса з’яўляецца адлюстраванне, перш за ўсё, лексічнага складу беларускай мовы на этапе фарміравання яе літаратурнай формы. Ва ўмовах, калі не існавала ніякіх правілаў граматыкі і правапісу, пісьменнікі арыентаваліся на жывое народнае маўленне ў той мясцовасці, дзе яны жылі. Гэта мела вынікам наяўнасць у тэкстах некалькіх графічных варыянтаў аднаго слова. Напрыклад, мы зафіксавалі 14 варыянтаў напісання слова яшчэ. Па магчымасці мы захоўвалі арыгінальную графіку. Але аўтаматычная апрацоўка, асабліва ў той час, устанаўлівае пэўныя патрабаванні да тэксту. Таму немагчыма захаваць усе фанетычныя асаблівасці мовы аўтараў, тым больш, што, як адзначала вышэй, такая задача перад складальнікамі канкарданса не ставіцца.

— Ці ёсць планы па працягу работы над канкардансамі?

— Што тычыцца асабіста мяне, то мае планы звязаныя з выкарыстаннем Канкарданса беларускай мовы ХІХ ст. Цяпер працую над стварэннем анамастычнага слоўніка беларускай мовы ХІХ ст. на яго аснове. На жаль, паслядоўнікаў у мяне няма. Калі яны знойдуцца, з задавальненнем перадам свой вопыт у справе стварэння канкардансаў.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *


*