Korpusna analiza klitik in njim podobnih elementov v slovenskem knjižnem jeziku 16. stoletja

Alenka Jelovšek, Tomaž Erjavec

DOI: https://doi.org/10.3986/sjsls.12.1.01

Povzetek

V prispevku je predstavljena korpusna obravnava pisne variantnosti v slovenskem knjižnem jeziku 16. stoletja tako s sinhronega kot z diahronega vidika. Raziskava temelji na ročno pregledanem vzorcu (okoli 14.000 besednih enot) iz Trubarjevih del Ta pervi deil tiga Noviga teſtamenta, 1557, in Hiſhna poſtilla, 1595, in Juričičeve Poſtille, 1578, ter se osredotoča na klitike in njim podobne elemente. Statistična analiza zapisa skupaj in narazen na podlagi primerjave pisnih konvencij 16. stoletja in sodobne pisne rabe s pomočjo normaliziranih oblik izvirnih besed, tj. primerov, ko eni (ortografski) besedi iz 16. stoletja ustrezata dve ali več sodobnih besed (preslikava 1–n) in obratno (preslikava n–1), je pokazala, da je tovrstnih primerov v korpusu 5,7 odstotka pojavitev, pri čemer so najpogostejše v JPo 1578 in najredkejše v TPo 1595, kjer jih je več kot enkrat manj kot pri Juričiču. V večini primerov gre za izvirno eno besedo, ki se v normalizirani obliki zapisuje kot dve besedi. Med besedami, ki so v izvirniku zapisane skupaj z gostiteljem, prevladujejo nezložni predlogi v, k in z, sledi jim členica ne, členek li in redkeje bi, se ter predlogi na, ob, pri in za (pri tem je njihova absolutna pogostnost večinoma premo sorazmerna z njihovo relativno pogostnostjo v primerjavi z njihovimi samostojno stoječimi variantami – najpogostejše so tudi prevladujoče zapisane skupaj z gostiteljem, pri redkejših pa prevladuje ločeni zapis). Posamezni primeri, ko sta združeno zapisani dve naglašeni besedi, so verjetno posledica vpliva nemških zloženk. 

Zgledi, ko eni sodobni besedi ustrezata dve besedi v izvirniku, se pojavljajo sporadično – z izjemo presežniške prepone naj-/nar-, ki je v vzorcu zapisana združeno s pridevnikom/prislovom v okoli četrtini primerov – oziroma jih lahko označimo kot tiskovne napake ali napake v prepisu. Zanimivi so primeri, ko so vzglasni soglasniki homonimni z ne- ali enozložnimi predlogi in ločeni od preostanka besede z apostrofom (npr. s’_nameinja, s’_derſhati, do_bruta, sa_doſti). Normalizacija omogoča tudi ugotavljanje pisnih različic najpogostejših naslonk, ki se pisno povezujejo z naglašeno besedo, to je nezložnih predlogov k, z in v. K in njegov alomorf /h/ imata v korpusu izpričanih 5 pisnih variant, od katerih se <q_> pojavlja le pred besedami, ki se začnejo na v-. Z zvenečim alomorfom /z/ in nezvenečim alomorfom /s/ ima v osnovi tri pisne različice, katerih razvrstitev se le delno ujema z (ne)zvenečnostjo prvega glasu sledeče besede, pojavljajo pa se tudi primeri pisnega zlivanja predloga s sledečo besedo, ki se začne s s-/z-. Druge pisne različice verjetno predstavljajo dodatne položajno vezane alomorfe: <sh/ſh/s’h> za mehčani /ž/ pred palatalnim ń in <ſa>, <ſo/so> za ozloženo različico /za/, /zo/. Predlog v izkazuje največjo mero pisne variantnosti med navedenimi predlogi, saj ima kar 10 pisnih različic: splošni stično zapisani <v_> in <u_> in <v’_>, ki je v korpusu obravnavana kot nestična; <uv_>, <uv’_> in <u’_v> pred samoglasnikom; <u’_> in <va_>, ki se pojavljata samo pred v-; poleg tega pa še <v_> and <v’>, ki se pisno zlijeta z vzglasnim v- sledeče besede.

Analiza pisne variantnosti pri nezložnih predlogih je pokazala, da že relativno omejen ročno pregledan normaliziran korpus omogoča identificiranje večine pisnih različic, ki so navedene v obstoječi literaturi, uporaba programskega orodja noSketch Engine pa omogoča pridobivanje dodatnih podatkov o njihovi relativni pogostnosti in položajnih omejitvah. Z razširitvijo ročno pregledanega korpusa bodo tovrstne raziskave lahko prispevale pomembne in statistično relevantne podatke o sistemu slovenskega knjižnega jezika 16. stoletja, s katerimi se bodo dopolnjevale dosedanje ugotovitve, v glavnem temelječe na paberkovalnem izpisovanju primerov.

Celotno besedilo:

PDF (English)

Literatura

Ahačič, Kozma. 2014. The History of Linguistic Thought and Language Use in 16th Century Slovenia. Frankfurt am Main [etc.]: Peter Lang.

Ahačič, Kozma. Legan Ravnikar, Andreja. Merše, Majda. Narat, Jožica. Novak, France. 2011. Besedje slovenskega knjižnega jezika 16. stoletja. Ljubljana: Založba ZRC, ZRC SAZU.

Eckart de Castilho, R. Biemann, C. Gurevych, I. Yimam, S.M. 2014. WebAnno: a flexible, web-based annotation tool for CLARIN. Proceedings of the CLARIN Annual Conference (CAC) 2014, Soesterberg, Netherlands.

Erjavec, Tomaž. 2015. Reference corpus of historical Slovene goo300k 1.2. Slovenian language resource repository CLARIN.SI, http://hdl.handle.net/11356/1025, 2015.

Erjavec, Tomaž. Jelovšek, Alenka. 2013. A corpus-based diachronic analysis of Slovene clitics. New Methods in Historical Corpora, 117–26. Tübingen: NarrVerlag.

Juričič, Jurij. 1578. Poſtilla. Ljubljana. Digital edition: Korpus slovenskega knjižnega jezika 16. stoletja, Jurij Juričič, Poſtilla [https://stage.termania.net/korpus16/].

Legan Ravnikar, Andreja. 2017. K problematiki vpliva stičnega jezika – nemščine na semantične spremembe in stilno vrednost najstarejše slovenske knjižne leksike (16. stoletje). Slovenski jezik = Slovene Linguistic Studies 11: 35–53.

Ljubešić, Nikola. Zupan, Katja. Fišer, Darja. Erjavec, Tomaž. 2016. Normalising Slovene data: historical texts vs. user-generated content. Proceedings of the 13th Conference on Natural Language Processing (KONVENS 2016), 146–155.

Merše, Majda. Jakopin, Franc. Novak, France. 1992. Fonološki sistem knjižnega jezika slovenskih protestantov. Slavistična revija 40/4: 321–340.

Neweklowsky, Gerhard. 1985. Das Werden der slowenischen Schriftsprache. Entstehung von Sprachen und Völkern. Glotto- und ethnogenetische Aspekte europäischer Sprachen, 391–402. Tübingen: Max Niemeyer Verlag.

Novak, France. 2006. Predponi v- in u- v jeziku slovenskih protestantskih piscev 16. stoletja. Stati inu obstati 3–4: 138–159.

Novak, France. 2011. Predlog v v slovenskem knjižnem jeziku 16. stoletja. Globinska moč besede: red. prof. dr. Martini Orožen ob 80-letnici, 126–142. Maribor: Mednarodna založba Oddelka za slovanske jezike in književnosti, Filozofska fakulteta.

Pflughaupt, Laurent. 2008. Letter by Letter: An Alphabetical Miscellany. Trans. Gregory Bruhn. New York: Princeton Architectural Press.

Rigler, Jakob. 1968. Začetki slovenskega knjižnega jezika. Ljubljana: Slovenska akademija znanosti in umetnosti.

Scherrer, Yves. Ljubešić. Nikola. 2016. Automatic normalisation of the Swiss German ArchiMob corpus using character-level machine translation. Proceedings of the 13th Conference on Natural Language Processing (KONVENS 2016), 248–255.

Toporišič, Jože. 2008/2009. »/S/ledni Sazhetig ie Teßhak inu nepopelnom«. Slavistična revija (Trubarjeva številka), letn. 56/57, št. 4, 1: 191–198.

Trubar, Primož. 1557. Ta pervi deil tiga Noviga teſtamenta. Tübingen. Digital edition: Korpus slovenskega knjižnega jezika 16. stoletja, Primož Trubar, Ta pervi deil tiga Noviga teſtamenta [https://stage.termania.net/korpus16/].

Trubar, Primož. 1595. Hiſhna poſtilla. Tübingen. Digital edition: Korpus slovenskega knjižnega jezika 16. stoletja, Primož Trubar, Hiſhna poſtilla [https://stage.termania.net/korpus16/].



DOI: https://doi.org/10.3986/sjsls.12.1.01