Prepoznavanje krajšav v besedilih

  • Mojca Kompara Odbor regij

Povzetek

V prispevku so predstavljene krajšave, vsesplošno rastoči fenomen, ki je prisoten v vseh jezikih. V slovenskem prostoru so se s krajšavami ukvarjali številni slovničarji, podrobno jih je klasificiral Matej Rode, zadnja obsežna klasifikacija pa je v Slovenskem pravopisu iz leta 2001. Krajšave so zajete v splošnih, specializiranih, eno- in dvojezičnih slovarjih, zaradi hitre dinamike nastajanja so težje ulovljive, slovarji v pisni obliki pa izhajajo preredko, da bi jih ažurno beležili v same slovarje. V zadnjih letih nastaja vse več spletnih zbirk, ki so prosto dostopne in ažurne ter uporabniku omogočajo tudi vnos novih krajšav. Zbirke temeljijo na besedilnih korpusih ali spletnih virih in se s pomočjo pravil in algoritmov lahko oblikujejo tudi samodejno. V nadaljevanju prispevka so predstavljeni pristopi samodejnega prepoznavanja krajšav v zbirki ADAM ter metoda Sateve in Nikolova. Ob pomoči slednjega sledi primer algoritma za prepoznavanje krajšav v slovenskih besedilih.

Prenosi

Podatki o prenosih še niso na voljo.

Literatura

Acronym Finder [URL: http://www.acronimfinder.com ].

ADAM [URL: http://128.248.65.210/arrowsmith_uic/adam.html ].

Chiari 2007 = Isabella Chiari, Introduzione alla linguistica computazionale, Roma – Bari: Laterza, 2007, 54–55.

Debenjak 2001 = Božidar Debenjak – Doris Debenjak – Primož Debenjak, Veliki nemško-slovenski slovar, Ljubljana: DZS, 2001.

Debenjak 2003 = Božidar Debenjak – Doris Debenjak – Primož Debenjak, Veliki slovensko-nemški slovar, Ljubljana: DZS, 2003.

Drosdowski 1989 = Günther Drosdowski, Deutsches Universalwörterbuch, Mannheim idr.: Duden Verlag, 1989.

Evroterm: Večjezična terminološka zbirka [URL: http://evroterm.gov.si/ ].

Gabrovšek 1994 = Dušan Gabrovšek, Kodifikacija angleškega jezika v specializiranih enojezičnih slovarjih: Too much of everything?, Vestnik: Društvo za tuje jezike in književnosti 28 (1994), št. 1–2, 150–180.

Gabrovšek idr. 2005–2006 = Dušan Gabrovšek idr., Veliki angleško-slovenski slovar Oxford, Ljubljana: DZS, 2005–2006.

Garcia Marquez 2002 = Gabriel Garcia Marquez, Clave: Diccionario de Uso del Español, Madrid: Ediciones Sm., 2002

Grad 1997 = Anton Grad, Slovensko-angleški slovar, Ljubljana: DZS, 1997.

Grad 1998 = Anton Grad, Veliki angleško-slovenski slovar, Ljubljana: DZS.

Grad 2000 = Anton Grad, Slovensko-španski slovar, Ljubljana: DZS, 2000.

Grad 2001 = Anton Grad, Špansko-slovenski slovar, Ljubljana: DZS, 2001.

Grad 2004 = Anton Grad, Francosko-slovenski slovar, Ljubljana: DZS, 2004.

Jesenik 2005 = Viktor Jesenik, Slovensko-francoski slovar, Ljubljana: DZS, 2005.

Jung 1991 = Heidrun Jung – Udo O. H. Jung, The Dictionary of Acronyms and Abbreviations in Applied Linguistics and Language Learning, New York idr.: Peter Lang Publishing Group, 1991.

Kompara 2005 = Mojca Kompara, Slovensko-italijanski glosar krajšav: diplomsko delo, Ljubljana: Univerza v Ljubljani, Filozofska fakulteta, Oddelek za prevajalstvo, 2005.

Korošec 1993 = Tomo Korošec, O krajšavah, v: XXIX. Seminar slovenskega jezika, literature in kulture, ur. Miran Hladnik, Ljubljana: Filozofska fakulteta, 1993, 15–27.

Kotnik 1992 = Janko Kotnik, Slovensko-italijanski slovar, Ljubljana: DZS, 1992.

Lazar 1994 = Branka Lazar, O nastajanju Slovarja slovenskega knjižnega jezika, Primorska srečanja št. 160–161, 18 [tj. 19] (1994), 539–541.

Logar 2003 = Nataša Logar, Kratice in tvorjenke iz njih – aktualno poimenovalna možnost, v: Współczesna polska i słoweńska sytuacja językowa = Sodobni jezikovni položaj na Poljskem in v Sloveniji, ur. Stanisław Gajda – Ada Vidovič Muha, Opole: Instytut Filologii Polskej, Filozofska fakulteta, 2003,131–149.

Malossini 1999 = Andrea Malossini, Dizionario delle sigle e degli acronimi, Milano: Avallardi, 1999.

MEDLINE [URL: http://medline.cos.com ].

Paxton 1983 = John Paxton, Everyman’s Dictionary of Abbreviations, London: J. M. Dent & Sons, 1983.

Righini 2001 = Enrico Righini, Dizionario di Sigle Abbreviazionie e Simboli, Bologna: Zanichelli, 2001.

Rode 1974 = Matej Rode, Poskus klasifikacije krajšav, Slavistična revija 22 (1974), št. 2, 213–219.

Robert 1996 = Paul Robert, Le Nouveau Petit Robert, Paris: Dictionnaires le Robert, 1996.

Satev – Nikolov 2008 = Vesna Satev – Nicolas Nikolov, Using the Web as a Corpus for Extracting Abbreviations in the Serbian Language, v: Jezikovne tehnologije: Zbornik 11. mednarodne multikonference Informacijska družba – IS 2008, Zvezek C, ur. Tomaž Erjavec – Jerneja Žganec Gros, Ljubljana: Institut Jožef Stefan, 2008, 75–79.

Sinclair 1999 = John Sinclair (ur.), Collins COBUILD English dictionary, London: HarperCollins, 1999.

SSKJ 1– 5 = Slovar slovenskega knjižnega jezika 1–5, Ljubljana: DZS, 1970–1991.

Slovarček krajšav [URL: http://bos.zrc-sazu.si/kratice.html ].

SP 1990 = Slovenski pravopis : pravila, Ljubljana: DZS, 1990.

SP 2001 = Slovenski pravopis, Ljubljana: SAZU – Založba ZRC, ZRC SAZU, 2001.

Stanford Abbreviation Database [URL: http://abbreviation.stanford.edu ].

Steinhauer 2005 = Anja Steinhauer, Das Wörterbuch der Abkürzungen, Mannheim idr.: Duden Verlag, 2005.

Šlenc 1997 = Sergij Šlenc, Veliki italijansko-slovenski slovar, Ljubljana: DZS, 1997.

Šlenc 2006 = Sergij Šlenc, Veliki slovensko-italijanski slovar, Ljubljana: DZS, 2006.

The Free Dictionary [URL: http://acronyms.thefreedictionary.com ].

Toporišič 1991 = Jože Toporišič, Slovenska slovnica, Maribor: Založba Obzorja, 1991.

Toporišič 1992 = Jože Toporišič, Enciklopedija slovenskega jezika, Ljubljana: Cankarjeva založba, 1992.

Unified Medical Language System [URL: http://umlsks.nlm.nih.gov ].

Verbinc 1968 = France Verbinc, Slovar tujk, Ljubljana: Cankarjeva založba, 1968. S ponatisi.

Verbinc 1969 = France Verbinc, Slovarček tujk in kratic, Ljubljana: Prešernova družba, 1969.

Zhou – Torvik – Smalheiser 2006 = Wei Zhou – Vetle I. Torvik – Neil R.

Smalheiser, ADAM: another database of abbreviations in MEDILINE

[http://128.248.65.210/arrowsmith_uic/tutorial/zhou_bioinformatics_2006.pdf ].

Zidar 1971 = Josip Zidar, Rečnik jugoslovenskih skraćenica, Beograd: Međunarodna politika, 1971.

Zingarelli 2000 = Nicola Zingarelli, Vocabolario della lingua italiana, Bologna: Zanichelli, 2000.

Župančič 1948 = Jože Župančič, Kratice: mala izdaja, Ljubljana: DZS, 1948.

Objavljeno
2015-07-29
Kako citirati
KomparaM. (2015). Prepoznavanje krajšav v besedilih. Jezikoslovni Zapiski, 15(1-2). https://doi.org/10.3986/jz.v15i1-2.2423