Identifying Abbreviations in Texts

Authors

  • Mojca Kompara Odbor regij

DOI:

https://doi.org/10.3986/jz.v15i1-2.2423

Abstract

This article discusses abbreviations, a generally growing phenomenon present in all languages. Many Slovenian grammarians have dealt with abbreviations, they have been classified in detail by Matej Rode, and the last comprehensive classification appeared in the Slovenski pravopis (Slovenian Normative Guide) of 2001. Abbreviations are found in general, specialized, monolingual, and bilingual dictionaries. Because they arise quickly, they are difficult to collect, and printed dictionaries are published too infrequently to allow the dictionaries themselves be updated regularly. In recent years an increasing number of online databases have appeared; these are freely accessible and updatable, and also allow users to enter new abbreviations. The databases are based on lexical corpora or online sources, and can also be automatically formatted using rules and algorithms. The article continues by presenting automatic abbreviationrecognition procedures in the ADAM databases as well as the Satev-Nikolov method. With the help of this method, an example is given of an algorithm for recognizing abbreviations in Slovenian texts.

Downloads

Download data is not yet available.

References

Acronym Finder [URL: http://www.acronimfinder.com ].

ADAM [URL: http://128.248.65.210/arrowsmith_uic/adam.html ].

Chiari 2007 = Isabella Chiari, Introduzione alla linguistica computazionale, Roma – Bari: Laterza, 2007, 54–55.

Debenjak 2001 = Božidar Debenjak – Doris Debenjak – Primož Debenjak, Veliki nemško-slovenski slovar, Ljubljana: DZS, 2001.

Debenjak 2003 = Božidar Debenjak – Doris Debenjak – Primož Debenjak, Veliki slovensko-nemški slovar, Ljubljana: DZS, 2003.

Drosdowski 1989 = Günther Drosdowski, Deutsches Universalwörterbuch, Mannheim idr.: Duden Verlag, 1989.

Evroterm: Večjezična terminološka zbirka [URL: http://evroterm.gov.si/ ].

Gabrovšek 1994 = Dušan Gabrovšek, Kodifikacija angleškega jezika v specializiranih enojezičnih slovarjih: Too much of everything?, Vestnik: Društvo za tuje jezike in književnosti 28 (1994), št. 1–2, 150–180.

Gabrovšek idr. 2005–2006 = Dušan Gabrovšek idr., Veliki angleško-slovenski slovar Oxford, Ljubljana: DZS, 2005–2006.

Garcia Marquez 2002 = Gabriel Garcia Marquez, Clave: Diccionario de Uso del Español, Madrid: Ediciones Sm., 2002

Grad 1997 = Anton Grad, Slovensko-angleški slovar, Ljubljana: DZS, 1997.

Grad 1998 = Anton Grad, Veliki angleško-slovenski slovar, Ljubljana: DZS.

Grad 2000 = Anton Grad, Slovensko-španski slovar, Ljubljana: DZS, 2000.

Grad 2001 = Anton Grad, Špansko-slovenski slovar, Ljubljana: DZS, 2001.

Grad 2004 = Anton Grad, Francosko-slovenski slovar, Ljubljana: DZS, 2004.

Jesenik 2005 = Viktor Jesenik, Slovensko-francoski slovar, Ljubljana: DZS, 2005.

Jung 1991 = Heidrun Jung – Udo O. H. Jung, The Dictionary of Acronyms and Abbreviations in Applied Linguistics and Language Learning, New York idr.: Peter Lang Publishing Group, 1991.

Kompara 2005 = Mojca Kompara, Slovensko-italijanski glosar krajšav: diplomsko delo, Ljubljana: Univerza v Ljubljani, Filozofska fakulteta, Oddelek za prevajalstvo, 2005.

Korošec 1993 = Tomo Korošec, O krajšavah, v: XXIX. Seminar slovenskega jezika, literature in kulture, ur. Miran Hladnik, Ljubljana: Filozofska fakulteta, 1993, 15–27.

Kotnik 1992 = Janko Kotnik, Slovensko-italijanski slovar, Ljubljana: DZS, 1992.

Lazar 1994 = Branka Lazar, O nastajanju Slovarja slovenskega knjižnega jezika, Primorska srečanja št. 160–161, 18 [tj. 19] (1994), 539–541.

Logar 2003 = Nataša Logar, Kratice in tvorjenke iz njih – aktualno poimenovalna možnost, v: Współczesna polska i słoweńska sytuacja językowa = Sodobni jezikovni položaj na Poljskem in v Sloveniji, ur. Stanisław Gajda – Ada Vidovič Muha, Opole: Instytut Filologii Polskej, Filozofska fakulteta, 2003,131–149.

Malossini 1999 = Andrea Malossini, Dizionario delle sigle e degli acronimi, Milano: Avallardi, 1999.

MEDLINE [URL: http://medline.cos.com ].

Paxton 1983 = John Paxton, Everyman’s Dictionary of Abbreviations, London: J. M. Dent & Sons, 1983.

Righini 2001 = Enrico Righini, Dizionario di Sigle Abbreviazionie e Simboli, Bologna: Zanichelli, 2001.

Rode 1974 = Matej Rode, Poskus klasifikacije krajšav, Slavistična revija 22 (1974), št. 2, 213–219.

Robert 1996 = Paul Robert, Le Nouveau Petit Robert, Paris: Dictionnaires le Robert, 1996.

Satev – Nikolov 2008 = Vesna Satev – Nicolas Nikolov, Using the Web as a Corpus for Extracting Abbreviations in the Serbian Language, v: Jezikovne tehnologije: Zbornik 11. mednarodne multikonference Informacijska družba – IS 2008, Zvezek C, ur. Tomaž Erjavec – Jerneja Žganec Gros, Ljubljana: Institut Jožef Stefan, 2008, 75–79.

Sinclair 1999 = John Sinclair (ur.), Collins COBUILD English dictionary, London: HarperCollins, 1999.

SSKJ 1– 5 = Slovar slovenskega knjižnega jezika 1–5, Ljubljana: DZS, 1970–1991.

Slovarček krajšav [URL: http://bos.zrc-sazu.si/kratice.html ].

SP 1990 = Slovenski pravopis : pravila, Ljubljana: DZS, 1990.

SP 2001 = Slovenski pravopis, Ljubljana: SAZU – Založba ZRC, ZRC SAZU, 2001.

Stanford Abbreviation Database [URL: http://abbreviation.stanford.edu ].

Steinhauer 2005 = Anja Steinhauer, Das Wörterbuch der Abkürzungen, Mannheim idr.: Duden Verlag, 2005.

Šlenc 1997 = Sergij Šlenc, Veliki italijansko-slovenski slovar, Ljubljana: DZS, 1997.

Šlenc 2006 = Sergij Šlenc, Veliki slovensko-italijanski slovar, Ljubljana: DZS, 2006.

The Free Dictionary [URL: http://acronyms.thefreedictionary.com ].

Toporišič 1991 = Jože Toporišič, Slovenska slovnica, Maribor: Založba Obzorja, 1991.

Toporišič 1992 = Jože Toporišič, Enciklopedija slovenskega jezika, Ljubljana: Cankarjeva založba, 1992.

Unified Medical Language System [URL: http://umlsks.nlm.nih.gov ].

Verbinc 1968 = France Verbinc, Slovar tujk, Ljubljana: Cankarjeva založba, 1968. S ponatisi.

Verbinc 1969 = France Verbinc, Slovarček tujk in kratic, Ljubljana: Prešernova družba, 1969.

Zhou – Torvik – Smalheiser 2006 = Wei Zhou – Vetle I. Torvik – Neil R.

Smalheiser, ADAM: another database of abbreviations in MEDILINE

[http://128.248.65.210/arrowsmith_uic/tutorial/zhou_bioinformatics_2006.pdf ].

Zidar 1971 = Josip Zidar, Rečnik jugoslovenskih skraćenica, Beograd: Međunarodna politika, 1971.

Zingarelli 2000 = Nicola Zingarelli, Vocabolario della lingua italiana, Bologna: Zanichelli, 2000.

Župančič 1948 = Jože Župančič, Kratice: mala izdaja, Ljubljana: DZS, 1948.

Published

2015-07-29

How to Cite

Kompara, M. (2015). Identifying Abbreviations in Texts. Jezikoslovni Zapiski, 15(1-2). https://doi.org/10.3986/jz.v15i1-2.2423