Nekaj zanimivosti iz besedilnega korpusa Nova beseda

Primož Jakopin

DOI: https://doi.org/10.3986/jz.v9i2.2594

Povzetek

V članku je nekaj zanimivih podatkov o distribuciji črk, besed in stavkov v besedilnem korpusu v Laboratoriju za korpus slovenskega jezika pri Inštitutu za slovenski jezik Frana Ramovša ZRC SAZU. Korpus Nova beseda je glavni prek spleta prosto dostopni vir za kvantitativno raziskovanje slovenskega jezika (http://bos.zrc-sazu.si) in zdaj obsega 100 milionov besed, pretežno iz časopisnih tekstov in leposlovja.

Celotno besedilo:

PDF

DOI: https://doi.org/10.3986/jz.v9i2.2594

Avtorske pravice (c) 2019 Jezikoslovni zapiski

##submission.license.cc.by-nc-nd4.footer##

Revija se indeksira v Dlib.

Za nemoteno delovanje spletna stran uporablja piškotek za čas trajanja seje. Po končani seje se piškotek izbriše.