Center za jezikovne vire in tehnologije predstavil letošnje slovarske novosti

0
214
(Foto: STA)

Center za jezikovne vire in tehnologije, ki deluje pri Univerzi v Ljubljani, je v letošnjem letu izvedel nekaj nadgradenj pri slovarskih rešitvah, kot sta slovar sopomenk sodobne slovenščine in kolokacijski slovar sodobne slovenščine. Med drugim so posodobili tudi Jezikovni sledilnik.

 

Tako slovar sopomenk sodobne slovenščine kot kolokacijski slovar sodobne slovenščine nastajata po principu odzivnega slovarja. Pripravljena sta bila strojno z naprednimi računalniškimi metodami, sedaj pa ju postopoma nadgrajujejo v sodelovanju med slovaropisci in slovaropiskami ter uporabniško skupnostjo.

Kot so zapisali na centru, koncept omogoča hiter dostop do odprtih podatkov o sodobni slovenščini, ki jih lahko kdorkoli uporabi za nadaljnji razvoj. Prvi slovar v trenutni različici 2.0 vsebuje 100.837 iztočnic in 362.828 sopomenk, kot novost pa tudi protipomenke pri 3599 iztočnicah. Drugi slovar, prav tako v različici 2.0, vsebuje 81.443 iztočnic in 4.491.958 kolokacij oziroma ustaljenih besednih zvez.

Na centru skrbijo tudi za slovar za govorce slovenščine kot drugega in tujega jezika, ki je prvi tovrstni slovar za tuje govorce v Sloveniji. Vključuje besedišče z uporabnikom prilagojenimi slovničnimi, pomenskimi in multimedijskimi informacijami ter prevod v tri tuje jezike – angleščino, madžarščino in albanščino. Trenutno je namenjen tistim, ki se učijo slovenščine na začetni stopnji, s kasnejšimi nadgraditvami pa si želijo, da bi bil primeren za višje ravni jezikovnega znanja.

Za tiste, ki se učijo slovenščine kot drugega ali tujega jezika, so razvili tudi digitalno zbirko besedil KOST, kamor uvrščajo besedila iz različnih programov za učenje slovenščine na Filozofski fakulteti v Ljubljani. Pri tem so med drugim ročno označene jezikovne napake, ki jih pri pisanju v slovenščini delajo tuji govorci. Razvili pa so tudi konkordančnik, ki omogoča prikazovanje besedil z jezikovnimi popravki.

Med orodji in portali, ki jih razvijajo na centru, je tudi SVALA, posebno spletno orodje za raziskovalce, ki pripravljajo besedilne korpuse z jezikovnimi popravki. Z orodjem je mogoče besedilo transkribirati, anonimizirati, vnesti jezikovne popravke, nato pa na uporabniku prijazen način jezikovne popravke tudi vsebinsko označiti. Orodje je bilo izvorno na voljo za švedski jezik, slovenščina pa je prva, ki je dobila lokalizirano in adaptirano različico, so sporočili s centra.

Jezikovni sledilnik, ki prikazuje informacije o časovnih trendih rabe besed v slovenskem jeziku, je v letošnjem letu med drugim dobil 100 besed, ki so najbolj izstopale, kot so ujma, nutrija, protiofenziva, poplava in letalnik.

C. R., STA