Jezikovne tehnologije
Študijski program prve stopnje Slovenistika (vpis do 2024/2025)
Cilji in kompetence
Osnovni cilj predmeta je študentom posredovati pregled področja jezikovnih tehnologij, skupaj s stičnimi točkami teorije informacij, jih seznaniti s slovenskimi besedilnimi korpusi in ustreznimi orodji ter z notranjiim ustrojem spletnih strani, z označevalnima jezikoma, v katerih so narejene.
Študenti so sposobni ovrednotiti probleme pri pripravi in obdelavi elektronskih jezikovnih virov v večjezičnem in večplatformnem okolju.
Pridobijo nov pristop k možnostim, ki jih za reševanje jezikovnih problemov ponuja današnji, hitrotekoči spletni čas.
Pogoji za vključitev v delo oz. za opravljanje študijskih obveznosti
Predmet ne zahteva posebnih predznanj, ki jih študentje jezikoslovja že sicer ne bi imeli. Potrebna so le osnovna znanja uporabe računalnikov, izkušnje z uporabo svetovnega spleta in pa, seveda, znanje angleškega jezika.
Vsebina
Vsebina predmeta so najprej splošni pojmi tega področja, pa tudi osnovne spletne veščine, npr. označevalni jeziki, kakršna sta HTML in XML. Sledi pregled prostostopnih korpusnih virov in orodij, predvsem za slovenski jezik in možnosti, ki jih le-ti nudijo pri kvantitativni analizi besedila. Seminarska naloga je v obliki spletne strani narejen statistični opis izbranega slovenskega ali angleškega leposlovnega besedila, skupaj z besednim zakladom njegovih polnopomenskih besednih vrst.
Predvideni študijski rezultati
Študenti spoznajo sodobno orodje za analizo besedil in njegov pomen za jezikoslovje. Razumejo notranji ustroj enostavnih in strojno-generiranih spletnih dokumentov. Dobijo pregled nad besedilnimi korpusi za slovenski jezik in načini njihove uporabe. Seznanijo se z načinom izdelave in objavljanja lastnih spletnih strani. Razumejo princip in pomen označevanja besedil. Naučijo se statističnega opisa izbranega besedila in izdelave njegovega besednega zaklada.
Temeljna literatura in viri
- D. Jurafsky, J. H. Martin, 2009. Speech and language processing, 2. izdaja, Prentice Hall, 1024 str. Katalog
- C. D. Manning in H. Schütze, 1999. Foundations of Statistical Natural Language Processing, MIT Press. Cambridge, MA, 620 str. Katalog
- A. Witt in D. Metzing (Ur.), 2010. Linguistic Modeling of Information and Markup Languages, zbirka Text, Speech and Language Technology, Vol. 40, Springer, 266 str. E-gradivo
- G. Leech, P. Rayson, A. Wilson, 2001. Word Frequencies in Written and Spoken English: based on the British National Corpus. Longman, London, 320 str. E-gradivo
- Prispevki s konferenc Association for Computational Linguistics (ACL) E-gradivo
- ACL wiki E-gradivo
- V. Gorjanc, 2005. Uvod v korpusno jezikoslovje. Izolit, Domžale, 163 str. Katalog
- P. Jakopin, 2002. Entropija v slovenskih leposlovnih besedilih. Založba ZRC, Ljubljana, 208 str. Katalog
Načini ocenjevanja
Izdelana in predstavljena seminarska naloga (60%), ustni izpit (40%).
Reference nosilca
Doc. dr. Boris Kern je znanstveni sodelavec na Inštitutu za slovenski jezik Frana Ramovša ZRC SAZU, kot zunanji sodelavec pa predava na Fakulteti za humanistiko Univerze v Novi Gorici. Je soavtor in glavni urednik osrednjih slovarjev sodobnega slovenskega jezika: eSSKJ: Slovarja slovenskega knjižnega jezika in ePravopisa (do leta 2019), kot soavtor je sodeloval tudi pri Slovarju novejšega besedja slovenskega jezika in drugi, prenovljeni izdaji Slovarja slovenskega knjižnega jezika. Je vodja skupine za besedotvorje in za normativistiko pri pripravi eSSKJ-ja. Njegova raziskovalna področja so: besedotvorje, leksikologija, leksikografija, pravopis, glasoslovje slovenskega jezika ter slovenščina kot drugi in tuji jezik.
Izbor člankov:
• KERN, Boris. Kombinatorika priponskih obrazil v besedotvornih sestavih glagolov čutnega zaznavanja. V: KRAJNC IVIČ, Mira (ur.), ŽELE, Andreja (ur.). Pogled v jezik in iz jezika : Adi Vidovič Muha ob jubileju, (Mednarodna knjižna zbirka Zora, 133). Maribor: Univerzitetna založba / University Press. 2020, str. 67–79. [COBISS.SI-ID 46130477]
• KERN, Boris, VIČAR, Branislava. Jezik in transspolne identitete. Slavistična revija, letn. 67, št. 2. 2019, str. 413–422. [COBISS.SI-ID 44910637]
• KERN, Boris. Stopenjsko besedotvorje (Na primeru glagolov čutnega zaznavanja). Ljubljana: Založba ZRC, ZRC SAZU, 2017. [COBISS.SI-ID 291202048]
• KERN, Boris. Wpływy obcojęzyczne na współczesny język słoweński. Rozprawy Komisji Językowej, T. 62. 2016, str. 39–48. [COBISS.SI-ID 64288610]
• KERN, Boris. Zagadnienia słowotwórcze w wybranych podręcznikach do nauczania języków słoweńskiego i polskiego jako obcych. V: PAŁUSZYŃSKA, Edyta (ur.), GARNCAREK, Piotr (ur.), MAŁYSKA, Agata (ur.). Glottodydaktyka – media – komunikacja. Negocjowanie znaczeń. 2014, str. 211–220. [COBISS.SI-ID 57085282]
• KERN, Boris. Politična korektnost v slovaropisju. V: ZULJAN KUMAR, Danila (ur.), DOBROVOLJC, Helena (ur.). Zbornik prispevkov s simpozija 2013 – Škrabčevi dnevi 8; 2013; Nova Gorica. 2015, str. 144–154. [COBISS.SI-ID 41919789]