Upravljanje velikih količin podatkov, analiza in predstavitev

Na fakulteti smo med 9. in 23. oktobrom 2024 v okviru predmeta Obvladovanje digitalnih virov in dokumentov gostili dr. Andrea Brunella, ki je izvedel skupno 10 ur aktivnih predavanj.

9. 10. [3h]: Veliki jezikovni modeli (LLM) in inženiring pozivov za analizo podatkov

  • Splošna predstavitev predmeta
  • Temeljni koncepti rudarjenja podatkov (nadzorovano v primerjavi z nenadzorovanim učenjem, razdelitev na učni in testni del), ki so potrebni za razumevanje praktičnega dela
  • Veliki jezikovni modeli (LLM) in inženiring pozivov
  • Praktično delo s ChatGPT za analizo podatkov (podatkovni niz Titanik na Kaggle)

16. 10. [3h]: Vizualizacija podatkov, teorija in praksa s Power BI

  • Pripovedovanje zgodb s podatki
  • Praktično delo s Power BI (podatkovni niz o NLP na Kaggle)

23. 10. [4h]: Izvor in shranjevanje podatkov

  • Uvod v baze podatkov in motivacija
  • Relacijske baze podatkov in SQL (kratek pogled na Postgres)
  • Veliki podatki in NoSQL baze podatkov (kratek pogled grafovske baze podatkov Neo4j)
  • Shramba podatkov (s študijo primera)