Obdelava ekoloških podatkov z metodami strojnega učenja

Predmet se izvaja v programu:
Podiplomski magistrski študijski program Okolje

Cilji in kompetence

Vpeljati študente v področje obdelave ekoloških podatkov z metodami strojnega učenja. Študenti bodo pridobili temeljna znanja o analizi podatkov z metodami strojnega učenja, kot tudi širši pregled najpogosteje uporabljanih metod za strojno učenje. Seznanili se bodo s konkretnimi primeri uporabe teh metod za analizo ekoloških podatkov. V okviru praktičnega dela se bodo usposobili za samostojno uporabo nekaterih programskih orodji strojnega učenja.

Pogoji za vključitev v delo oz. za opravljanje študijskih obveznosti

Zaključena prva stopnja bolonjskega študija ali visokošolski študijski program

Vsebina

  1. Uvod v odkrivanje znanja in metode strojnega učenja (učenje odločitvenih in regresijskih dreves; učenje pravil; verjetnostna klasifikacija; metoda najbližjih sosedov; odkrivanje enačb)

  2. Razredi ekoloških problemov, pri katerih lako uporabimo strojno učenje (modeliranje populacijske dinamike, modeliranje habitata)

  3. Primeri uporabe strojnega učenja pri analizi ekoloških podatkov (vodni ekosistemi, kmetijstvo, gozdarstvo / napr. modeliranje rasti alg v beneški laguni in blejskem jezeru, modeliranje habitata medveda)

  4. Praktično delo z izbranimi metodami strojnega učenja na ekoloških podatkih (predstavitev in vaje na programskih paketih za strojno učenje)

Predvideni študijski rezultati

Znanje in razumevanje:

Študent z uspešno zaključenim predmetom bo poznal in razumel

Splošne kompetence:

• Proces odkrivanja znanja
• Metode strojnega učenja, kot na primer odločitvena in regresijska drvesa, pravila, metoda najbližjih sosedov, odkrivanje enačb
• Izbor metod stojnega učenja za analizo danih podatkov
• Uporaba različnih programski paketov strojnega učenja
Predmetnospecifične kompetence:

• Osnovni pojmi odkrivanja znanja in strojnega učenja
• Pregled najbolj pogosto uporabljanih metod strojnega učenja
• Metodologija strojnega učenja: različni primeri-različni pristopi
• Sposobnost določitve primerne metode strojnega učenja za analizo dane množice ekoloških podatkov
• Sposobnost praktične uporabe metod strojnega učenja na podatkih
• Sposobnost uporabe programskih paketov za strojno učenje

Temeljna literatura in viri

  • A. Fielding, editor. Machine Learning Methods for Ecological Applications. Kluwer, 1999.
  • S. Dzeroski. Data mining in a nutshell. In S. Dzeroski, N. Lavrac, editors, Relational Data Mining, pages 3-27. Springer, 2001.
  • S. Dzeroski. [KDD Applications in] Environmental sciences. In W. Klösgen, and J. M. Zytkow, editors. Handbook of Data Mining and Knowledge Discovery, pages 817-830. Oxford University Press, 2002. E-gradivo
  • A. F. Zuur, E. N. Ieno, and G. M. Smith. Analysing Ecological Data. Springer, 2007. E-gradivo
  • I. H. Witten, E. Frank, and M. A. Hall. Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann, 2011. Katalog

Načini ocenjevanja

• Seminarska (projektna) naloga, vključno s pisnim poročilom in ustnim zagovorom (100 %)

Reference nosilca

Habilitiran leta 2010 v naziv redni profesor za področje računalništva in informatike na Fakulteti za računalništvo in informatiko Univerze v Ljubljani.

• ŠKERJANEC, Mateja, ATANASOVA, Nataša, ČEREPNALKOSKI, Darko, DŽEROSKI, Sašo. KOMPARE, Boris. (2014) Development of a knowledge library for automated watershed modeling. Environmental Modelling & Software, 54: 60-72. (COBISS-ID= 6485601)
• KOCEV, Dragi, DŽEROSKI, Sašo. (2013) Habitat modeling with single- and multi-target trees and ensembles. Ecological Informatics, 18: 79-92. (COBISS-ID= 26909735)
• ČEREPNALKOSKI, Darko, TASHKOVA, Katerina, TODOROVSKI, Ljupčo, ATANASOVA, Nataša, DŽEROSKI, Sašo. (2012). The influence of parameter fitting methods on model structure selection in automated modeling of aquatic ecosystems. Ecological Modeling, 245: 136-166. (COBISS-ID= 26089767)
• KELLER, Reuben, KOCEV, Dragi, DŽEROSKI, Sašo. (2011). Trait-based risk assessment for invasive species : high performance across diverse taxonomic groups, geographic ranges and machine learning/statistical tools. Diversity and Distribution, 17(3): 451-461. (COBISS-ID= 24674087)
• DŽEROSKI, Sašo, TODOROVSKI, Ljupčo, editors. Computational Discovery of Scientific Knowledge. Springer, Berlin, 2007. (COBISS-ID= 20974631)