Kursuse teemade esialgne jaotus on järgnevas tabelis.
| Teema | |
| 1. | Sissejuhatus. Kuidas suhestuvad mõisted AI, Data Mining, Data Science ja Machine Learning. Juhendatud masinõppe tööpõhimõte lineaarse regressiooni näitel. Weka paketi tutvustus ja ennustusmudelite loomine lineaarse regressiooniga. Lineaarse regressiooni ennustusmudelite kasutuselevõtt enda valitud keskkonnas
|
| 2. | Logistiline regressioon. Sigmoid funktsioon ja logistilise mudeli implementeerimine. Mudelite evalveerimine. Mudelite tõlgendamine. Laisad algoritmid. kNN tööpõhimõte ja implementatsioon. Eukleidilise distantsi ja muude lähendusmõõtude kasutamine ning õige lähedusmõõdiku valik.
|
| 3. | Ennustusmudelite headuse meetrikute arvutamine, F-score, ROC. Segadusmaatriks. Erineva suurusega klasside probleem.
|
| 4. | Andmete ettevalmistamise etapid, integratsioon, normaliseerimine ja standardiseerimine, puuduvate väärtuste asendamise võtted, ekstreemsete väärtuste asendamine. Näited, kuidas need tegevused mõjutavad ennustustulemusi.
|
| 5. | Otsustuspuude tööpõhimõte visuaalse userClassifier näitel ja C4.5 näitel. Genereeritud puu kasutuselevõtt ennustamiseks.
|
| 6. | Bayese algoritmid. Naive Bayese tööpõhimõte spämmifiltri näitel. Naive bayese tundlikkus korreleeruvate atribuutide suhtes.
|
| 7. | Teksti kaevandamine. StringToWordVector filter. Skripti loomine tekstide allalaadimiseks internetilehtedelt ja nende töötlemiseks masinõppe jaoks sobivale kujule. Metaalgoritmid - FilteredClassifier. Teksti põhjal selle autori ennustamise veebiliidese loomine.
|
| 8. | Seoste reeglite kaevandamine - Apriori algoritmi tutvustus. Ostukorvi andmete põhjal kasutajale soovituste tegemise süsteemi loomine.
|
| 9. | Piltide tuvastamine filtrite abil. Filtrite tööpõhimõte. Praktiline harjutus erinevate piltidega
Pilte masinõppe jaoks
|
| 10. | SVM algoritmi tutvustus. Mittelineaarsed andmed ja kerneli trikk. Õige kerneli valik. Näide 2D andmetega, milles üks klass on punktid ringi sees ja teine väljas.
|
| 11. | Käsitsi joonistatud numbrite tuvastamine, koos andmete kogumise ja ennustusmudeli praktilise rakendamisega
|
| 12. | Ajaseeriate abil ennustamine kasutades erinevaid filtreid andmete ettevalmistamisel ja kasutades ajaseeriate paketti. Börsihindade ennustamine kasutades börsihindade eelnevaid andmeid. |