Jeg har fulgt og afsluttet kursus i “dataanalyse og Machine Learning” ved KU. Dvs. formelt bliver kurset udbudt af AU, men afholdes på Biocenter i KBH, fordi den kursusansvarlige arbejder der, med analyse af scanningsbilleder af hjernen.
Maskinlæring (ML) har vist lige så mange specifikke tricks og metoder, som bioteknologi. Indholdet viste sig at være med et overraskende stort fokus på de pædagogiske vinkler. Der var få tekniske gennemgange (det var op til den enkelte at læse dem), men fokus på hvordan indholdet kunne formidles til elever.
Arbejdet foregik i studiegrupper. Min gruppe endte med at arbejde med et diabetes datasæt og vi brugte KNN algoritmen til at forudsige hvem der havde diabetes. Vi valgte datasættet fordi det havde forståelige features (egenskaber) fx bmi, blodtryk, alder, køn, og vi valgte KNN, fordi det er en af de nemmeste ML-metoder at konkretisere og forklare. At det så er en non-parametrisk metode (dvs. modellen er blot de træningsdata man bruger) er mindre godt, men noget jeg kan leve med.
Kodningen foregik i Google Colab, som er et fint online begynder-IDE, men man mister hurtigt overblikket over filer og indhold, så en stram indholdsstyring er en god ide.
Kurset var også mit første møde med PeerGrade, hvilket jeg synes var ret positivt. Systemet virkede godt, og sparer sikkert underviseren for meget tid, men en meget struktureret opsamling på vigtigt indhold og pointer ville hjælpe.
Alt i alt et rigtig godt kursus, og målet er at fremstille en opgave, som jeg kan bruge i biologi omkring dataanalyse og ML fx KNN eller et NN på Winsconsin breast cancer datasættet.