Statistisk inlärning med högdimensionella data, 7,5 hp
±õ²Ô²Ô±ð³óÃ¥±ô±ô
Denna kurs ger både vad gäller djup och bredd, omfattande kunskap i "data science" och statistisk inlärning. I kursen diskuteras både traditionella och toppmoderna metoder och algoritmer inom områdena. De relaterade grundläggande teorierna behandlas också. Efter godkänd kurs förväntas studenterna ha stark förmåga att lösa problem med hjälp av data. Dessutom förväntas de ha en stark självstudieförmåga för att förstå och lära sig nyutvecklade metoder och algoritmer.
Modul 1 (3 hp): Teori.
Kursen ger en överblick över viktiga tekniker och begrepp inom statistisk inlärning. Tekniker för övervakad maskininlärning, både klassiska och mer moderna metoder, behandlas. Särskilt behandlas så kallade ensemble-metoder (t.ex. random forests), djupa neurala nätverk samt tekniker för regulariserad linjär regression. Även metoder för oövervakad inlärning (klustring) samt dimensionsreduktion behandlas. Kursen innefattar speciellt matematisk teori om maskininlärning generellt samt särskilt om de metoder som presenteras.
Modul 2 (4.5 hp) Datorlaborationer.
I modulen ingår analys av flera datamaterial med hjälp av de i kursen ingående statistiska metoderna. Analyserna utförs i något av programspråken R eller Python. I modulen ingår omfattande skriftliga redogörelser för analyserna och deras resultat.
Förväntade studieresultat
För godkänd kurs ska studenten kunna
Kunskap och förståelse
- ingående beskriva grundläggande idéer bakom, och utformande av olika algoritmer för problem rörande dimensionsreduktion samt övervakad och oövervakad inlärning
- beskriva och härleda de teoretiska resultaten
Färdighet och förmåga
- tillämpa de grundläggande idéerna bakom, och de vanligaste teknikerna för att bygga statistiska modeller och maskininlärningsmodeller
- implementera metoder och algoritmer i programspråk som R eller Python
- identifiera lämpliga analysmetoder, lämpliga variabelselektionsmetoder och lämpliga metoder för dimensionsreduktion, för givna klassificerings- och klusteranalysproblem
- tillämpa valideringsmetoder för att bland lämpliga analys-, variabelselektions- och dimensionsreduktionsmetoder välja den mest lämpliga för specifika klassificerings- och klusteranalysproblem
- presentera analysresultat i skriftlig form
Värderingsförmåga och förhållningssätt
- kritiskt värdera klassificeringsmetoder och klusteranalysmetoder ur ett vetenskapligt perspektiv
Behörighetskrav
För tillträde till kursen krävs 90 hp inkluderande 7,5 hp programmeringsmetodik, 7,5 hp Multivariat dataanalys och 12 hp matematisk statistik eller motsvarande kunskaper. Engelska och svenska för grundläggande behörighet för högskolestudier.
Undervisningens upplägg
Undervisningen på modul 1 bedrivs i form av föreläsningar och lektioner. Undervisningen på modul 2 bedrivs i form av handledning av laborationer.
Examination
Examinationen sker i form av skriftlig tentamen (modul 1) och skriftliga laborationsrapporter (modul 2). På modul 1 och modul 2 ges något av betygen Underkänd (U) eller Godkänd (G). På hel kurs sätts något av betygen Underkänd (U), Godkänd (3), Icke utan beröm godkänd (4) eller Med beröm godkänd (5). För att bli godkänd på hela kursen krävs att båda modulerna är godkända. Betyget på kursen baseras på en sammanvägning av resultaten på båda modulerna, där modul 2 ges högre vikt.
Avsteg från kursplanens examinationsform kan göras för en student som har beslut om pedagogiskt stöd på grund av funktionsnedsättning. Individuell anpassning av examinationsformen ska övervägas utifrån studentens behov. Examinationsformen anpassas inom ramen för kursplanens förväntade studieresultat. Efter begäran av studenten ska kursansvarig lärare, i samråd med examinator, skyndsamt besluta om anpassad examinationsform. Beslutet ska sedan meddelas studenten.
Den som erhållit betyget godkänt på kursen kan ej examineras för högre betyg. För studerande som inte blivit godkänd vid ordinarie provtillfälle anordnas ytterligare provtillfälle. En student som utan godkänt resultat har genomgått två prov för en kurs eller en del av en kurs, har rätt att få en annan examinator utsedd, om inte särskilda skäl talar emot det (HF 6 kap. 22 §). Begäran om ny examinator ställs till prefekten vid Institutionen för matematik och matematisk statistik. Examination baserad på denna kursplan garanteras under två år efter studentens förstagångsregistrering på kursen.
°Õ¾±±ô±ô²µ´Ç»å´Ç°ùä°ì²Ô²¹²Ô»å±ð
Student har rätt att fÃ¥ prövat om tidigare utbildning eller motsvarande kunskaper och färdigheter förvärvade i yrkesverksamhet kan tillgodoräknas för motsvarande utbildning vid UmeÃ¥ universitet. Ansökan om tillgodoräknande skickas in till Studentcentrum/Examina. Mer information om tillgodoräknande finns pÃ¥ UmeÃ¥ universitets studentwebb, www.student.91´«Ã½ÔÚÏß, och i högskoleförordningen (6 kap). Ett avslag pÃ¥ ansökan om tillgodoräknande kan överklagas (Högskoleförordningen 12 kap) till Överklagandenämnden för högskolan. Detta gäller sÃ¥väl om hela som delar av ansökan om tillgodoräknande avslÃ¥s.
Övriga föreskrifter
I en examen får denna kurs ej ingå tillsammans med en annan kurs med likartat innehåll. Vid osäkerhet bör den studerande rådfråga studierektorn i matematik och matematisk statistik. Kursen kan ingå i en examen som en kurs i huvudområdet beräkningsteknik.
Ö±¹±ð°ù²µÃ¥²Ô²µ²õ²ú±ð²õ³Ùä³¾³¾±ð±ô²õ±ð°ù
I det fall att kursplan upphör att gälla eller genomgår större förändringar, garanteras studenter minst tre provtillfällen (inklusive ordinarie provtillfälle) enligt föreskrifterna i den kursplan som studenten ursprungligen varit kursregistrerad på under en tid av maximalt två år från det att tidigare kursplan upphört att gälla eller att kursen slutat ges.
Litteratur
Giltig från: 2024 vecka 35
An introduction to statistical learning
: with applications in R
James Gareth, Witten Daniela, Hastie Trevor, Tibshirani Robert
Second edition. :
New York, NY :
Springer :
[2021] :
xv, 607 pages :
ISBN: 9781071614204
Obligatorisk