91Ž«ĂœÔÚÏß

Navigerat till

Bearbetning och visualisering av data 7,5 hp

Om kursen

Målet med Data Science är att göra det möjligt för samhälle, företag och medborgare att förstå och använda den ständigt ökande mängden insamlad information på ett sätt som gör det möjligt att upptäcka potentiella problem eller förbättringar av den aktuella situationen. Data Science bör också ge människor möjlighet att uppskatta och förstå de potentiella följderna av olika handlingar. Det finns ett talesätt om "lögner, fördömda lögner och statistik", som uttrycker det faktum att databaserad statistik kan presenteras på mycket övertygande sätt även när slutsatserna är falska. Denna kurs försöker undervisa hur man kan upptäcka sådan falsk information och säkerställa mer etisk användning av Data Science.

Ett exempel på praktisk användning av datavetenskap är att analysera och presentera epidemirelaterad data och statistik på korrekt och mänskligt förståeligt sätt så att beslut och åtgärder kan fattas baserat på rationell information. Data Science-metoder används också för att uppskatta effekterna av åtgärder för att minska den globala uppvärmningen, dimensionera vägnät, välja var man ska installera nya köpcentra eller restauranger, optimera byggnadernas energianvändning,…. Kort sagt, Data Science är en av de viktigaste domänerna för att bestämma hur vårt nuvarande och framtida samhälle ska byggas. Fler och fler företag kommer också att inse vikten av området Data Science. Oavsett bransch eller storlek måste organisationer som vill vara konkurrenskraftiga i hantering av stora datamängder effektivt utveckla och implementera Data Science möjligheter eller riskera att hamna på efterkälken.

Modul 1, teori, 4,0 hp.
Den här kursen om bearbetning och visualisering av data ger en introduktion till området Data Science. Studenterna kommer att lära sig att importera, manipulera och bearbeta data som kommer från olika reella datakällor i syfte att presentera det på sätt som möjliggör insikt i de underliggande systemen eller fenomenen. Bearbetning av data kan ge bättre insikt i datats betydelse genom statistiska mätningar, presenterade som numeriska tabeller som sammanfattar data på olika sätt. Men i de flesta fall tenderar människor att förstå visuella presentationer av data bättre än rent numeriska presentationer. Kursen kommer att undervisa hur man använder grundläggande datavisualiseringar såsom punkt- och linjediagram, stapeldiagram, histogram, låddiagram och fioldiagram. 3D-visualiseringstekniker lärs ut, samt hur man använder kartor och bilder för datavisualisering.

Olika dataanalyser och maskininlärningsmetoder kommer att användas men den underliggande teorin ligger utanför denna kurs. Avsikten är att göra eleverna skickliga med hur dessa metoder kan tillämpas i verkliga miljöer som man möter i industri och samhälle i allmänhet. Det är därför som föreläsningar åtföljs av övningar där studenterna övar sig på att använda några av de metoder som behandlas under föreläsningarna.

Kursen använder huvudsakligen R-programmeringsspråket, så studenterna kommer lära sig grunderna i R. Inkluderat är även en introduktion till hur bearbetnings- och visualiseringsmetoder kan användas i programmeringsspråket Python.

Ämnen som behandlas är:

  • Introduktion till programmeringsspråket R och tillhörande verktyg
  • Introduktion till bearbetning och visualisering av data i programmeringsspråket Python
  • Import och export av data från textfiler, databaser och andra källor
  • Datavisualisering i R, i 2D och 3D
  • Kartvisualiseringar
  • Visa och arbeta med bilder i R
  • Introduktion till andra användbara data bearbetnings- och visualiseringspaket
  • Linjär regression, BLUE, RMSE, krympningsmetoder (Lasso, åsregression)
  • Linjär klassificering (logistisk regression, LDA)
  • Principalkomponentanalysis (PCA) för att identifiera linjära samband mellan variabler
  • K-means kluster
  • Icke-linjära eller icke-parametriska metoder (t.ex. k-NN)
  • Förberedelse av data för maskininlärning
  • Grundläggande insikter om förklarbar (Explainable) artificiell intelligens (XAI)

Modul 2, färdighetsträning, 3,5 hp.
Modul 2 består av ett praktiskt projekt som kräver en kombinerad användning av metoder som bearbetats i Modul 1. Projektämnen och datamängder kommer att tillhandahållas av lärare, men vi uppmuntrar också att studenterna föreslår egna områden. Projektet genomförs i grupper om 1-4 studenter. Varje grupp presenterar sina framsteg, planer och öppna frågor för lärare och medstudenter i två "mentorsessioner" och en sista presentationssession. Syftet med mentorsessionerna är att ge konstruktiv feedback och vägledning till studenterna i deras inlärningsprojekt. Mentorsessionerna påverkar INTE betygsättningen av denna modul.

AnmÀl dig

Kontakta oss

Ditt meddelande går till Infocenter som ser till att det hamnar hos rätt person – så att du får ett så bra och relevant svar som möjligt.

TÀnk pÄ att universitetet Àr en statlig myndighet och att det du skriver hÀr kan bli en allmÀn handling. Var dÀrför försiktig med att skriva kÀnsliga eller personliga frÄgor hÀr i kontaktformulÀret. Alla uppgifter behandlas enligt dataskyddsförordningen (GDPR).

Nytt meddelande