Statistisch Redeneren

Statistical Reasoning

6 EC

Semester 2, periode 4

5062STRE6Y

Eigenaar Bachelor Informatica
Coördinator drs. T.R. Walstra
Onderdeel van Bachelor Informatica, jaar 2

Studiewijzer 2022/2023

Globale inhoud

Basisbegrip van kansrekening en statistiek: kansen, conditionele kansen, discrete en continue stochasten. Kansdichtheden. Gezamelijke kans (dichtheid) functie. Onfhankelijke stochasten. Schatters voor verdelings parameters. Implementatie van een naive Bayesian classifier.

Gebruik van lineaïre algebra om multivariate datasets te modelleren. Kennismaking met de basis van statistisch leren: dimensionaliteit reductie, classificatie (leren van de distributie en/of leren van de scheidingsfunctie), neurale netwerken, clustering en regressie.

Studiemateriaal

Overig

Leerdoelen

  • De student kan basis begrippen uit kansrekening en statistiek uitleggen met als doel om statistisch redeneren (o.a. leren) te kunnen toepassen.
  • De student kan belangrijke onderwerpen uit (statistisch) leren uitleggen: regressie (lineaire regressie), classificatie (minimum error classifier, naive Bayesian classifier, linear discriminant classifiers, logistic regression, neural networks en support vector machines). Clustering (k-means) en dimensionality reduction (PCA).
  • De student kan een wiskundige formulering (met name lineaire algebra) van een probleem en oplossing kunnen omzetten in werkende programmatuur. Daarbij gebruikmakend van de Python programmeertaal en de Numpy/Scipy modules voor efficient numeriek programmeren.

Onderwijsvormen

  • Laptopcollege
  • Hoorcollege
  • Werkcollege
  • Zelfstudie

2x2 uur hoorcollege per week, 2x2 uur practicum (laptop) per week, 1x2 uur werkcollege per week

Verdeling leeractiviteiten

Activiteit

Aantal uur/week

Hoorcollege

4

Werkcollege

2

laptopcollege

4

Zelfstudie

8-10

Academische vaardigheden

Bij de opdrachten van het werkcollege zal kennis van LaTeX toegepast moeten worden in de online tool (Ans) wanneer gevraagd wordt naar wiskundige expressies.

Aanwezigheid

Aanwezigheidseisen opleiding (OER-B):

  • Voor practica en werkgroepbijeenkomsten met opdrachten geldt in principe een aanwezigheidsplicht. Wanneer studenten niet voldoen aan deze aanwezigheidsplicht kan dit als gevolg hebben dat het onderdeel niet met een voldoende kan worden afgerond.

Toetsing

Onderdeel en weging Details

Eindcijfer

6 (60%)

Tentamen

2 (20%)

labs

2 (20%)

ans

Tentamen zal op papier plaatsvinden, waarbij eventueel gebruik gemaakt wordt van ANS. Een rekenmachine is toegestaan. Hertentamen wijkt niet af van het reguliere tentamen. Alle opdrachten dienen uiterlijk volgens vastgestelde deadlines in Canvas of Ans te zijn afgerond, tenzij er sprake is van geoorloofd uitstel in overleg met de coördinator.

Alle onderdelen moeten met een voldoende worden afgerond

Opdrachten

Het vak bestaat uit een wekelijke programmeer opdracht in Python en theoretische opdrachten die d.m.v. de online tool ANS ingeleverd moeten worden. Iedere opdracht wordt becijferd en beide elementen tellen ieder 20% mee in het eindcijfer. Nadat ANS opdrachten zijn nagekeken kunnen studenten online kennisnemen van het resultaat en daar ook vragen stellen. De Python opdrachten worden nagekeken via nbgrader en feedback vindt plaats d.m.v. een html versie van de nagekeken versie (via Canvas)

Fraude en plagiaat

Over het algemeen geldt dat elke uitwerking die je inlevert ter verkrijging van een beoordeling voor een vak je eigen werk moet zijn, tenzij samenwerken expliciet door de docent is toegestaan. Het inzien of kopiëren van andermans werk (zelfs als je dat hebt gevonden bij de printer, in een openstaande directory of op een onbeheerde computer) of materiaal overnemen uit een boek, tijdschrift, website, code repository of een andere bron - ook al is het gedeeltelijk - en inleveren alsof het je eigen werk is, is plagiaat.

We juichen toe dat je het cursusmateriaal en de opdrachten met medestudenten bespreekt om het beter te begrijpen. Je mag bronnen op het web raadplegen om meer te weten te komen over het onderwerp en om technische problemen op te lossen, maar niet voor regelrechte antwoorden op opgaven. Als in een uitwerking gebruik is gemaakt van externe bronnen zonder dat een bronvermelding is vermeld (bijvoorbeeld in de rapportage of in commentaar in de code), dan kan dat worden beschouwd als plagiaat.

Deze regels zijn er om alle studenten een eerlijke en optimale leeromgeving aan te kunnen bieden. De verleiding kan groot zijn om te plagiëren als de deadline voor een opdracht nadert, maar doe het niet. Elke vorm van plagiaat wordt bestraft. Als een student ernstige fraude heeft gepleegd, kan dat leiden tot het uitschrijven uit de Universiteit. Zie voor meer informatie over het fraude- en plagiaatreglement van de Universiteit van Amsterdam: www.student.uva.nl

Weekplanning

Weeknummer Onderwerpen Studiestof
1 probability lecture notes / syllabus Van Es
2 random variables  lecture notes / syllabus Van Es
3 naive bayes lecture notes / syllabus Van Es
4 principal component analysis lecture notes / PCA handout
5 regressie lecture notes
6 neural networks lecture notes
7 clustering lecture notes
8 tentamen  

Rooster

Het rooster van dit vak is in te zien op DataNose.

Aanvullende informatie

Aanbevolen voorkennis: Lineaïre algebra, continue wiskunde, programmeren in python

Verwerking feedback studenten

er waren in 2020 enige problemen met nbgrader en verschillende versies van de python opdrachten. Dit is inmiddels herzien. De peer review in ANS bleek niet goed te werken, dit is opgelost door nakijkwerk door TA's te laten gebeuren. ANS lijkt een fout te hebben opgelost.

Contactinformatie

Coördinator

  • drs. T.R. Walstra