Statistisch Redeneren

Statistical Reasoning

6 EC

Semester 1, periode 2

5062STRE6Y

Eigenaar Bachelor Informatica
Coördinator Rein van den Boomgaard
Onderdeel van Bachelor Informatica, jaar 2
Links Zichtbare leerlijnen

Studiewijzer 2024/2025

Globale inhoud

De cursus bestaat uit twee delen:

  • Basisebegrippen van kansrekening en statistiek: kansen, conditionele kansen, discrete en continue stochasten. Kansdichtheden. Gezamelijke kans (dichtheid) functie. Onfhankelijke stochasten. Schatters voor verdelings parameters. Implementatie van een naive Bayesian classifier. Dit is de wiskundige basis om te kunnen rekenen met bij zaken van onzekerheid, fouten, en onvolledige kennis. 
  • Machine Learning: O.a. gebruik van lineaïre algebra om multivariate datasets te modelleren, en kennismaking met de basis van statistisch leren. Voorbeelden zijn dimensionaliteit reductie, classificatie (leren van de distributie en/of leren van de scheidingsfunctie), neurale netwerken, clustering en regressie. Zeker met de huidige trends rondom AI, is machine learning een fundamenteel gebied om te beheersen als informaticus.

Studiemateriaal

Syllabus

Overig

  • Kansrekening en Statistiek voor Kunstmatige Intelligentie (Bert van Es):  optioneel, PDF beschikbaar via Canvas

  • Principal Component Analysis: optioneel, PDF beschikbaar via Canvas

  • Online materiaal

Leerdoelen

  • De student kan statistisch redeneren (inclusief leren) toepassen met behulp van basisconcepten uit de kansrekening en statistiek.
  • De student kan belangrijke onderwerpen uit (statistisch) leren uitleggen: regressie (lineaire regressie), classificatie (minimum error classifier, naive Bayesian classifier, linear discriminant classifiers, logistic regression, neural networks en support vector machines). Clustering (k-means) en dimensionality reduction (PCA).
  • De student kan een wiskundige formulering (met name lineaire algebra) van een probleem en oplossing kunnen omzetten in werkende programmatuur. Daarbij gebruikmakend van de programmeertaal Python en de NumPy/SciPy modules voor efficient numeriek programmeren.

Onderwijsvormen

  • Laptopcollege
  • Hoorcollege
  • Werkcollege
  • Zelfstudie

Het vak kent een reeks aan onderwijsvormen, waar het idee is dat je ongeveer 20 uur per week aan het vak besteedt. Deze onderwijsvormen zijn als volgt:

  1. Hoorcolleges: Twee keer per week, op de dinsdag en woensdag, waar uitleg over de stof wordt gegeven.
  2. Laptopcolleges; Twee keer per week, na de eerste en tweede hoorcolleges respectievelijk. Waar aan de opdrachten van de week wordt gewerkt onder belegeiding van een TA.
  3. Werkcolleges: Één keer per week, op de vrijdag. wat als een vragenuur dient. Dit is het laatste moment vóór de deadline om vragen te stellen over de opdracht (naast ander soort vragen). De praktijk leert dat deze werkcolleges heel nuttig zijn.
  4. Zelfstudie: Buiten de contacturen werk je verder aan de opdrachten.

Verdeling leeractiviteiten

Activiteit

Aantal uren per week

Hoorcollege

2 x 2 uren

Laptopcollege

2 x 2 uren

Werkcollege

1 x 2 uren

Zelfstudie

8-10 uren

 

Aanwezigheid

Aanwezigheidseisen opleiding (OER-B):

  • Voor practica en werkgroepbijeenkomsten met opdrachten geldt in principe een aanwezigheidsplicht. Wanneer studenten niet voldoen aan deze aanwezigheidsplicht kan dit als gevolg hebben dat het onderdeel niet met een voldoende kan worden afgerond.

Toetsing

Onderdeel en weging Details

Eindcijfer

20%

Lab Exercises

Moet ≥ 5 zijn

20%

ANS Huiswerk

Moet ≥ 5 zijn

60%

Tentamen

Moet ≥ 5 zijn

De hantering voor de toetsing is als volgt:

  • Lab Exercises (20%), waar het laagste cijfer vervalt.
  • ANS Huiswerk (20%), waar het laagste cijfer vervalt.
  • Tentamen (60%), wat een ANS tentamen is dat op papier wordt gemaakt. Hier is een (niet-grafische) rekenmachine toegestaan. Voor het hertentamen wordt hetzelfde gehanteerd.

Opdrachten die niet ingeleverd zijn worden becijferd met een 1. Uitstel gaat in overleg met staff en de studieadviseur. Alle onderdelen moeten minimaal een 5.0 of hoger zijn, waar het vakgemiddelde een 5.5 of hoger moet zijn.

Inzage toetsing

De manier van inzage wordt via de digitale leeromgeving gecommuniceerd.

  • Inzage van de Lab Exercises gaat via Canvas en CodeGrade.
  • Inzage van het ANS Huiswerk gaat via Canvas en ANS.
  • Inzage in het gemaakte (her)tentamen gaat via ANS, en is beschikbaar voor een bepaalde periode. 

Opdrachten

Voor alle opdrachten binnen het vak werk je in tweetallen uit dezelfde werkgroep. Je kan alleen de eerste week veranderen van werkgroep, mits je iemand uit de andere groep vindt om mee te ruilen.

Hiet is niet toegstaan om in je eentje te werken tenzij dat expliciet toegestaan is door een teacher. Doe je het vak opnieuw? Dan is het niet toegestaan om oud ingeleverd werk te gebruiken, het is de bedoeling dat je het gehele vak opnieuw doet.

De volgende opdrachtvormen worden gehanteerd:

  1. Lab Exercises, waar in Python notebooks geprogrammeerd wordt.
  2. ANS Huiswerk, waar de theorie van de week wordt getoetst.

Iedere week komt er een nieuwe ANS Huiswerk en Lab Exercise beschikbaar, met als deadline elke maandag 23:59. De eerstvolgende ANS Huiswerk en Lab Exercise komt op hetzelfde moment beschikbaar.

Fraude en plagiaat

Over het algemeen geldt dat elke uitwerking die je inlevert ter verkrijging van een beoordeling voor een vak je eigen werk moet zijn, tenzij samenwerken expliciet door de docent is toegestaan. Het inzien of kopiëren van andermans werk (zelfs als je dat hebt gevonden bij de printer, in een openstaande directory of op een onbeheerde computer) of materiaal overnemen uit een boek, tijdschrift, website, code repository of een andere bron - ook al is het gedeeltelijk - en inleveren alsof het je eigen werk is, is plagiaat.

We juichen toe dat je het cursusmateriaal en de opdrachten met medestudenten bespreekt om het beter te begrijpen. Je mag bronnen op het web raadplegen om meer te weten te komen over het onderwerp en om technische problemen op te lossen, maar niet voor regelrechte antwoorden op opgaven. Als in een uitwerking gebruik is gemaakt van externe bronnen zonder dat een bronvermelding is vermeld (bijvoorbeeld in de rapportage of in commentaar in de code), dan kan dat worden beschouwd als plagiaat.

Deze regels zijn er om alle studenten een eerlijke en optimale leeromgeving aan te kunnen bieden. De verleiding kan groot zijn om te plagiëren als de deadline voor een opdracht nadert, maar doe het niet. Elke vorm van plagiaat wordt bestraft. Als een student ernstige fraude heeft gepleegd, kan dat leiden tot het uitschrijven uit de Universiteit. Zie voor meer informatie over het fraude- en plagiaatreglement van de Universiteit van Amsterdam: www.student.uva.nl

Weekplanning

Weeknummer Onderwerpen Studiestof
1 Probability Lecture Notes + Diktaat Van Es
2 Random Variables  Lecture Notes + Diktaat Van Es
3 Naive Bayes Lecture Notes + Diktaat Van Es
4 Principal Component Analysis Lecture Notes + PCA Handout
5 Regression Lecture Notes
6 Neural Networks Lecture Notes
7 Clustering Lecture Notes
8 Tentamen  

Aanvullende informatie

Aanbevolen voorkennis: Lineaïre algebra, continue wiskunde, programmeren in python.

Contactinformatie

Coördinator

  • Rein van den Boomgaard

De volgende staffleden zijn actief bij Statistisch Redeneren: