Statistical Reasoning
6 EC
Semester 2, periode 4
5062STRE6Y
| Eigenaar | Bachelor Informatica |
| Coördinator | drs. T.R. Walstra |
| Onderdeel van | Bachelor Informatica, jaar 2 |
Basisbegrip van kansrekening en statistiek: kansen, conditionele kansen, discrete en continue stochasten. Kansdichtheden. Gezamelijke kans (dichtheid) functie. Onfhankelijke stochasten. Schatters voor verdelings parameters. Implementatie van een naive Bayesian classifier.
Gebruik van lineaïre algebra om multivariate datasets te modelleren. Kennismaking met de basis van statistisch leren: dimensionaliteit reductie, classificatie (leren van de distributie en/of leren van de scheidingsfunctie), neurale netwerken, clustering en regressie.
Lecture notes (https://staff.fnwi.uva.nl/r.vandenboomgaard/MachineLearning/)
2x2 uur hoorcollege per week, 2x2 uur practicum (laptop) per week, 1x2 uur werkcollege per week
|
Activiteit |
Aantal uur/week |
|
Hoorcollege |
4 |
|
Werkcollege |
2 |
|
laptopcollege |
4 |
|
Zelfstudie |
8-10 |
Bij de opdrachten van het werkcollege zal kennis van LaTeX toegepast moeten worden in de online tool (Ans) wanneer gevraagd wordt naar wiskundige expressies.
Aanwezigheidseisen opleiding (OER-B):
| Onderdeel en weging | Details |
|
Eindcijfer | |
|
3.3% Homework: PCA | |
|
0% Lab: Numpy | |
|
3.3% Homework: Linear Regression | |
|
3.3% Lab: Random Programming | |
|
3.3% Homework: Probability | |
|
3.3% Homework: Bayesian Classfication | |
|
3.3% Naive Bayes Classifier | |
|
1.6% Logistic Regression | |
|
3.3% Homework: Random Variables | |
|
3.3% k-means clustering | |
|
1.7% Linear Regression | |
|
3.3% Lab: Neural Network 2 | |
|
0% K-nearest neighbor | |
|
60% Tentamen | |
|
3.3% PCA | |
|
3.3% Homework: Neural Network |
Tentamen zal op papier plaatsvinden, waarbij eventueel gebruik gemaakt wordt van ANS. Een rekenmachine is toegestaan. Hertentamen wijkt niet af van het reguliere tentamen. Alle opdrachten dienen uiterlijk volgens vastgestelde deadlines in Canvas of Ans te zijn afgerond, tenzij er sprake is van geoorloofd uitstel in overleg met de coördinator.
Het vak bestaat uit een wekelijke programmeer opdracht in Python en theoretische opdrachten die d.m.v. de online tool ANS ingeleverd moeten worden. Iedere opdracht wordt becijferd en beide elementen tellen ieder 20% mee in het eindcijfer. ANS opdrachten worden of via peer review nagekeken en studenten kunnen online kennisnemen van het resultaat en daar ook vragen stellen. De Python opdrachten worden nagekeken via nbgrader en feedback vindt plaats d.m.v. een html versie van de nagekeken versie (via Canvas)
Over het algemeen geldt dat elke uitwerking die je inlevert ter verkrijging van een beoordeling voor een vak je eigen werk moet zijn, tenzij samenwerken expliciet door de docent is toegestaan. Het inzien of kopiëren van andermans werk (zelfs als je dat hebt gevonden bij de printer, in een openstaande directory of op een onbeheerde computer) of materiaal overnemen uit een boek, tijdschrift, website, code repository of een andere bron - ook al is het gedeeltelijk - en inleveren alsof het je eigen werk is, is plagiaat.
We juichen toe dat je het cursusmateriaal en de opdrachten met medestudenten bespreekt om het beter te begrijpen. Je mag bronnen op het web raadplegen om meer te weten te komen over het onderwerp en om technische problemen op te lossen, maar niet voor regelrechte antwoorden op opgaven. Als in een uitwerking gebruik is gemaakt van externe bronnen zonder dat een bronvermelding is vermeld (bijvoorbeeld in de rapportage of in commentaar in de code), dan kan dat worden beschouwd als plagiaat.
Deze regels zijn er om alle studenten een eerlijke en optimale leeromgeving aan te kunnen bieden. De verleiding kan groot zijn om te plagiëren als de deadline voor een opdracht nadert, maar doe het niet.
Elke vorm van plagiaat wordt bestraft. Als een student ernstige fraude heeft gepleegd, kan dat leiden tot het uitschrijven uit de Universiteit.
Zie voor meer informatie over het fraude- en plagiaatreglement van de Universiteit van Amsterdam: www.student.uva.nl
| Weeknummer | Onderwerpen | Studiestof |
| 1 | probability | lecture notes / syllabus Van Es |
| 2 | random variables | lecture notes / syllabus Van Es |
| 3 | naive bayes | lecture notes / syllabus Van Es |
| 4 | principal component analysis | lecture notes / PCA handout |
| 5 | regressie | lecture notes |
| 6 | neural networks | lecture notes |
| 7 | clustering | lecture notes |
| 8 | tentamen |
Het rooster van dit vak is in te zien op DataNose.
Aanbevolen voorkennis: Lineaïre algebra, continue wiskunde, programmeren in python
er waren in 2020 enige problemen met nbgrader en verschillende versies van de python opdrachten. Dit is inmiddels herzien. De peer review in ANS bleek niet goed te werken, dit is opgelost door nakijkwerk door TA's te laten gebeuren. ANS lijkt een fout te hebben opgelost.