Verzamelen, Visualiseren en Analyseren

Data Collection, Visualisation and Analysis

6 EC

Semester 2, periode 4, 5

5132VEVA6Y

Eigenaar Bachelor Future Planet Studies
Coördinator dr. ir. E.E. van Loon
Onderdeel van Bachelor Future Planet Studies, jaar 1

Studiewijzer 2020/2021

Globale inhoud

De theorie van beschrijvende statistiek, visualisatie, kansberekening en toetsende statistiek wordt via de SOWISO leeromgeving  geïntroduceerd en toegepast via interactieve oefeningen in de R software-omgeving (zelfstudie).

Daarna wordt de theorie in hoorcolleges besproken en in werkcolleges toegepast op concrete en meer uitdagende opdrachten. Bij de opdrachten binnen de werkcolleges worden verschillende typen gegevens verwerkt en geanalyseerd in R.

Het vak is opgesplitst in twee delen van gelijke omvang en ieder van deze delen wordt afgesloten met een deeltoets. In het eerste deel worden beschrijvende statistiek, kansberekening & kansverdelingen behandeld, in het tweede deel komt toetsende statistiek aan bod.

 

Studiemateriaal

Syllabus

  • https://uva.sowiso.nl/

Practicummateriaal

  • https://uva.sowiso.nl/

Software

Leerdoelen

  • gebruiken van R voor het uitvoeren van eenvoudige dataverwerking, algemene berekeningen, gegevensvisualisatie en basis statistiche analyse
  • maken van een correcte visualisatie bij een gegeven vraagstelling en data set
  • gebruiken of interpreteren van visualisaties om inzicht te krijgen in gegevens
  • selecteren, berekenen en rapporteren van juiste samensvattingsmaten voor het beschrijven van een variabele
  • selecteren, berekenen en rapporteren van juiste samenhangsmaten voor het beschrijven van de relatie tussen twee (numerieke en/of categorische) variabelen
  • correct toepassen en interpreteren van samenvattings- & samenhangsmaten door z-transformatie en index-getallen
  • begrijpen van basisconcepten bij random variabelen en processen
  • toepassen van kansrekenregels om kansuitspraken over een eenvoudig proces of een populatieparameter te doen
  • benoemen van eigenschappen van enkele belangrijke kansverdelingen (normaal, t, bionomiaal en chi-kwadraat)
  • uitrekenen en interpreteren van kansdichtheid, kans en kwantiel voor een random variabele met gegeven kansverdeling
  • uitrekenen en interpreteren van betrouwbaarheidsintervallen van een populatie-gemiddelde en een proportie
  • beschrijven van de procedure bij de klassieke statistische hypothesetoets (hierna: 'toets')
  • het achterliggende model beschrijven dat bij een nul- of alternatieve-hypothese hoort
  • uitleggen of met voorbeeld verduidelijken van toets-concepten (nul-hypothese, significantie, power, Type-I fout, etc.)
  • beschrijven hoe significantie, power, Type-I fout en Type-II fout bij een toets samenhangen
  • correct interpreteren van uitkomst van een toets
  • correct rapporteren van uitkomst van een toets
  • beschrijven van sterkte en zwakke punten van toetsing
  • selecteren van de juiste toets op basis van een vraagstelling en data set
  • correct uitvoeren van toets op populatie gemiddelde en proportie voor 1 of 2 groepen
  • correct uitvoeren van toets op samenhang tussen twee categorische variabelen (chi-kwadraat toets voor samenhang)
  • correct uitvoeren van toets op de overeenkomst tussen twee discrete kansverdelingen (chi-kwadraat toets voor 'goodness of fit').
  • correct uitvoeren van toets op samenhang tussen twee numerieke variabelen (enkelvoudige lineaire regressie)
  • uitrekenen en interpreteren van modelparameters en betrouwbaarheidsintervallen in lineair model
  • correct gebruiken van lineair model voor het doen van voorspellingen

Onderwijsvormen

  • Werkcollege
  • Zelfstudie
  • Hoorcollege

Online hoorcolleges en werkcolleges (verplicht voor studenten die het vak voor de 1e keer volgen) waarin vaardigheden worden geoefend met gegevensverwerking en analyse.

Verdeling leeractiviteiten

In de eerste week starten we met een hoorcollege en werkcollege (in totaal 4 uur) waarin het werken met R/RStudio wordt uitgelegd en geoefend.

Daarna volgt het statistische deel van de cursus. Dat statistische deel bestaat uit twee stukken van 5 weken, gevolgd door een toets in week 6. Ieder deel is 3 EC in omvang en in beide delen is de verdeling tussen de activiteiten gelijk:

Deel 1

 

Activiteit

Uren

Digitale Toets

2

Hoorcollege

10 (5x 2)

Werkcollege

10 (5x 2)

Zelfstudie

60 (5x 12)

Totaal

82

 

 Deel 2

 

Activiteit

Uren

Digitale Toets

2

Hoorcollege

10 (5x 2)

Werkcollege

10 (5x 2)

Zelfstudie

60 (5x 12)

Totaal

82

 

Aanwezigheid

Aanwezigheidseisen opleiding (OER-B):

  • Deelname aan veldwerk is verplicht en niet vervangbaar door opdrachten of andere cursussen.
  • In geval van een practicum is de student verplicht ten minste 90% van de practicumbijeenkomsten bij te wonen en zich op deze bijeenkomsten terdege voor te bereiden, tenzij anders aangegeven in de studiewijzer van het vak. Indien de student minder dan 90% heeft bijgewoond dient het practicum opnieuw te worden gevolgd.
  • In geval van werkgroepbijeenkomsten is de student verplicht tenminste 7 van elke 8 werkgroepbijeenkomsten bij te wonen en zich op deze bijeenkomsten terdege voor te bereiden, tenzij anders aangegeven in de studiewijzer. Bij meer dan 8 werkgroepbijeenkomsten geldt dat de student steeds per (deel van) 8 bijeenkomsten maximaal 1 bijeenkomst mag missen. Indien de student minder dan het verplichte aantal heeft bijgewoond, kan het vak niet worden afgerond.

Aanvullende eisen voor dit vak:

Om mee te mogen doen aan de deeltentamens moet je bij dit vak verplicht:

  • De online lesstof van het vak (theorie met oefeningen) doorlopen die voor de betreffende week geroosted staat
  • de weektoets over de lesstof met een voldoende score maken
  • actief deelnemen aan de (online) werkcolleges.

De verplichting om de lesstof te doorlopen en de weektoetsen te maken geldt ook voor herkansers (alleen voor dat deel dat zij nog moeten herkansen); het deelnemen aan de werkcolleges is niet verplicht voor herkansers.

Toetsing

Onderdeel en weging Details

Eindcijfer

1 (100%)

aanwezig bij werkcollege + weektoetsen op tijd & voldoende

Moet ≥ AVV zijn

0.5 (50%)

Deeltentamen 1

Moet ≥ 5.5 zijn

0.5 (50%)

Deeltentamen 2

Moet ≥ 5.5 zijn

De deeltentamens worden afgenomen in dezelfde leeromgeving (SOWISO) gemaakt waarin ook de wekelijkse toetsen zijn gemaakt. Gedurende de tentamens wordt gebruikt gemaakt van R en is een digitaal formulier met formules beschikbaar.

De beide deeltentamens zijn afzonderlijk te herkansen.

De deelcijfers blijven niet staan tot volgend jaar - dus als het vak na herkansingen niet is gehaald moet het hele vak het volgende jaar opnieuw worden gevolgd (deze laatste regel verschilt voorgaande jaren toen deelcijfers wel konden worden meegenomen).

Toetsmatrijs (studentenversie)

Leerdoel:   Deeltentamen 1:   Deeltentamen 2:
1 t/m 10 ieder 10 %  
11 t/m 25   ieder 5 tot 10 %

Studenten die het vak al eerder hebben gevolgd

Studenten die het vak al eerder hebben gevolgd hoeven niet aanwezig te zijn bij het werkcollege, maar moeten aan dezelfde regels voldoen als de andere studenten wat betreft het doorlopen van de online lesstof en de wekelijkse deeltoetsen voor dat deel dat zij nog moeten herkansen.

Voor dit jaar geldt: de deeltentamens van vorig jaar zijn nog geldig. Dit betekent dat de weektoetsen + het deeltentamen voor het deel deel waarvoor een voldoende is gehaald niet opnieuw gemaakt hoeven te worden.
Voor het onderdeel dat je nog niet is gehaald moet dus wel de weektoetsen gemaakt worden.

 

Opdrachten

Er zijn iedere week verplichte opdrachten bij deze cursus, bestaand uit:

  • het doorlopen van de online lesstof van het vak (theorie met eenvoudige oefeningen in SOWISO) -  zelfstudie
  • het maken van revisie-oefeningen (vaak gebruik makend van R) - in de werkcolleges en zelfstudie
  • het maken van een weektoets over de lesstof (mag 2 keer worden gedaan en moet met een voldoende score worden gemaakt) - zelfstudie

Feedback op de oefeningen en weektoets wordt gegeven binnen de leeromgeving, en vragen hierover worden tijdens werkcolleges beantwoord. Vragen naar aanleiding van de online theorie worden in hoor- en werkcolleges beantwoord.

Fraude en plagiaat

Dit vak hanteert de algemene 'Fraude- en plagiaatregeling' van de UvA. Hier wordt nauwkeurig op gecontroleerd. Bij verdenking van fraude of plagiaat wordt de examencommissie van de opleiding ingeschakeld. Zie de Fraude- en plagiaatregeling van de UvA: http://student.uva.nl

Weekplanning

 

Deel 1: Beschrijvende statistiek, kansberekening & kansverdelingen

Weeknummer
(datum van hoorcollege)

Onderwerpen Studiestof
6 (8 feb) Leren werken met R & RStudio Hoofdstuk 0
6 (12 feb) Beschrijven van variabelen Hoofdstuk 1
7 (19 feb) Samenhang tussen variabelen Hoofdstuk 2
8 (26 feb) Kansberekening Hoofdstuk 3
9 (5 maart) Kansverdelingen Hoofdstuk 4
10 (12 maart) Steekproeven en Steekproef Kansverdelingen Hoofdstuk 5
12 Digitale Toets 1 (26 maart)
H. 1 t/m 5

 

Deel 2: Toetsende statistiek

Weeknummer (datum van hoorcollege)

Onderwerpen Studiestof
13 (1 april) parameterschatting & betrouwbaarheidsintervallen Hoofdstuk 6
14 (9 april) hypothese toetsen Hoofdstuk 7
15 (16 april) toets voor gemiddelde en proportie Hoofdstuk 8
16 (23 april) enkelvoudige regressie Hoofdstuk 9
17 (30 april) associatie tussen categorische variabelen Hoofdstuk 10
20 Digitale Toets (19 mei)
H. 6 t/m 10

Rooster

Het rooster van dit vak is in te zien op DataNose.

Aanvullende informatie

Al het lesmateriaal (en ook de toets) is in het Engels.

 

Vakevaluatie afgelopen jaar

Vanaf 2013-2014 hebben we ervoor gekozen om d.m.v. onderstaande tabel de studenten meer inzicht te geven in de kwaliteitszorg. Daarom nemen we een korte weergave van de studentenevaluatie op en de daaruit voortvloeiende acties ter verbetering van het vak.

VVA (6 EC)        
Sterke punten
  • duidelijke uitleg
  • veel oefenmateriaal beschikbaar
  • verplichte weektoetsen zijn belangrijk ivm bijhouden van stof
  • sowiso werkt heel goed
Suggesties ter verbetering
  • meer vragen met echte data/R in weektoetsen
  • kleinere werkgroepen ivm vragen
  • betere verdeling van stof over de verschillende hoofdstukken (met name H7 was te groot)
Belangrijkste opmerkingen Opleidingscommissie:
  • waar mogelijk suggesties van studenten doorvoeren
Reactie docent:
  • alle suggesties zijn doorgevoerd (meer R-vragen in weektoetsen / kleinere werkgroepen / betere verdeling over hoofdstukken)
  • daarnaast ook iets betere spreiding van stof over alle lesweken

Contactinformatie

Coördinator

  • dr. ir. E.E. van Loon

e.e.vanloon@uva.nl