Data Verzamelen en Analyseren

Data Collection and Analysis

6 EC

Semester 1, periode 1, 2

5042DAVA6Y

Eigenaar Bachelor Biologie
Coördinator drs. Peter Assink
Onderdeel van Pre-master Biological Sciences, jaar 1Bachelor Biologie, jaar 1

Studiewijzer 2022/2023

Globale inhoud

Data Verzamelen en Analyseren is een zestienweekse cursus die plaatsvindt gedurende de eerste vier maanden (sep-dec) van het eerste studiejaar. In de cursus wordt (1) aandacht besteed aan op welke wijze je onderzoeksgegevens moet verzamelen om ze zinvol te kunnen analyseren, en worden (2) enige eenvoudige analysetechnieken besproken en geoefend, zowel met pen en papier als met statistiekprogramma 'R'. Veel van deze analysetechnieken worden in latere cursussen van de bachelor regelmatig toegepast.

In onderstaand overzicht staan de onderwerpen met hun Engelse term aangegeven (o.a. vanwege het Engelstalige cursusboek), maar de cursus wordt in het Nederlands gegeven.

Periode 1

  • Why learning statistics?  
  • Populations and samples
  • Variables and measurement levels
  • Types of study
  • Displaying data 
  • Describing data
  • Sampling distributions
  • Probability 
  • Binomial distribution
  • Normal distribution
  • Confidence intervals
  • Basics of Excel
  • Basics of R

Periode 2

  • Testing hypotheses
  • One-sample binomial test
  • Poisson distribution
  • Chi-square distribution and goodness-of-fit test 
  • Student's t-distribution and t-tests (one-sample, two-sample, paired)
  • Checking assumptions, checking normality
  • Transforming data
  • One-way ANOVA
  • Several non-parametric tests
  • Analysing data using R

Studiemateriaal

Literatuur

  • The Analysis of Biological Data. Whitlock and Schluter, 3rd edition, 2019.  ISBN: 9 781319 325343
    LET OP: dit mag NIET de 2nd of 1st edition zijn!

Syllabus

  • 'R Companion bij het cursusboek' (hoe doe je de berekeningen uit het cursusboek met R);  'R Handleiding bij de laptopcolleges' (data opslaan in R, grafieken maken met R, statistische analyses uitvoeren in R; 2 delen).
    Deze (gratis) syllabi komen digitaal beschikbaar tijdens de cursus.

Practicummateriaal

  • Laptop met als besturingssysteem Windows (8, 8.1 of 10) of macOS 10.x, 11.x of 12.x.
    LET OP: Draag zorg voor een laptop met voldoende rekenkracht. Zorg verder dat je voldoende bekend bent met je besturingssysteem om je laptop onder normale omstandigheden te kunnen bedienen.

Software

  • Voor Windows machines zowel als Mac's: (bij voorkeur de Engelstalige) Excel uit Microsoft Office 2016, 2019, 2021 of 365.
    LET OP: eerdere en/of Nederlandstalige versies van Excel zijn toegestaan maar Excel wordt uitgelegd a.h.v.  Engelstalige tutorials. Zorg dat de Excel-applicatie op je laptop staat voordat de cursus begint. 

  • CRAN R-4.2.1 of een recentere release (bij oudere besturingssystemen kan het zijn dat je een oudere release moet gebruiken). Het is beter om deze applicatie niet al thuis te downloaden: je doet dat tijdens de cursus, onder begeleiding.

  • RStudio 2022.07.1 of een recentere release (bij oudere besturingssystemen kan het zijn dat je een oudere release moet gebruiken). Het is beter om deze applicatie niet al thuis te downloaden: je doet dat tijdens de cursus, onder begeleiding.

Leerdoelen

  • aangeven waar op gelet moet worden bij het verzamelen (meten, tellen) van gegevens teneinde deze met statistische methoden correct te kunnen analyseren;
  • basisbegrippen uit de statistiek kunnen uitleggen;
  • datasets kunnen beschrijven en grafisch kunnen weergeven;
  • eenvoudige statistische analysemethoden kunnen opnoemen;
  • kunnen bepalen hoe eenvoudige statistische vraagstukken moeten worden opgelost;
  • eenvoudige statistische analysemethoden kunnen uitvoeren met enkel pen, papier en rekenmachine
  • basishandelingen kunnen uitvoeren in Microsoft Excel;
  • de R app kunnen bedienen vanuit RStudio;
  • met de R app vectoren, matrices en dataframes kunnen bewerken;
  • met de R app eenvoudige statistische analysemethoden kunnen uitvoeren;
  • bij eenvoudige 'experimental designs' kunnen beredeneren welke statistische analysemethode van toepassing is

Onderwijsvormen

  • Hoorcollege
  • Werkcollege
  • Laptopcollege
  • Zelfstudie

Tijdens de hoorcolleges bespreekt de docent de stof uit het boek, vaak vanuit een wat andere invalshoek en met andere voorbeelden dan het boek hanteert. Tijdens de werkcolleges oefenen studenten om de behandelde stof toe te passen a.h.v. opgaven uit het boek en oude tentamenopgaven. Tijdens de laptopcolleges leren studenten werken met R vanuit RStudio. Dit doen ze op hun eigen laptop.

Verdeling leeractiviteiten

Activiteit

Uren

 

Hoorcollege

27

 

Laptopcollege

24

 

Theorietoets

3

 

Werkcollege

24

 

Zelfstudie

88

 

Practicumtoets

2

 

Totaal

168

(6 EC x 28 uur)

Merk op dat er 88 uur zelfstudie deel uitmaakt van de cursus. Dat is ruim de helft van de studielast.

Aanwezigheid

Aanwezigheidseisen opleiding (OER-B):

  • Deelname aan (computer)practica, veldwerk en werkcolleges is in principe verplicht. Eventueel aanvullende eisen worden per onderdeel in de studiewijzer omschreven. Hier staat ook beschreven wat de eventuele consequenties zijn van het niet nakomen van deze verplichting.

Aanvullende eisen voor dit vak:

Absentie bij een werkcollege of laptopcollege dient ALTIJD vooraf te worden gemeld, met reden.
In zeldzame gevallen waarin vooraf melden niet mogelijk of niet reëel is, dien je je absentie in elk geval z.s.m. te melden.
Melden doe je mondeling of via het cursus-emailaccount.

Indien meedoen met de andere groep mogelijk is, dan heeft dat de voorkeur (dat moet wel de goedkeuring hebben van de cursusleiding). In dat geval geld je niet als absent.

Vanwege het nog altijd rondwarende corona-virus geldt ook dit studiejaar het volgende*: als je gezondheidsklachten hebt die zouden kunnen wijzen op corona (of als je positief test), dan stellen we het op prijs als je (a) het hoorcollege niet bezoekt maar thuis de video-opname ervan bekijkt en (b) je je absent meldt voor de werkcolleges / laptopcolleges. Als je niet te ziek bent, kun je online meedoen met het werkcollege of het laptopcollege, in welk geval je daarvoor als 'present' wordt genoteerd. Kun je of wil je niet online meedoen, dan wordt je als 'absent' genoteerd. Te vaak absent zijn heeft consequenties, zie hieronder.

* Mocht de UvA wegens toenemende corona-besmettingen toch weer universiteitsbrede corona-maatregelen instellen, dan hebben deze voorrang boven de hierboven vermelde regels. 

Iedere student mag 2 keer absent zijn tijdens de cursus zonder consequenties, mits deze absenties zijn gemeld.
Voor een niet-gemelde absentie én vanaf de 3e absentie geldt:

Bij een werkcollege: je kunt voor je ingeleverde huiswerk nu nog maar 1/2 punt krijgen (i.p.v. 1 punt); om 1 punt te krijgen moet je ook de antwoorden op de werkcollege-opgaven inleveren.

Bij een laptopcollege uit de tweede helft van de cursus: je moet bepaalde, door de cursusleiding aan te geven, opgaven maken en de antwoorden inleveren. Doe je dat niet, dan zal de cursuscoördinator besluiten wat daarvoor de sanctie is. 

Voor studenten met problemen thuis, specifieke gezondheidsproblemen e.d. kunnen mildere regels gelden.
Alleen de studieadviseur kan bepalen of je tot deze categorie behoort, niet jijzelf.

De absentieregeling staat in detail beschreven op Canvas in de module "Absentie: regels en consequenties".

Toetsing

Onderdeel en weging Details

Eindcijfer

(Hierboven had een overzicht van de toetsen en hun gewichten moeten staan, maar dat is niet gebeurd. Hieronder staat deze informatie in woorden:)

Het eindcijfer van de cursus wordt berekend uit 4 deelcijfers, met de volgende gewichten*:

theorietoets 76%
'R' vaardighedentoets(1) 9%
'R' vaardighedentoets(2) 9%
inleveren huiswerk 6%

De theorietoets wordt in twee helften afgenomen (28 oktober en 14 december). De resultaten van beide helften worden samengevoegd en daaruit wordt een deelcijfer berekend dat voor 76% meetelt in het eindcijfer.

De theorietoets kan enkel in zijn geheel herkanst worden: de twee helften kunnen niet apart herkanst worden.

De twee 'R' vaardigheids-toetsen (25 oktober en 22 december) leveren elk een deelcijfer op (elk goed voor 9% van het eindcijfer) en kunnen ook elk herkanst worden. Een te laag resultaat voor een 'R' vaardighedentoets kan leiden tot een NAV ('niet aan voldaan'). Deze moet eerst (in een herkansing of in een volgend studiejaar) worden weggewerkt alvorens het eindcijfer wordt vrijgegeven.

Ingeleverd huiswerk (optioneel) kan de laatste 6% van het eindcijfer opleveren.

Daarnaast worden er Excelvaardigheden getoetst, middels een zelf te downloaden toets die net zo vaak gemaakt kan worden tot er een voldoende is behaald. Het resultaat van deze toets draagt niet bij aan het eindcijfer van de cursus maar zolang er geen voldoende is behaald, wordt het eindcijfer niet vrijgegeven.
De Exceltoets moet in elk geval één keer zijn ingeleverd vóór dinsdag 1 november.

------------------
* Voor recidivisten kunnen andere gewichten gelden: zolang zij een of meer deelcijfers hebben staan die nog stammen uit de cursus van 2020 of eerder, zijn de gewichten voor ál hun deelcijfers resp. 80%, 6%, 6% en 8%. Voor recidivisten die geen deelcijfers (meer) hebben staan die stammen uit 2020 of eerder, gelden de nieuwe percentages (76%, 9%, 9% en 6%).
Zie de digitale leeromgeving (Canvas) voor een uitgebreidere uitleg.

Inzage toetsing

De antwoorden op de toetsvragen komen daags na het tentamen op Canvas.
Het bespreken van de toetsen is geen ingeroosterd onderdeel, maar kan desgewenst individueel plaatsvinden voor wie dat wil. Benader daarvoor de coördinator.

Opdrachten

De Excelvaardighedentoets moet gemaakt worden om de cursus te kunnen afronden. Deze toets kunnen studenten zelf downloaden van Canvas en maken wanneer het hen uitkomt, ergens in de maanden september en oktober. De deadline voor het inleveren van deze toets is 31 oktober middernacht.

Fraude en plagiaat

Dit vak hanteert de algemene 'Fraude- en plagiaatregeling' van de UvA. Hier wordt nauwkeurig op gecontroleerd. Bij verdenking van fraude of plagiaat wordt de examencommissie van de opleiding ingeschakeld. Zie de Fraude- en plagiaatregeling van de UvA: http://student.uva.nl

Weekplanning

Weeknummer Onderwerpen Studiestof
1 (=week 36) introductie                             R H0,1,2
2 (=week 37)   boek: Ch1;      R H3,4a
3   boek: Ch2;      R data invoer en grafieken maken
4   boek: Ch3/4;  R H4b
5   boek: Ch5;      R H5a
6   boek: Ch7;      R H5b
7   boek: Ch10;    R H6,7
8 (=week 43) toetsing  
9   boek: Ch6
10   boek & R: Ch8
11   boek & R: Ch11
12   boek & R: Ch12
13   boek & R: Ch13
14   boek & R: Ch15
15 (=week 50) toetsing  
16 (=week 51) toetsing  

Zie liever de uitgebreide informatie op Canvas.
Wellicht zinnig om nu vast te weten: voor de cursusonderdelen in de eerste week (week 36) hoef je niets voor te bereiden. Zorg wel dat je je bij het laptopcollege (donderdag 8 sep) je laptop bij je hebt. Het cursusboek heb je pas nodig vanaf week 37.

Rooster

Het rooster van dit vak is in te zien op DataNose.

Aanvullende informatie

VOERTAAL: NEDERLANDS
De cursus wordt gegeven in het Nederlands, maar vanwege het Engelstalige cursusboek en omdat de wetenschappelijke voertaal doorgaans Engels is, worden in de hoor- en werkcolleges karakteristieke statistiektermen in het Engels gebezigd.

MEER CURSUSINFO OP CANVAS
Vanaf de eerste cursusdag is er een Canvas-omgeving beschikbaar die gedurende de gehele cursus up-to-date zal worden gehouden. Deze omgeving bevat nuttige informatie over rooster, huiswerk-, werkcollege- en laptopcollege-opgaven, powerpoint-slides van de hoorcolleges, video-opnames van de hoorcolleges, overzicht van de tentamenstof, absentie-regels, beoordeling van de cursus, contact met de begeleiding, en meer.

De informatie op Canvas is identiek met of uitgebreider dan de informatie in deze studiewijzer.
De studiewijzer is hoofdzakelijk bedoeld om een indruk te krijgen van de cursus voordat deze van start gaat. Daarna is de Canvas-omgeving de aangewezen plek voor informatie. Tijdens het introductiecollege zal het gebruik van Canvas worden toegelicht.

Verwerking feedback studenten

Hieronder vind je de aanpassingen in de opzet van het vak naar aanleiding van eerdere vakevaluaties.

Naar aanleiding van de vakevaluatie uit 2017-2018 is (al in 2018-2019) het jarenlang gehanteerde 'strafsysteem' (wie te weinig aanwezig was bij de verplichte cursusonderdelen werd uitgesloten van het tentamen), vervangen door een 'beloningsysteem' waarbij ingeleverd huiswerk een deel van het eindcijfer kan opleveren.

De assistenten van de cursus uit 2018-2019 zijn spontaan begonnen met het nakijken van en feedback geven op ingeleverd huiswerk, en vanwege de waardering die dat bij de studenten oogstte, is het nakijken van en feedback geven op ingeleverd huiswerk sinds 2020 tot vaste taak van de assistenten gemaakt.

Het enthousiasme en de betrokkenheid van de cursusleiding wordt jaarlijks gewaardeerd en als motiverend en ondersteunend ervaren en zullen we ook dit studiejaar weer op de eerste plaats zetten. :-)

Contactinformatie

Coördinator

  • drs. Peter Assink

Zolang de cursus nog niet gestart is, kunnen studenten communiceren met de coördinator.
Als de cursus eenmaal loopt (dat is vanaf 6 september 2022) wordt de studenten verzocht in principe alleen nog te communiceren met de assistenten. Daartoe kan gebruik gemaakt worden van het cursus e-mailadres 5042DAVA@gmail.com
Indien er om wat voor redenen dan ook moet worden afgeweken van het persoonlijke rooster (absentie, groepsruil,...), is het van belang dit tijdig aan de assistenten door te geven.

Stuur geen inhoudelijke vragen (vragen over de stof) naar de coördinator of de assistenten. Met dergelijke vragen kun je terecht op de hoorcolleges, werkcolleges en laptopcolleges.

Docenten

De coördinator is tevens de (enige) docent.
Ouderejaars studente Hanna Oosterhoff zal gedurende de gehele cursus assisteren. Daarnaast zijn er enkele 'deeltijd' assistenten die hoogstens de helft van de cursus assisteren, of enkel een bepaald onderdeel. Op het moment van publiceren van deze studiewijzer is nog niet bekend wie de 'deeltijd' assistenten zijn.