Keystone Project III: Big Data

6 EC

Semester 2, periode 4

5042KPIB6Y

Eigenaar Bachelor Biologie
Coördinator prof. dr. M.A. Haring
Onderdeel van Bachelor Bèta-gamma, major Biologie, jaar 2Bachelor Biologie, reguliere programma, jaar 2
Links Zichtbare leerlijnen

Studiewijzer 2024/2025

Globale inhoud

Welke genen worden geactiveerd bij stress? Waarom bevorderen sommige bacteriën immuniteit? Hoe ontstaat kanker? Hoe wordt een microbe een ziekteverwekker? Welke omgevingsfactoren beïnvloeden de samenstelling van populaties. Om dit soort vragen te beantwoorden worden er vaak grote datasets –“Big Data” gecreëerd. In deze gevallen is analyse van de resultaten met eenvoudige middelen (Excel etc.) niet meer werkbaar. In deze cursus zal ook aandacht besteed worden aan data management en ethisch aspecten van Big Data. Hoe gaan wetenschappers om met data uit publieke projecten?

Om hiermee om te gaan gaat de student leren hoe Big Data gebruikt kunnen worden in het oplossen van biologische vraagstukken (experimental design), welke statistische analyses er gedaan kunnen worden en hoe de resultaten hiervan gevisualiseerd kunnen worden. Studenten leren omgaan met websites en eenvoudige R-scripts die analyse, modellering en visualisatie mogelijk maken. Deze skills worden aan de hand van biologische voorbeelden in de praktijk gebracht (computerpractica en zelfstudie) en door de student in een verslag weergegeven.

Studenten zullen vijf opdrachten uitvoeren die verschillende typen biologische data gebruiken. 

Opdracht 1: Transcriptomics (RNA-seq) data kan inzicht geven in welke processen (lees genen) als reactie op een stimulus aangeschakeld worden. Studenten vergelijken een controle en een behandelde situatie om verschillen te identificeren en genen betrokken bij de response te identificeren.

Opdracht 2: Vervolgens worden uit deze groep kandidaat genen met een analyse op basis van Web-based informatie voorspeld welke genen echt belangrijk zouden kunnen zijn. 

Opdracht 3: Tegenwoordig is het makkelijk om het genoom van microbe bacteriën compleet te sequencen. Door verschillende genomen met elkaar te vergelijken kunnen we identificeren welke genen ten grondslag liggen aan bepaalde eigenschappen en evolutionaire veranderingen in biologische processen reconstrueren.

Opdracht 4: Met metagenomics  (sequence analyse)  kunnen complexe microbiële ecosystemen in kaart brengen en interacties tussen microben en hun omgeving blootleggen. Hoe doe je dit soort analyses en welke informatie levert dit op?

Opdracht 5: Vanuit de ecologie komen verschillende soorten data, die door correlatie analyse tot nieuwe inzichten kunnen leiden. Hiervoor krijg je statistiek colleges die lineaire regressie behandelen. Een data set van de biodiversiteit van zoet water meren zal worden onderzocht.

De opdrachten:

Studenten bewerken zelf een dataset behorend bij een biologische vraagstelling en presenteren hun resultaten in een verslag. Voor iedere opdracht krijgen de studenten 4 uur. Het verslag wordt op Canvas ingeleverd.

Er is voor iedere opdracht een feedback sessie van 2 uur waarin de studenten vragen kunnen stellen over hun beoordeelde opdracht en uitleg krijgen over de verwachte resultaten.

De cursus wordt afgesproken met een minisymposium, waarin onderzoekers laten zien hoe de leerstof van deze cursus in de praktijk terugkomt in het onderzoek.

 

Studiemateriaal

Literatuur

  • Alberts B., Johnson A., Lewis J., Raff M., Roberts K., Walter P. (2014) Molecular biology of the cell. Sixth edition. Taylor & Francis Inc

Syllabus

  • Aanvullende documenten worden tijdens het vak via Canvas beschikbaar gemaakt

Software

  • o.a. R en R studio. Wordt beschikbaar gemaakt voorafgaand of tijdens practica.

Leerdoelen

  • De student leert complexe biologische systemen te begrijpen gebruikmakend van Datasets uit Ecologie, Microbiologie en Moleculaire Biologie.
  • De student leert bewerking en analyse van metagenomics, genomics en RNAseq data met eenvoudige software of zelf geschreven R-scripts
  • De student leert het principe van lineaire regressie en kan dit toepassen met behulp van R-scripts in de analyse van Ecologische data
  • De student verkrijgt kennis van publieke Databases waar informatie kan worden gevonden en hoe Datasets kunnen worden opgehaald of opgeslagen.
  • De student begrijpt welke experimentele aanpak er bij Big Data experimenten vereist is.
  • De student kan experimentele gegevens uit databases interpreteren en conclusies trekken over de biologische systemen.

Onderwijsvormen

  • Hoorcollege
  • Zelfstudie
  • Zelfstandig werken aan bijv. project/scriptie
  • Begeleiding/feedbackmoment
  • Werkcollege
  • (Computer)practicum
  • Laptopcollege

Verdeling leeractiviteiten

Activiteit

Uren

Hoorcollege

20

Laptopcollege

6

Project

8

Tentamen

 

Werkcollege

38

Zelfstudie

96

Totaal

168

(6 EC x 28 uur)

Aanwezigheid

Aanwezigheidseisen opleiding (OER-B):

  • Deelname aan (computer)practica, veldwerk en werkcolleges is in principe verplicht. Eventueel aanvullende eisen worden per onderdeel in de studiewijzer omschreven. Hier staat ook beschreven wat de eventuele consequenties zijn van het niet nakomen van deze verplichting.

Toetsing

Onderdeel en weging Details

Eindcijfer

Inzage toetsing

Studenten kunnen  vragen stellen over de beoordeling van hun opdracht in de feedback sessie van de opddracht. Voor meer details kunnen ze zich melden bij de cursuscoördinator voor toelichting op de beoordeling die in Canvas gepubliceerd is.

Na het bekend maken van de eindcijfers kan er contact opgenomen worden met de cursuscoordinator

Opdrachten

Er worden 5 verplichte opdrachten gemaakt: RNAseq analysis; Databases/gene annotation; Genome comparison bacteria; Microbiome analysis; Ecological Data. De taal van het verslag is Engels. Deze worden allen beoordeeld en becijferd. Om te slagen voor een opdracht moet je tenminste een 5,5 halen, anders moet je de opdracht overdoen. Het gemiddelde van de vijf opdrachten is het eindcijfer.

Fraude en plagiaat

Dit vak hanteert de algemene 'Fraude- en plagiaatregeling' van de UvA. Hier wordt nauwkeurig op gecontroleerd. Bij verdenking van fraude of plagiaat wordt de examencommissie van de opleiding ingeschakeld. Zie de Fraude- en plagiaatregeling van de UvA: http://student.uva.nl

Weekplanning

WeeknummerOnderwerpenStudiestof
1
2
3
4
5
6
7
8

Aanvullende informatie

Let op: Dit vak is in principe niet toegankelijk voor bijvakkers omdat het een projectvak betreft en daarmee een beperkte onderwijscapaciteit heeft.

Contactinformatie

Coördinator

  • prof. dr. M.A. Haring

Docenten

  • drs. Peter Assink
  • M. Bliek ing.
  • Lissy-Anne Denkers MSc
  • dr. rer. nat. Anna Heintz Buschart
  • dr. F.M. van der Kloet
  • dr. J.S. Pfeilmeier
  • dr. Jolanda Verspagen
  • Lissy-Anne Denkers MSc
  • M.E. Westera
  • dr. Kathrin Wippel
  • Prof. dr. Michel Haring (coordinator)