Keystone Project III: Big Data

6 EC

Semester 2, periode 4

5042KPIB6Y

Eigenaar Bachelor Biologie
Coördinator prof. dr. M.A. Haring
Onderdeel van Bachelor Biologie, jaar 2Bachelor Bèta-gamma, major Biologie, jaar 2

Studiewijzer 2021/2022

Globale inhoud

Welke genen worden geactiveerd bij stress? Waarom bevorderen sommige bacterieën immuniteit? Hoe ontstaat kanker? Hoe wordt een microbe een ziekteverwekker? Om dit soort vragen te beantwoorden worden er vaak grote datasets –“Big Data” gecreëerd. In deze gevallen is analyse van de resultaten met eenvoudige middelen (Excel etc.) niet meer werkbaar.

Om hiermee om te gaan gaat de student leren hoe Big Data gebruikt kunnen worden in het oplossen van biologische vraagstukken (experimental design), welke statistische analyses er gedaan kunnen worden en hoe de resultaten hiervan gevisualiseerd kunnen worden. Studenten leren omgaan met websites en eenvoudige R-scripts die analyse, modellering en visualisatie mogelijk maken. Deze skills worden aan de hand van biologische voorbeelden in de praktijk gebracht (computerpractica en zelfstudie) en door de student in een verslag weergegeven.

Studenten zullen deelnemen aan projecten die verschillende typen biologische data gebruiken. Transcriptomics (RNA-seq) data bijvoorbeeld, dit kan inzicht geven in welke processen die als reactie op een stimulus aangeschakeld worden. Studenten vergelijken een controle en een behandelde situatie om verschillen te identificeren en de biologische processen achter de response te identificeren. Tegenwoordig is het eenvoudig en goedkoop om het genoom van microbe (bacterie / schimmel) compleet te sequencen. Door verschillende genomen met elkaar te vergelijken kunnen we identificeren welke genen ten grondslag liggen aan bepaalde eigenschappen en evolutionaire veranderingen in biologische processen reconstrueren. Met Next Generation Sequencing technieken kunnen we complexe microbiële ecosystemen in kaart brengen en interacties tussen microben en hun omgeving blootleggen.

Het project:

Studenten bewerken zelf een dataset behorend bij een biologische vraagstelling en presenteren hun resultaten in een verslag.

In deze cursus zal ook aandacht besteed worden aan data management en ethisch aspecten van Big Data. Hoe gaan wetenschappers om met data uit publieke projecten?

Studiemateriaal

Literatuur

  • Alberts B., Johnson A., Lewis J., Raff M., Roberts K., Walter P. (2014) Molecular biology of the cell. Sixth edition. Taylor & Francis Inc

Syllabus

  • Aanvullende documenten worden tijdens het vak via Canvas beschikbaar gemaakt

Software

  • o.a. R en R studio. Wordt beschikbaar gemaakt voorafgaand of tijdens practica.

Leerdoelen

  • Studie van complexe biologische systemen met moleculaire technieken.
  • Data bewerking en analyse met eenvoudige analyse-software en zelf geschreven R-scripts
  • Interpreteren van experimentele gegevens en conclusies trekken over de biologische context

Onderwijsvormen

  • Hoorcollege
  • Zelfstudie
  • Zelfstandig werken aan bijv. project/scriptie
  • Begeleiding/feedbackmoment
  • Werkcollege
  • (Computer)practicum
  • Laptopcollege

Verdeling leeractiviteiten

Activiteit

Uren

Hoorcollege

20

Laptopcollege

6

Project

8

Tentamen

 

Werkcollege

38

Zelfstudie

96

Totaal

168

(6 EC x 28 uur)

Aanwezigheid

Aanwezigheidseisen opleiding (OER-B):

  • Deelname aan (computer)practica, veldwerk en werkcolleges is in principe verplicht. Eventueel aanvullende eisen worden per onderdeel in de studiewijzer omschreven. Hier staat ook beschreven wat de eventuele consequenties zijn van het niet nakomen van deze verplichting.

Toetsing

Onderdeel en weging Details

Eindcijfer

1 (20%)

Assignment Gene characterization Arabidopsis

Moet ≥ 5 zijn

1 (20%)

Assignment Ecological Data

Moet ≥ 5 zijn

1 (20%)

Assignment Microbiome data analysis

Moet ≥ 5 zijn

0.5 (10%)

Assignment genome alignment

Moet ≥ 5 zijn

0.5 (10%)

Assignment Phylogenomics

Moet ≥ 5 zijn

1 (20%)

Assignment RNA-seq module

Moet ≥ 5 zijn

Inzage toetsing

Studenten kunnen zich melden bij de cursuscoordinator voor toelichting op de beoordeling die in Canvas gepubliceerd is

Na het bekend maken van de eindcijfers kan er contact opgenomen worden met de cursuscoordinator

Opdrachten

Er worden 5 verplichte opdrachten gemaakt: Databases/gene annotation;  Ecological Data; Genome comparison/Phlygenomics; Microbiome analysis; RNAseq analysis. Deze worden allen beoordeeld en becijferd. Totaal maakt dit 100% van het eindcijfer

Fraude en plagiaat

Dit vak hanteert de algemene 'Fraude- en plagiaatregeling' van de UvA. Hier wordt nauwkeurig op gecontroleerd. Bij verdenking van fraude of plagiaat wordt de examencommissie van de opleiding ingeschakeld. Zie de Fraude- en plagiaatregeling van de UvA: http://student.uva.nl

Weekplanning

WeeknummerOnderwerpenStudiestof
1
2
3
4
5
6
7
8

Rooster

Het rooster van dit vak is in te zien op DataNose.

Aanvullende informatie

Let op: Dit vak is in principe niet toegankelijk voor bijvakkers omdat het een projectvak betreft en daarmee een beperkte onderwijscapaciteit heeft.

Verwerking vakevaluaties

Hieronder vind je de aanpassingen in de opzet van het vak naar aanleiding van de vakevaluaties: De cursus wordt in 2022 gegeven aan de hand van 5 opdrachten. Er is geen tentamen meer.

Contactinformatie

Coördinator

  • prof. dr. M.A. Haring

Docenten

  • drs. Peter Assink
  • Tijs Bliek ing.
  • dr. Like Fokkens
  • Marc Galland
  • dr. Evelien Jongepier
  • dr. Frans van der Kloet
  • Martha van Os MSc
  • Xandra Schrama
  • dr. Jolanda Verspagen
  • dr. Michel Haring