Search Engines
6 EC
Semester 1, periode 1
5082ZOEK6Y
Zoekmachines zoals Google, Bing, en Yahoo zijn niet weg te denken uit het alledaagse gebruik van het Internet. De meeste gebruikers staan niet stil bij de onderliggende technieken maar toch is een basisbegrip van hoe zoekmachines werken essentieel voor iedereen die zoekmachines in een professionele omgeving wil inzetten. In deze cursus bespreken we hoe zoekmachines werken, wat hun beperkingen zijn en wat de trends op het gebied van zoekmachine-technologieën zijn.
De cursus behandelt de volgende onderwerpen:
We sluiten de cursus af met het zelf bouwen van een zoekmachine gebruik makend van ElasticSearch, de top technologie van dit moment. Studenten zijn vrij in het kiezen van de verzameling documenten die doorzocht kan gaan worden, als het maar veel is. Typische voorbeelden zijn 50 jaar aan Telegraaf artikelen, de Nederlandse Wikipedia, miljoenen songteksten.
Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008. Gratis te verkrijgen op http://nlp.stanford.edu/IR-book/
Hearst, M.A. Search User Interfaces, Cambridge University Press, September, 2009. Read it online.
Hearst, M. User Interfaces for Search, Chapter 2 of Modern Information Retrieval: The Concepts and Technology behind Search (2nd Edition), Addison Wesley, 2011. official chapter pdf unofficial chapter pdf, but includes the references, the book
Clinton Gormley, Zachary Tong. Elasticsearch: The Definitive Guide. https://www.elastic.co/guide/en/elasticsearch/guide/current/index.html
Each lecture will be accompanied by lecture notes and/or slides.
These notes are typically IPython Notebooks or MarkDown files. Zie http://maartenmarx.nl/teaching/zoekmachines/
12 uur hoorcollege
12 uur werkcollege
3 uur tentamen
10 minuten presentatie
rest = zelfstudie en maken van opdrachten
Aanwezigheidseisen opleiding (OER-B):
Aanvullende eisen voor dit vak:
Er zijn geen aanwezigheidseisen voor dit vak.
| Onderdeel en weging | Details |
|
Eindcijfer | |
|
0.7 (100%) Digitale Toets |
Your final grade is composed as follows
De manier van inzage wordt via de digitale leeromgeving gecommuniceerd.
Zie Canvas https://canvas.uva.nl/courses/10544/modules voor een beschrijving van de opdrachten.
Dit vak hanteert de algemene 'Fraude- en plagiaatregeling' van de UvA. Hier wordt nauwkeurig op gecontroleerd. Bij verdenking van fraude of plagiaat wordt de examencommissie van de opleiding ingeschakeld. Zie de Fraude- en plagiaatregeling van de UvA: http://student.uva.nl
Zie Canvas, https://canvas.uva.nl/courses/10544/
Het rooster van dit vak is in te zien op DataNose.
Hieronder vind je de aanpassingen in de opzet van het vak naar aanleiding van de vakevaluaties.
* betere spreiding van de stof over de 2 helften
* nieuw onderwerp toegevoegd: recommender systems
* Eindproject is verplaatst naar week 4; deeltentamen vervalt.