Corpuslinguïstiek
|
|
|
| Academiejaar: | 2007-2008 | | Code opleidingsonderdeel: | FLWTKM0100 | | Semester: | 1e semester | | Studiepunten: | 6 | | Uren Studietijd: | 168 | | Uren theorie: | 30,00 | | Uren praktijk: | 15,00 | | Uren andere: | | | Deeltijds programma: | 1 | | Titularis(sen) | Steven Gillis
| | Taal waarin de cursus wordt gedoceerd: | Nederlands | | Info semesterexamen: | verplicht semesterexamen in januari | | Info contractrestrictie: | |
1. Aanvangscompetenties (begintermen) *Algemene competenties Basisbegrippen taalkunde zoals aangebracht in “Algmene Taalkunde”, “Nederlandse taalkunde 4: synchrone grammatica”
*Volgtijdelijkheid
2. Eindcompetenties (eindtermen) • De student beheerst kernbegrippen uit de corpuslinguïstiek.
• De student kan corpora onderzoeken met de CLAN software, en kan eenvoudige PERL scripts schrijven.
3. Inhoud Het analyseren van corpora van gesproken of geschreven taal is in de
taalkunde (o.m. in de computerlinguïstiek, e.d.) een veelgebruikte
methode. Corpora geven op de eerste plaats een beeld van het fe
itelijk taalgebruik (geschreven / gesproken). Een tweede belangrijk
aspect is de computerverwerking van corpora: de automatische verwerking
van gegevens ligt binnen het bereik van elke taalkundige, of meer
algemeen binnen het bereik van iedereen die teksten (in de ruimste
betekenis van het woord) bestudeert.
- In een inleidend deel wordt een overzicht gegeven van verschillende
types corpora: Uit welke gegevens (teksten) is een corpus samengesteld?
Welke gegevens zijn eraan toegevoegd (annotatie)? Waarvoor zijn die
verrijkte gegevens bruikbaar? Hoe worden corpora gerepresenteerd
(formaten, formalismen, procedures)?
- Vervolgens gaat de aandacht naar de verwerving, de annotatie en de
verwerking van corpusgegevens. De nadruk ligt daarbij vooral op het
praktisch omgaan met corpora van gesproken en geschreven taal: (i)
transcriptie van gesproken taal, (ii) linguïstische verrijking,
annotatie, codering van corpora, (iii) hulpmiddelen om de codering
(deels) automatisch uit te voeren. In essentie komt dit neer op het
systematisch opnemen van informatie zodat een automatische extractie
van die informatie mogelijk wordt.
- Voor het verwerken van corpora staan een aantal electronisch
hulpmiddelen ter beschikking. De functionaliteit daarvan wordt
praktisch aangetoond aan de hand van twee software tools, nl. CLAN en
PERL. Deze tools worden praktisch ingeoefend.
4. Werkvormen Contactmomenten: HoorcollegesOefeningensessies
5. Evaluatievormen Permanente evaluatie: OefeningenOpdrachten
6. Noodzakelijk studiemateriaal Hammond, M. 2003. Programming for linguists: Perl for language researchers. Oxford: Blackwell.
Schwartz, R. & Christiansen, T. 1997. Learning Perl. Cambridge: O’Reilley.
7. Facultatief studiemateriaal
8. Studiebegeleiding
laatste aanpassing: laatste aanpassing: 26/05/2007 10:21 steven.gillis
|
|
|