Start | Personen | Google | Route | Contact | AfdrukkenLogin 
Opleidingsonderdelen 2007-2008  
    

Corpuslinguïstiek
 
Academiejaar:2007-2008
Code opleidingsonderdeel:FLWTKM0100
Semester:1e semester
Studiepunten:6
Uren Studietijd:168
Uren theorie:30,00
Uren praktijk:15,00
Uren andere:
Deeltijds programma:1
Titularis(sen)Steven Gillis
Taal waarin de cursus wordt gedoceerd:Nederlands
Info semesterexamen:verplicht semesterexamen in januari
Info contractrestrictie:



1. Aanvangscompetenties (begintermen)
*Algemene competenties
Basisbegrippen taalkunde zoals aangebracht in “Algmene Taalkunde”, “Nederlandse taalkunde 4: synchrone grammatica”


*Volgtijdelijkheid





2. Eindcompetenties (eindtermen)
•    De student beheerst kernbegrippen uit de corpuslinguïstiek.
•    De student kan corpora onderzoeken met de CLAN software, en kan eenvoudige PERL scripts schrijven.





3. Inhoud
Het analyseren van corpora van gesproken of geschreven taal is in de taalkunde (o.m. in de computerlinguïstiek, e.d.) een veelgebruikte methode. Corpora geven op de eerste plaats een beeld van het fe  itelijk taalgebruik (geschreven / gesproken). Een tweede belangrijk aspect is de computerverwerking van corpora: de automatische verwerking van gegevens ligt binnen het bereik van elke taalkundige, of meer algemeen binnen het bereik van iedereen die teksten (in de ruimste betekenis van het woord) bestudeert.
- In een inleidend deel wordt een overzicht gegeven van verschillende types corpora: Uit welke gegevens (teksten) is een corpus samengesteld? Welke gegevens zijn eraan toegevoegd (annotatie)? Waarvoor zijn die verrijkte gegevens bruikbaar? Hoe worden corpora gerepresenteerd (formaten, formalismen, procedures)?
- Vervolgens gaat de aandacht naar de verwerving, de annotatie en de verwerking van corpusgegevens. De nadruk ligt daarbij vooral op het praktisch omgaan met corpora van gesproken en geschreven taal: (i) transcriptie van gesproken taal, (ii) linguïstische verrijking, annotatie, codering van corpora, (iii) hulpmiddelen om de codering (deels) automatisch uit te voeren. In essentie komt dit neer op het systematisch opnemen van informatie zodat een automatische extractie van die informatie mogelijk wordt.
- Voor het verwerken van corpora staan een aantal electronisch hulpmiddelen ter beschikking. De functionaliteit daarvan wordt praktisch aangetoond aan de hand van twee software tools, nl. CLAN en PERL. Deze tools worden praktisch ingeoefend.





4. Werkvormen
Contactmomenten:
  • Hoorcolleges
  • Oefeningensessies



  • 5. Evaluatievormen
    Permanente evaluatie:
  • Oefeningen
  • Opdrachten



  • 6. Noodzakelijk studiemateriaal
    Hammond, M. 2003. Programming for linguists: Perl for language researchers. Oxford: Blackwell.
    Schwartz, R. & Christiansen, T. 1997. Learning Perl. Cambridge: O’Reilley.





    7. Facultatief studiemateriaal




    8. Studiebegeleiding




    laatste aanpassing: laatste aanpassing: 26/05/2007 10:21 steven.gillis 



     
    Inhoudsverantwoordelijke(n) : Contacteer de faculteit van de opleiding