|
|
|
|
|
|
|
|
Centrum voor Computerlinguïstiek en Psycholinguïstiek (CLiPS)
|
|
|
|
|
|
Samenstelling
|
|
|
Krachtlijnen
|
Het onderzoek van CLiPS speelt zich af in een interdisciplinair gebied tussen taalkunde, psychologie en informatica (Artificiële Intelligentie). Er zijn drie belangrijke onderzoeksgebieden:
Psycholinguïstiek, taalverwerving (coördinator: Steven Gillis). Het belangrijkste onderwerp hier is hoe jonge kinderen de taal leren die ze horen. Dit proces start nog voor baby''s woorden en frasen produceren. Daarom bestuderen we de vocaliseringen van baby''s vanaf de geboorte, en hoe ze steeds meer `woord-achtig'' worden. Zodra ze woorden beginnen te gebruiken analyseren we de fonologische ontwikkeling (de klank- en lettergreeppatronen waaruit ze bestaan, klemtoon en intonatie, `spaakfouten'') en morfofonologische ontwikkeling (bijv. hoe leren ze verkleinwoorden of meervouden?), en syntactische ontwikkeling (bijv. hoe leren ze de basiswoordvolgorde van het Nederlands?). Bovendien bestuderen we hoe jonge kinderen de betekenis van woorden leren en hoe ze deze woorden juist leren gebruiken. Een ander belangrijk onderzoeksgebied binnen taalverwerving is de mate waarin de taalomgeving van een kind voldoende informatie voorziet waarmee taal geleerd kan worden. Op dit moment hebben we een uitgesproken interesse in de taalontwikkeling van kinderen met verschillende kwaliteit van gehoor: de taalverwerving van normaal horende kinderen wordt vergeleken met die van gehoorgestoorde kinderen met een conventioneel hoorapparaat en met die van dove kinderen met `received hearing'' dank zij een cochleair implantaat. Het onderzoek richt zich vooral op de verwerving van Nederlands als eerste taal, maar er is ook aandacht voor taalvergelijkende studies waarin de verwerving van specifieke fenomenen bestudeerd wordt in typologisch verschillende talen.
Psycholinguïstiek, taalverwerking (coördinator: Dominiek Sandra). De nadruk ligt op de aard van de mentale representaties en processen die taalgebruik in ervaren taalgebruikers ondersteunen, meer bepaald in de domeinen van spelling en lezen. In de studie van het leesproces gaat de aandacht vooral naar visuele woordherkenning. De thema''s die de laatste jaren aan bod zijn gekomen zijn de rol van morfologische structuur bij lexicale toegang en de vraag of lexicale toegang in tweetaligen taalselectief is of niet. Deze onderwerpen worden bestudeerd in reactietijdexperimenten en maken gebruik van verschillende experimentele paradigma''s. In onze studie van het spellingproces proberen we te verklaren waarom descriptief eenvoudige, regelgebaseerde woordvormen (Nederlandse werkwoordsvormen) aanleiding geven tot zoveel spelfouten bij ervaren spellers. Experimenten en foutencorpora zijn twee soorten empirische data. De centrale verklarende concepten bij deze onderzoekslijn zijn de frequentie van voorkomen van orthografische patronen op lexicaal niveau, en analogieprocessen op sublexicaal niveau. Tenslotte bestuderen we de mogelijkheid om morfosyntactische en syntactische taalverwerking met behulp vaan exemplaargebaseerde analogie te verklaren eerder dan met behulp van regeltoepassing. Hier steunen we op experimenteel en modelleringwerk.
Computerlinguïstiek (coördinator: Walter Daelemans). Basisonderzoek in de computerlinguïstiek bij CLiPS bestudeert computationele methodes voor de representatie, de verwerving en het gebruik van taalkennis. We richten ons daarbij vooral op de toepassing van statistische en zelflerende methodes, getraind op corpusdata, om menselijk taalverwerving en taalverwerking te verklaren en om systemen voor tekstinterpretatie te ontwikkelen die accuraat, efficiënt en robuust genoeg zijn om ingezet te kunnen worden in praktische toepassingen. We ontwikkelen daartoe algoritmen voor zelflerende systemen die aangepast zijn aan de eigenschappen van natuurlijke taal (weinig regelmatigheden, veel onregelmatigheden en uitzonderingen), en ontwikkelen nieuwe methodes voor het modelleren van deze taaldata. Ons strategisch onderzoek speelt zich af in het domein van de taaltechnologie, de ontwikkeling van taalverwerkingssystemen die bijdragen aan het oplossen van informatie- en vertalingsobstakels. De research aandacht gaat hier vooral naar `text analytics'' (extractie van kennis uit niet-gestructureerde tekstgegevens). Recent werden in de groep ook onderzoeksinitiatieven ontwikkeld rond taaltechnologie voor Afrikaanse talen en rond `Digital Humanities'' (vooral in de deelgebieden computationele stylometrie en taaltechnologie voor oude varianten van het Nederlands).
|
|
Website
|
http://www.clips.ua.ac.be/
|
|
Projecten
|
Toon de projecten van deze onderzoeksgroep - Automatische monitoring voor Cyberspace Toepassingen (AMiCA) 01/01/2013 - 31/12/2016
| Abstract | Hoewel het gebruik van het internet door kinderen meestal volkomen veilig en verrijkend is, zijn er ook risico''s verbonden aan het gebruik van vooral social networking sites (SNS). Verschillende initiatieven werden opgezet om kinderen te beschermen tegen deze potentiële bedreigingen door preventie en door in te grijpen als het misloopt, maar gezien de enorme overvloed aan informatie is het onmogelijk voor de belanghebbenden om alle potentieel schadelijke situaties (zoals cyberpesten, suïcidaal gedrag of grooming door pedofielen) te traceren.
Het automatisch traceren van schadelijke inhoud en schadelijke gedragingen vereist een crossmedia filtering aanpak, die onmiddellijk risico''s kan detecteren, die kritieke situaties doorgeeft aan moderatoren van sociale netwerksites en die accurate kwantitatieve informatie verstrekt zodat longitudinale en beleidsondersteunende informatie ter beschikking komt over de online veiligheid van kinderen. Deze filtering zal gebeuren rekening houdend met de verwachtingen en online ervaringen van adolescenten en kinderen en ook gebruik makend van een aanpak die op een respectvolle en zorgzame manier omgaat met privacy-gevoelige informatie. | | Looptijd | 01/01/2013 - 31/12/2016 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- De accuraatheid van de spraakproductie van jonge kinderen: normaal horende kinderen en dove kinderen met
een cochleair implantaat. 01/01/2013 - 31/12/2016 | Abstract | Dit project betreft fundamenteel kennisgrensverleggend onderzoek gefinancierd door het Fonds voor Wetenschappelijk Onderzoek-Vlaanderen. Het project werd betoelaagd na selectie door het bevoegde FWO-expertpanel. | | Looptijd | 01/01/2013 - 31/12/2016 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Digitaal Archief van Belgische Neo-Avant-gardetijdschriften (DABNAP). 01/01/2013 - 31/12/2014
| Abstract | De naoorlogse kunstenaarstijdschriften vormen een unieke informatiebron over én een sprekende getuigenis van de doe-het-zelfpraktijk kenmerkend voor de neo-avant-garde. Dit project wil een omvangrijk en representatief corpus van Belgische neo-avant-gardetijdschriften digitaliseren, en vervolgens aan de hand van innovatieve, geautomatiseerde taaltechnologie het achterliggende netwerk van kunstenaars in beeld brengen en analyseren. | | Looptijd | 01/01/2013 - 31/12/2014 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Audiodescriptie in het Nederlands: Een corpusgebaseerde studie van het taalgebruik in een nieuw, multimodaal teksttype. 01/10/2012 - 30/09/2016
| Abstract | Het onderhavige project is een corpusgebaseerde studie van de taalkundige eigenschappen van een nieuw multimodaal teksttype binnen audiovisuele vertaling (AV), namelijk audiobeschrijving of audiodescriptie (AD) voor blinden en slechtzienden. De doelstelling van dit interdisciplinaire project is het in kaart brengen van de lexico-grammaticale kenmerken van AD-scripts en het onderzoeken van de rol die deze kenmerken spelen voor de specifieke communicatieve functie van de tekst als geheel. Op die manier wil dit project een antwoord bieden op één van de centrale onderzoeksvragen binnen het domein: hoe worden beelden omgezet in woorden en wat zijn de implicaties voor het gehanteerde Nederlands? Recent pilootonderzoek wijst uit dat de taal van AD tekstspecifieke grammaticale (morfo-syntactische) en lexicale kenmerken vertoont en dat corpusanalyse toelaat om die specifieke patronen bloot te leggen. Dit onderzoek beoogt, ten eerste, de uitbouw van een omvangrijk en gevarieerd tekstcorpus van AD-scripts van in het Nederlands audiobeschreven films en series, waarop dan, ten tweede, kwantitatief linguïstisch onderzoek verricht kan worden met als doel de prominente lexico-grammaticale kenmerken van dit teksttype te identificeren. De kwantitatieve analyses worden ten slotte aangevuld met een kwalitatieve analyse van de (communicatieve) functie van deze kenmerken. Een bijzonder aandachtspunt bij dit tweede deel vormt het multimodale karakter van het teksttype: het AD-script komt pas tot zijn recht in interactie met de dialogen, muziek en geluidseffecten van de originele film of serie, waarmee het een coherent geheel vormt. Een kwalitatieve functie-analyse laat toe deze unieke wisselwerking tussen de taal van AD en de andere kanalen van het audiovisuele materiaal te verkennen. Finaal streeft het project naar een uitvoerige linguïstische en ''audience design'' georiënteerde analyse van AD-discourse, die een antwoord moet bieden op de vraag wat AD tot een apart teksttype maakt, hoe de taal- en stijlkenmerken ingezet worden om bij te dragen tot een maximaal communicatief rendement en hoe diezelfde kenmerken gerelateerd zijn aan de functie en de multimodale inbedding van AD. Dit project is pioniersonderzoek binnen het domein: er is internationale onderzoeksbelangstelling maar voor Vlaanderen en Nederland is er nog geen onderzoek beschikbaar. Bovendien vormt het een onmisbare basis voor toepassingsgericht vervolgonderzoek. AD in Vlaanderen staat in zijn kinderschoenen (zo is de VRT in 2012 voor het eerst gestart met het aanbieden van AD bij de serie Witse). Fundamentele onderzoeksprojecten als dit bieden dan ook de nodige ondersteuning voor de ontwikkeling van een lokale AD-traditie die aan internationale kwaliteitseisen voldoet. | | Looptijd | 01/10/2012 - 30/09/2016 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Meervoudsvormen van Antwerps Jiddische zelfstandige naamwoorden (AYNP). 01/09/2012 - 31/08/2013
| Abstract | Dit project kadert in een onderzoeksopdracht tussen enerzijds UA en anderzijds EU. UA levert aan EU de onderzoeksresultaten genoemd in de titel van het project onder de voorwaarden zoals vastgelegd in voorliggend contract. | | Looptijd | 01/09/2012 - 31/08/2013 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Automatic Compound Processing. 01/07/2012 - 31/12/2013
| Abstract | Dit project kadert in een onderzoeksopdracht tussen enerzijds UA en anderzijds NTU. UA levert aan NTU de onderzoeksresultaten genoemd in de titel van het project onder de voorwaarden zoals vastgelegd in voorliggend contract. | | Looptijd | 01/07/2012 - 31/12/2013 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Morfosyntactische taalvaardigheid bij dove kinderen met een cochleair implantaat: een cross-linguïstisch onderzoek naar het Nederlands en het Duits (MORLAS). 01/07/2012 - 30/09/2013
| Abstract | Dit project kadert in een onderzoeksopdracht tussen enerzijds UA en anderzijds EU. UA levert aan EU de onderzoeksresultaten genoemd in de titel van het project onder de voorwaarden zoals vastgelegd in voorliggend contract. | | Looptijd | 01/07/2012 - 30/09/2013 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Abstracte regels of statistisch leren? De impact van lexicale en sublexicale homofonie tijdens het spellen en lezen van homofone werkwoordvormen. 01/01/2012 - 31/12/2015
| Abstract | Dit project betreft fundamenteel kennisgrensverleggend onderzoek gefinancierd door het Fonds voor Wetenschappelijk Onderzoek-Vlaanderen. Het project werd betoelaagd na selectie door het bevoegde FWO-expertpanel. | | Looptijd | 01/01/2012 - 31/12/2015 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Wat gemaskeerde woorden kunnen doen: Preactiveren of Retrospectief ophalen? 01/10/2011 - 30/09/2013
| Abstract | Dit project betreft fundamenteel kennisgrensverleggend onderzoek gefinancierd door het Fonds voor Wetenschappelijk Onderzoek-Vlaanderen. Het project werd betoelaagd na selectie door het bevoegde FWO-expertpanel. | | Looptijd | 01/10/2011 - 30/09/2013 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Begrijpelijk Nederlands: de toegankelijkheid van de taal van het journaal voor verschillende doelgroepen. 14/09/2011 - 31/12/2012
| Abstract | Dit project kadert in een onderzoeksopdracht tussen enerzijds UA en anderzijds VRT. UA levert aan VRT de onderzoeksresultaten genoemd in de titel van het project onder de voorwaarden zoals vastgelegd in voorliggend contract. | | Looptijd | 14/09/2011 - 31/12/2012 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Adaptation and Learning for Assistive Domestic Vocal Interfaces (ALADIN). 01/01/2011 - 31/12/2014
| Abstract | In dit project worden zelflerende spraakinterfaces ontwikkeld die voldoen voor het aansturen van hulpmiddelen door personen met fysische beperkingen. | | Looptijd | 01/01/2011 - 31/12/2014 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Taalaanbod in de taalverwerving: horende kinderen met verschillende SES achtergrond en dove kinderen met een cochleair implantaat. 01/01/2011 - 31/12/2014
| Abstract | Dit project betreft fundamenteel kennisgrensverleggend onderzoek gefinancierd door het Fonds voor Wetenschappelijk Onderzoek-Vlaanderen. Het project werd betoelaagd na selectie door het bevoegde FWO-expertpanel. | | Looptijd | 01/01/2011 - 31/12/2014 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Optimization of the automated fitting to outcomes expert with language-independent hearing-in-noise test battery and electro-acoustical test box for cochlear implant users (OPTI-FOX). 01/11/2010 - 30/09/2012
| Abstract | Dit project kadert in een onderzoeksopdracht tussen enerzijds UA en anderzijds EU. UA levert aan EU de onderzoeksresultaten genoemd in de titel van het project onder de voorwaarden zoals vastgelegd in voorliggend contract. | | Looptijd | 01/11/2010 - 30/09/2012 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Automatic monitoring for cyberspace applications (AMICA). 01/10/2010 - 30/09/2011
| Abstract | Het AMiCA ("Automatic Monitoring for Cyberspace Applications") project wil relevante wehsites zoals blogs, chat rooms en sociale netwerksites monitoren met het oog op de automatische detectie van schadelijke of alarmerende berichten, foto''s en video''s. Gezien het stijgend belang van beeld (vb. porno, automutilatie) in dergelijke toepassingen wordt uitgegaan van een interdisciplinaire aanpak waarin tekst- en beeldverwerking gecombineerd worden. Classificatiessystemen zullen gebouwd worden die dergelijke schadelijke berichten "on-the-fly" knnen detecteren. Bij detectie van een kritieke situatie (vh. cyherpesten), worden de relevante gebruikers hiervan op de hoogte gebracht. | | Looptijd | 01/10/2010 - 30/09/2011 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Consultancy en wetenschappelijke bijstand voor het publiceerbaar maken van gegevens uit het DUAL-PRO project en voorbereiden van de grant agreement voor het Opti-Fox 7th FP-SME project. 01/07/2010 - 30/10/2010
| Abstract | Het verlenen van consultancy en wetenschappelijke bijstand voor het publiceerbaar maken van gegevens die voortvloeien uit het DUAL-PRO 7th FP-SME project alsook voor het voorbereiden van de grant agreement voor het Opti-Fox 7th FP-SME project | | Looptijd | 01/07/2010 - 30/10/2010 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- De chattaal van Vlaamse tieners: een taalgeografische analyse van Vlaamse (sub)standaardiseringsprocessen tegen de achtergrond van de internationale chatcultuur. 01/01/2010 - 31/12/2013
| Abstract | 1 Chattaal en tienertaal: glocaliseringsprocessen en de impact van het Engels:
ONDERZOEKSVRAGEN
-Welke rol speelt het Engels in het linguïstisch repertoire van Vlaamse jongeren? Hoe manifesteert de inbedding in de internationale chatcultuur zich in de chattaal van Vlaamse jongeren?
-Welke transformatieprocessen ondergaat het Engels in de chatspeak van de tieners (op verschillende niveaus: morfologisch, semantisch, grafematisch)?
-In welke mate is er een tijd van globalisering ook nog ruimte voor lokale dynamiek? Vertoont de tienertaal van Vlaamse jongeren nog regionale diversiteit?
2 De evolutie van het Nederlands in Vlaanderen:
ONDERZOEKSVRAGEN:
-In welke mate integreren jongeren morfo-syntactische en fonologische Brabandismen in hun chattaal: wat zijn de relatieve frequentieverhoudingen tussen Brabantse regiolectische varianten, niet-Brabantse regiolectische varianten en Algemeen Nederlandse varianten voor de verschillende variabelen?
-Wat is de impact van de onafhankelijke variabele ''regionale herkomst''? Is er een correlatie tussen de relatieve vertegenwoordiging van Brabantse regiolectismen en de regio waaruit de informant afkomstig is? Integreren jongeren uit West-Vlaanderen, Oost-Vlaanderen en Limburg Brabandismen in hun chattaal en in welke mate doen ze dat? Of: in welke mate zijn Brabantse regiolectismen expansief?
-Wat is de impact van het al dan niet regio-overschrijdend karakter van de chatcommunicatie? Gebruiken jongeren van niet-Brabants/Antwerpse herkomst meer morfo-syntactische en fonologische Brabandismen in ''interregionale'' communicatie dan in ''intraregionale'' (lokale) communicatie?
-Wat is de pragmatische functie van de gehanteerde variëteiten?
Vormt het antwoord op de voorgaande vragen een bevestiging van de stelling dat zich in Vlaanderen een autonoom informeel standaardiseringsproces voltrekt dat gekarakteriseerd wordt door een toenemend/veralgemeend gebruik van de/een Brabants gekleurde tussentaal?
Wat leert dit onderzoek ons over de mogelijkheden van chatmateriaal voor de studie van taalvariatie en taalverandering ''in progress''? | | Looptijd | 01/01/2010 - 31/12/2013 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Een veiliger internet: het (semi)automatisch herkennen van internetpedofilie in meertalige online social networks. 01/01/2010 - 31/12/2013
| Abstract | In dit project stellen we enerzijds een methodologie voor om de manuele controle van peer-to-peernetwerken te (semi)automatiseren en anderzijds een methodologie voor de automatische extractie en analyse van stijlkenmerken (geassocieerd met persoonlijkheid, leeftijdsgroep en misleidend taalgebruik) die we willen toepassen op individuele pedofielen en groepen van pedofielen in chatruimtes. | | Looptijd | 01/01/2010 - 31/12/2013 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Statistisch Relationeel Leren van Natuurlijke Taal. 01/01/2010 - 31/12/2013
| Abstract | Dit project wil onderzoeken hoe technieken van statistisch relationeel leren gebruikt kunnen worden voor het leren van natuurlijke taal. Daarbij zal de nadruk liggen op uitdagende taken van de natuurlijke taalverwerking, zoals "semantic role labeling", waarbij syntactische en semantische afhankelijkheden, gestructureerde en ongestructureerde gegevens, lokale en globale modellen, en probabilistische en logische informatie met elkaar moeten gecombineerd worden. Voor wat betreft het statistisch relationeel leren zal onze aandacht vooral uitgaan naar representaties die gebaseerd zijn op probabilistische uitbreidingen van de programmeertaal Prolog. Het project wil hierbij niet alleen betere resultaten in de natuurlijke taalverwerking realiseren maar ook betere algoritmen en systemen voor statistisch relationeel leren. | | Looptijd | 01/01/2010 - 31/12/2013 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Training van Interpersoonlijke communicatie door natuurlijke taalinteractie met autonome virtuele karakters (deLearyous). 01/01/2010 - 31/12/2012
| Abstract | Het doel van het deLearyous-onderzoeksproject is het ontwikkelen van een interactieve serious 3D-game voor het trainen van interpersoonlijke communicatievaardigheden binnen een professionele context, bvb. in een werkgever-werknemer- of klant-bediende-relatie. Het spel bestaat erin de trainee te laten interageren met autonome virtuele karakters, die op een realistische en expressieve manier inspelen op de input van de speler. Op deze wijze kan de trainee verschillende gedragspatronen en rollen op eigen tempo inoefenen, en dit in een veilige, virtuele omgeving. De rol can CLiPS in het project is de ontwikkeling van algoritmen en methodes voor emotie-analyse van tekst, het detecteren van onderwerpen in tekst, en dialoogvoering. | | Looptijd | 01/01/2010 - 31/12/2012 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Project TST Tools voor het Nederlands als Webservices in een Workflow (TTNWW). 01/01/2010 - 30/09/2012
| Abstract | Het doel van het project is om allerlei bestaande componenten die ontwikkeld zijn in CGN en STEVIN in te passen in een workflowsysteem voor web services dat ontwikkeld wordt in CLARIN-verband, en dit geheel te laten draaien op servers van erkende CLARIN-centra, met als doel faciliteiten aan te bieden voor onderzoekers uit de HSS met geen of weinig technische bagage. Deze faciliteiten moeten 1) hen in staat stellen hun onderzoeksvragen beter of makkelijker aan te pakken en 2) mogelijkheden bieden voor het formuleren van nieuwe typen onderzoeksvragen, i.e. onderzoeksvragen die voor CLARIN niet gesteld konden worden of niet doelmatig te beantwoorden waren. | | Looptijd | 01/01/2010 - 30/09/2012 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Een web service voor stylometrie- en leesbaarheidsonderzoek voor het Nederlands (STYLENE). 01/01/2010 - 31/12/2011
| Abstract | Doel van het project is de implementatie van een robuust, modulair stysteem voor stylometrie- en leesbaarheidsonderzoek op basis van bestaande technieken voor automatische tekstanalyse en zelflerende technieken, en de ontwikkeling van een web service die onderzoekers in de HSS toelaat teksten te analyseren met behulp van het systeem. Op die manier wil het project recente vooruitgang op het gebied van het computationeel modelleren van stijl en leesbaarheid beschikbaar maken voor onderzoek in de sociale en geesteswetenschappen. | | Looptijd | 01/01/2010 - 31/12/2011 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- De computationele leerbaarheid van morfologisch complexe talen. 01/10/2009 - 30/09/2012
| Abstract | Doelstelling van het project: Traditionele systemen voor spellingcontrole maken gebruik van een woordenlijst. Wanneer een
woord niet voorkomt in de woordenlijst, markeert het systeem het woord als "fout". Recente systemen (o.a. Németh 2009) benaderen het probleem van spellingcontrole voor agglutinerende talen vanuit een andere invalshoek: een woord wordt beschouwd als een spelfout, als het niet kan worden gegenereerd door eenachterliggend morfotactisch model. In dit project onderzoeken we hoe een spellingchecker kan gebruikt worden als hulpmiddel bij het automatisch leren van een morfotactisch systeem voor het Swahili. | | Looptijd | 01/10/2009 - 30/09/2012 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Exemplaargebaseerde modellen van menselijke zinsverwerking. 01/10/2009 - 30/09/2011
| Abstract | Dit project onderzoekt de mogelijkheid om een exemplaargebaseerd model van menselijke zinsverwerking te ontwikkelen, dat in staat is om de relaties tussen de verschillende woorden van een zin op een psychologisch adequate manier te identificeren. Om dit model te evalueren wordt nagegaan of de voorspellingen van het model correleren met experimentele gegevens over de verwerking van structureel niet-ambigue en tijdelijk structureel ambigue zinnen.
Voor de toetsing van het model beperken we ons tot de relatie tussen het werkwoord en zijn argumenten. Op die manier kunnen een aantal cruciale problemen van menselijke zinsverwerking worden onderzocht. | | Looptijd | 01/10/2009 - 30/09/2011 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Naar een synthese van kennisgebaseerde en datagebaseerde methodes in de computertaalkunde. 01/10/2009 - 30/09/2010
| Abstract | Hybride systemen voor natuurlijke taalverwerking die diepe, op taalkundig inzicht gebaseerde, analyses combineren met de inductieve datagebaseerde methodes kunnen een significante verbetering van de accuraatheid en toepasbaarheid van de computertaalkunde bewerkstelligen. Er zijn evenwel verschillende manieren waarop een dergelijk hybridisering gerealiseerd kan worden. In dit project zal ik vooral kijken naar de cognitiewetenschap als inspiratiebron voor nieuwe hybride aanpakken. Dit werk bouwt voort op eerder werk rond memory-based language processing als cognitief relevant model. | | Looptijd | 01/10/2009 - 30/09/2010 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Machine learning technieken voor datamining en hun toepassingen. 01/01/2009 - 31/12/2013
| Abstract | De onderzoeksgemeenschap streeft naar de versterking en de coordinatie van het Vlaamse onderzoek op het gebied van machine learning voor datamining in het algemeen, en bepaalde belangrijke toepassingen zoals bioinformatica en tekstmining in het bijzonder. Vlaamse participanten: Computational Modeling Lab (VUB), CNTS (UA), ESAT-SISTA (KU Leuven), DTAI (KU Leuven), ISLab (UA). | | Looptijd | 01/01/2009 - 31/12/2013 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Taalverwerking. 01/01/2009 - 31/12/2013
| Abstract | Dit project betreft fundamenteel kennisgrensverleggend onderzoek gefinancierd door het Fonds voor Wetenschappelijk Onderzoek-Vlaanderen. Het project werd betoelaagd na selectie door het bevoegde FWO-expertpanel. | | Looptijd | 01/01/2009 - 31/12/2013 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- De bron van gemaskeerde primingeffecten: het lexicaal of het episodisch geheugen? 01/01/2009 - 31/12/2012
| Abstract | Gemaskeerde priming is een techniek waarbij een woord zo kort wordt aangeboden dat het niet bewust kan worden waargenomen, terwijl het toch een effect kan hebben op de verwerkingssnelheid van een onmiddellijk daarop volgend woord. Deze techniek wordt daarom vaak gebruikt in de psycholinguïstiek om de geheugenstructuren en -processen achter woordherkenning te onderzoeken. Recent is echter discussie ontstaan over de lexicale aard van deze zgn. gemaskeerde primingeffecten (zie Bodner & Masson, 2003, 2004, 2006): vertellen ze werkelijk iets over de structuur van het mentale lexicon of reflecteren ze residuele activatie in het episodische geheugen, waar mensen persoonlijke ervaringen opslaan? Een reeks experimenten moet antwoord geven op de vraag of een lexicale interpretatie van het effect verdedigbaar is. Gegeven de populariteit van de techniek, kunnen de uitkomsten van dit onderzoek verstrekkende gevolgen hebben voor de theorievorming m.b.t. het mentale lexicon. | | Looptijd | 01/01/2009 - 31/12/2012 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Artificiële Creativiteit in visuele communicatie en kunst: een algoritme voor spitsvondige, evoluerende conceptontwikkeling en datavisualisatie. 01/10/2008 - 30/09/2012
| Abstract | Met behulp van technieken uit de Artificiële Intelligentie wordt een computeralgoritme ontwikkeld dat een inhoudelijke opdracht (of dataset) ontleedt op kernbegrippen en relaties, daarbij relevante informatie opzoekt, verwerkt, bundelt en deze tenslotte in relatie brengt tot creatieve en visuele oplossingen. Dit algoritme wil menselijke creativiteit nabootsen door bestaande concepten te verbinden en te hercombineren tot er innovatieve visuele uitvoer uit opborrelt. De visuele uitvoer evolueert mee naargelang de inhoudelijke data wijzigt en uitbreidt. | | Looptijd | 01/10/2008 - 30/09/2012 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Priming-effecten en dialectverwerving: regelgebaseerde versus exemplaargebaseerde verklaringen. 01/10/2008 - 27/08/2012
| Abstract | Dit project heeft als doel een recente taaltheoretische discussie te helpen beslechten op basis van primingexperimenten. Die discussie betreft de vraag of taalverwerving en -verwerking het best via een regelgebaseerd (''rule-based'') dan wel een exemplaargebaseerd/voorbeeldgebaseerd (''exemplar-based'') model beschreven kunnen worden. Meer bepaald zal via priming-experimenten nagegaan worden of de twee modellen juiste voorspellingen doen over de verwerving van de fonologie en het lexicon van een dialect als tweede taal door kinderen die met een standaardtalige variëteit zijn opgegroeid. | | Looptijd | 01/10/2008 - 27/08/2012 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Wetenschappelijke opdracht in het kader van het onderzoek naar spraak- en taalverwerving bij cochleaire implantaten bij jonge kinderen. 01/10/2008 - 30/09/2009
| Abstract | Geen abstract gevonden | | Looptijd | 01/10/2008 - 30/09/2009 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Fostering Language resources Network (FlaReNet). 01/09/2008 - 01/09/2011
| Abstract | Internationale samenwerking en de creatie van een gemeenschap zijn de belangrijkste positieve factoren voor een coherente ontwikkeling van het gebied van Taalhulpmiddelen in de nabije toekomst. FlaReNet is een Europees forum voor de facilitering van interactie tussen belanghebbenden in het gebied van Taalhulpmiddelen. De organisatie ervan houdt er rekening mee dat Taalhulpmiddelen verschillende dimensies vertonen en vanuit verschillende perspectieven benderd moeten worden: technisch, maar ook organisatorisch, economisch, juridisch en politiek. Het netwerk richt zich eveneens op de multiculturele en multilinguale aspecten die essentieel zijn voor toegang en gebruik van digitale inhoud in het Europa van vandaag. | | Looptijd | 01/09/2008 - 01/09/2011 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Dual electric-acoustic speech processor with linguistic assessment tools for deaf individuals with residual low frequency hearing. (DUAL-PRO) 01/07/2008 - 30/06/2010
| Abstract | Tot op heden kunnen patiënten met sensori-neural gehoorverlies geholpen worden hetzij met klassieke hoortoestellen (op basis van akoestische stimulatie), hetzij met cochleaire implantaten (op basis van electrische stimulatie). Vaak wordt er voor klassieke hoortoestellen geopteerd bij matige tot zware slechthorendheid (tot 90 dB gehoorverlies) en voor cochleaire implantaten (CI) in geval van doofheid (gehoorverlies > 90dB). Met het oog op een optimale perceptie van het spraaksignaal werden CIs voornamelijk ontworpen om de midden- en hoge frequenties van het geluid te coderen (spectrale codering). De implantaten presteren evenwel minder goed in de lage frequenties (temporele codering). Deze bevatten voornamelijk informatie aangaande tonaliteit, musicaliteit en timbre. Vele CI-gebruikers komen derhalve tot een goed spraakverstaan en ¿productie, maar vertonen belangrijke deficieten in de perceptie van muziek en de intonationele aspecten van taal. In het geval van jonge kinderen hebben dergelijke deficieten een belangrijke invloed op het algehele taalontwikkelingsproces. Men kan dus verwachten dat een verbetering in de perceptie van lage frequenties hun talige capaciteiten zal doen toenemen en derhalve ook hun kans op integratie in het reguliere onderwijs drastisch zal doen verhogen.
Momenteel is er evenwel geen eenduidige oplossing om CI spraakprocessoren aan te passen met het oog op een betere codering van de lage frequenties. De pogingen die tot nog toe werden ondernomen resulteerden weliswaar in de beoogde verbetering in muziekperceptie, maar hadden als ongewild neveneffect dat er duidelijke problemen optraden met betrekking tot foneemperceptie. Een beloftevol alternatief bestaat erin een spraakprocessor te ontwerpen die de voordelen van het klassiek hoorapparaat en het cochleair implantaat in één toestel combineert: de akoestische stimulatie van de lage frequenties geeft dan informatie over de temporele aspecten van het geluid, terwijl de implanttechnologie de midden- en lage frequenties stimuleert en derhalve spectrale informatie verschaft. Een dergelijke hybride stimulatie heeft een enorm potentieel, in het bijzonder voor mogelijk CI-kandidaten op basis van doofheid in de hoge frequenties, maar met residueel gehoor in de lage frequenties.
Doelstellingen van het project: (i) het optimaliseren van het gehoor van de dove patiënt door het ontwikkelen van een nieuw hoortoestel waarin beide types van stimulatie worden gecombineerd in één toestel en één oor (ipsilaterale hybride akoestisch-electrische stimulatie); (ii) het ontwikkelen van een testbatterij voor het meten van prosodische perceptie, d.i. ritme en melodie van de taal; (iii) aan de hand van deze testbatterij de kwaliteit van de huidige generatie van cochleaire implantaten en van klassieke hoortoestellen te vergelijken met die van het nieuw ontwikkelde hybride electrisch-akoestische prototype. | | Looptijd | 01/07/2008 - 30/06/2010 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- NEON: Nederlandse ondertiteling. 01/06/2008 - 31/05/2009
| Abstract | In dit project ontwikkelt CNTS een systeem voor automatische ondertiteling op basis van de output van spraakherkenning. Zo''n systeem laat toe om zinnen waar nodig te vereenvoudigen en in te korten zonder dat ze ongrammaticaal worden of veel van hun betekenis verliezen. Als methode wordt een combinatie van regelgebaseerde en statistische technieken gebruikt. Het project verloopt in samenwerking met onder meer de VRT en de NOS en de spraakherkenningsonderzoeksgroep van de K.U. Leuven. | | Looptijd | 01/06/2008 - 31/05/2009 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Een evaluatiecorpus voor automatisch samenvatten. 01/01/2008 - 30/04/2009
| Abstract | In dit BOF project willen we een corpus voor het Nederlands aanleggen voor het evalueren en ontwikkelen van automatische samenvatters. Automatisch gegenereerde samenvattingen kunnen helpen met het doorzoeken en aanbieden van grote hoeveelheden informatie. Voor het ontwikkelen van automatische samenvatters is de evaluatiestap zeer belangrijk. Het evaluatiecorpus zal bestaan uit 200 teksten en minimaal vijf verschillende samenvattingen per tekst. | | Looptijd | 01/01/2008 - 30/04/2009 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- De chattaal van Vlaamse tieners: een taalgeografische analyse van Vlaamse (sub)standaardiseringsprocessen. 01/01/2008 - 31/12/2008
| Abstract | Onderzoeksvragen:
-In welke mate integreren jongeren morfo-syntactische Brabandismen in hun chattaal?
-Wat is de impact van de onafhankelijke variabele ''regionale herkomst''?
-Vormt het antwoord op de voorgaande vragen een bevestiging van de stelling dat zich in Vlaanderen een autonoom informeel standaardiseringsproces voltrekt dat gekarakteriseerd wordt door een toenemend/veralgemeend gebruik van de/een Brabants gekleurde tussentaal?
-Wat leert dit onderzoek ons over de mogelijkheden van chatmateriaal voor de studie van taalvariatie en taalverandering ''in progress''? | | Looptijd | 01/01/2008 - 31/12/2008 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Syntaxis voor de geest. Gesproken taalontwikkeling en ontwikkeling van Theory of Mind in dove kinderen met een cochleair implantaat. 01/12/2007 - 30/11/2010
| Abstract | Geen abstract gevonden | | Looptijd | 01/12/2007 - 30/11/2010 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Publicatie monografie "Vocaalreductie in het Standaardnederlands in Vlaanderen en Nederland". 09/10/2007 - 31/12/2007
| Abstract | Geen abstract gevonden | | Looptijd | 09/10/2007 - 31/12/2007 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Wat werkwoorden willen: een exemplaargebaseerd model van menselijke zinsverwerking. 01/10/2007 - 30/09/2009
| Abstract | Dit project onderzoekt de mogelijkheid om een exemplaargebaseerd model van menselijke zinsverwerking te ontwikkelen, dat in staat is om de relaties tussen de verschillende woorden van een zin op een psychologisch adequate manier te identificeren. Om dit model te evalueren wordt nagegaan of de voorspellingen van het model correleren met experimentele gegevens over de verwerking van structureel niet-ambigue en tijdelijk structureel ambigue zinnen.
Voor de toetsing van het model beperken we ons tot de relatie tussen het werkwoord en zijn argumenten. Op die manier kunnen een aantal cruciale problemen van menselijke zinsverwerking worden onderzocht. | | Looptijd | 01/10/2007 - 30/09/2009 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Prijs Onderzoeksraad 2007 (Prijs H. Deleeck - Gedrags- en Cultuurwetenschappen) 01/08/2007 - 31/08/2007
| Abstract | Geen abstract gevonden | | Looptijd | 01/08/2007 - 31/08/2007 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Text Mining met heterogene databanken. Een toepassing op de optimale ontdekking van genetische varianten relevant voor ziekten. 01/07/2007 - 30/06/2011
| Abstract | Het project introduceert een methodologie voor "text mining" met heterogene informatiebronnen en de toepassing ervan in moleculaire genetica en kennismanagement. Bestaande tekstanalyse en graaf-gebaseerde data mining technieken zullen worden uitgebreid om deze methodologie mogelijk te maken. De methodologie wordt toegepast in een biomedische toepassing (ordening van kandidaat ziekte veroorzakende genen) en een kennismanagement toepassing (bepalen van profiel van personen op basis van www informatie). | | Looptijd | 01/07/2007 - 30/06/2011 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Computationele technieken voor stylometrie voor het Nederlands. 01/01/2007 - 31/12/2010
| Abstract | In dit project stellen we een methodologie voor de automatische extractie en analyse van stijlkenmerken voor die we willen toepassen op individuele auteurs (auteursherkenning, zowel van non-fictie als fictie) en groepen van auteurs (extractie van stijlkenmerken geassocieerd met sekse en leeftijdsgroep). De methodologie bevat de volgende onderdelen: (1) Een automatische taalkundige analyse van documenten met behulp van de beschikbare tekstanalyse-instrumenten op het niveau van morfologische structuur, woordsoort, globale syntactische structuur en semantische rollen (subject, object, temporeel, locatie) voor de constructie van potentieel relevante stilistische kenmerken. (2) Gebruik van niet-gesuperviseerde en gesuperviseerde leertechnieken voor de selectie van de meest informatieve stilistische kenmerken en de constructie van een model van de stijl van een auteur (of group van auteurs). (3) Evaluatie van de geconstrueerde modellen door (a) vergelijking met stilistische analyses in taalkunde en literatuurwetenschap en (b) empirische toetsing van de voorspellende kracht van de modellen. | | Looptijd | 01/01/2007 - 31/12/2010 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- De leraarskamer ontsloten. Archivering en ontsluiting van een verzameling gesproken Standaardnederlands, afkomstig van leraren Nederlands. 01/01/2007 - 31/12/2008
| Abstract | Doel van dit project is de systematische archivering en ontsluiting van ca. 200 uren gesproken Standaardnederlands, afkomstig van 160 leraren Nederlands uit Vlaanderen en Nederland. Het gaat om een uiterst waardevolle verzameling spraak. Bij de samenstelling van het corpus werd rekening gehouden met diverse sociale en linguïstische variabelen. Bovendien gaat het om opnamen van hoge (stereo)kwaliteit. Het corpus kan als basis dienen voor zowel fonetisch, fonologisch als sociolinguïstisch onderzoek. | | Looptijd | 01/01/2007 - 31/12/2008 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Gravital: parsing en problem-solving van natuurlijke taal als motor voor het genereren van visuele communicatie en kunst. 01/01/2007 - 31/12/2008
| Abstract | In dit project wordt de toepassing van natuurlijke taal verwerking en redeneren onderzocht als instrument bij het genereren van grafische ontwerpen en kunst. In de context van de NodeBox software zal de MBSP shallow parser aangepast worden aan het domein van visuele communicatie en zal hij geïntegreerd worden in de NodeBox toepassing. | | Looptijd | 01/01/2007 - 31/12/2008 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Het Sawa Corpus ¿ een parallel corpus "Engels ¿ Kiswahili". 01/01/2007 - 31/12/2008
| Abstract | Dit project beoogt een opgelijnd parallel corpus voor het talenpaar Engels ¿ Kiswahili door middel van semi-automatische annotatie. Deze oplijning faciliteert niet alleen onderzoek naar statistische automatische vertaling, maar maakt ook projectie van annotatie mogelijk. In dit project onderzoeken we hoe dependentie-analyses uit de brontaal (Engels) kunnen worden geprojecteerd op de doeltaal (Kiswahili). | | Looptijd | 01/01/2007 - 31/12/2008 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- De invloed van het gehoor op de vroege lexicale ontwikkeling van dove kinderen met en zonder cochleair implantaat. 01/01/2007 - 31/10/2007
| Abstract | Bij congenitaal dove kinderen met een Cochleair Implantaat kan men observeren dat de vroege taalverwerving doorgaans via twee modaliteiten verloopt; zowel met gesproken woorden als gebaren; dove kinderen zonder CI verwerven de taal veelal monolinguaal, d.m.v. gebaren. Door de vroege lexicale ontwikkeling van beide groepen longitudinaal te bestuderen en bovendien te vergelijken met die van normaal horende kinderen, zal het onderzoek de vraag beantwoorden of er in kinderen met CI sprake is van een simultane ontwikkeling, waarbij er invloed van de éne modaliteit op de andere is; dan wel van twee gescheiden ontwikkelingspaden voor beide modaliteiten. | | Looptijd | 01/01/2007 - 31/10/2007 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- De verwerving van de Roemeense morfosyntaxis. 01/01/2007 - 31/10/2007
| Abstract | Het onderzoeksproject beoogt een systematische analyse van de morfosyntactische ontwikkeling van ééntalig Roemeense kinderen op basis van een longitudinaal corpus van Roemeense kindertaal. Het onderzoek is voornamelijk gericht op de verwerving van naamwoordelijke en werkwoordelijke functionele categorieën, waarbij de relatie tussen de kenmerken van functionele categorieën en syntactische operaties centraal staat. | | Looptijd | 01/01/2007 - 31/10/2007 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Linguïstische beschrijving van minderheidstalen met behulp van automatische leertechnieken. 01/10/2006 - 30/09/2009
| Abstract | Linguïstisch geannotateerde tekstcorpora zijn een belangrijk hulpmiddel bij de taaltechnologische ontsluiting van een taal. Voor commercieel interessante talen, zoals het Engels en het Nederlands, kunnen bestaande geannoteerde corpora gebruikt worden om accurate en robuste taaltechnologische toepassingen te ontwikkelen. Als er geen vooraf geannoteerde corpora beschikbaar zijn, wat het geval is bij minderheidstalen, zijn de traditionele datagebaseerde algoritmen echter onbruikbaar. Dit project onderzoekt de geautomatiseerde linguïstische beschrijving van minderheidstalen op basis van alternatieve classificatietechnieken. Daarbij zal gebruik worden gemaakt van algoritmen die het gebrek aan geannoteerde corpora omzeilen door zelf een eerste classificatie af te leiden. Die classificatie kan gebaseerd zijn op corpora met lopende tekst (techniek: "unsupervised learning") of op bestaande, geannoteerde corpora voor een andere taal (techniek: "kennistransfer"). De methodologie die in dit project wordt voorgesteld, laat toe om het gebruik en de werking van de respectieve classificatietechnieken systematisch te vergelijken en te evalueren. | | Looptijd | 01/10/2006 - 30/09/2009 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Conceptuele perspectieven: elementen van een cognitieve verklaring van Engelse werkwoordstijden. 01/10/2006 - 31/03/2008
| Abstract | De belangrijkste doelstelling van dit project betreft de ontwikkeling van een abstracte en omvattende verklaring van het Engelse tempus-systeem, op basis van cognitieve mechanismen die onafhankelijk gemotiveerd zijn. Het voorgaande onderzoek naar uidrukkingen van tempus, aspect en modaliteit in het Engels zal de empirische fundering bieden voor deze verklaring, die uiteindelijk moet toelaten om systemen van werkwoordelijke tijden in (een) natuurlijke taal op expliciete wijze te modelleren. | | Looptijd | 01/10/2006 - 31/03/2008 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Detecting and exploiting semantic overlap (DAESO). 01/06/2006 - 31/05/2009
| Abstract | Dezelfde informatie kan in taal op veel verschillende manieren weergegeven worden. Kennis over parafrasering (zelfde semantische inhoud, verschillende verwoording) en "entailment" (de ene expressie impliceert de andere) kan dit probleem tot op zekere hoogte oplossen. In DAESO worden technieken ontwikkeld die toelaten om dergelijke semantische relaties tussen tekst automatisch vast te stellen. De bruikbaarheid van de aanpak zal onderzocht worden in de context van enkele toepassingen: "question answering", informatie-extractie en automatische samenvatting van tekst. | | Looptijd | 01/06/2006 - 31/05/2009 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Literacy development in bilingual children: Evidence from French-English and French-Dutch Immersion programs. 01/06/2006 - 31/05/2008
| Abstract | Geen abstract gevonden | | Looptijd | 01/06/2006 - 31/05/2008 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- APRO: Annotatie van genuscongruentie en van het pleonastisch vs. anaforisch gebruik van pronomina in het Nederlands. 01/03/2006 - 31/12/2007
| Abstract | Dit project spitst zich toe op twee problemen binnen het domein van de pronominale anaforenresolutie: de automatische detectie van het pleonastisch en anaforisch gebruik van pronomina en de automatische herkenning van pronomina die verwijzen naar het taalkundig geslacht van hun antecedent. In dit project zal Nederlands tekstmateriaal geannoteerd worden met het oog op de twee genoemde problemen. Dit materiaal zal geïntegreerd worden in een bestaand systeem voor anaforenresolutie voor het Nederlands. | | Looptijd | 01/03/2006 - 31/12/2007 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Computerlinguistiek, taal- en spraaktechnologie. 01/01/2006 - 31/12/2010
| Abstract | CLIF is de Vlaamse vereniging van onderzoeksgroepen voor computerlinguistiek, taal- en spraaktechnologie. Het doel van de vereniging is het stimuleren van samenwerking op het gebied van onderzoek en de gezamenlijke ontwikkeling van hulpmiddelen die de capaciteiten van individuele deelnemende groepen te boven gaat. | | Looptijd | 01/01/2006 - 31/12/2010 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Taal en spraak van jonge Nederlandstalige kinderen: Horende kinderen en dove kinderen met een cochleaire implantatie. 01/01/2006 - 31/12/2009
| Abstract | In dit project onderzoeken we de prelexicale en de vroeglexicale spraak- en taalproductie bij jonge dove kinderen met een cochleaire implantatie (CI) en we vergelijken de verwervingsstadia en -patronen met een groep van horende leeftijdsgenoten. Cruciaal is de vraag of implantatie in het eerste/tweede levensjaar tot gevolg heeft dat kinderen met een CI op het vlak van de spraak- en taalontwikkeling toch binnen de ''normale'' grenzen van hun horende leeftijdsgenoten bevinden. | | Looptijd | 01/01/2006 - 31/12/2009 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Akoestisch fonetische karakteristieken van de spraak na een cochleaire implantatie in het eerste levensjaar. 01/10/2005 - 30/09/2009
| Abstract | Het doel van het project is om de spontane spraak te analyseren van congenitaal dove baby''s die op heel vroege leeftijd een cochleaire implantatie hebben gekregen.
(1) In hoeverre stemmen de akoestische-fonetische karakteristieken (frequentie, resonantie, intensiteit, timing) van het brabbelen van CI kinderen overeen met die van horende leeftijdsgenoten?
(2) Manifesteren de typische fonetische kenmerken van "dovenspraak" zich in de spraak van 6-jarige CI kinderen. | | Looptijd | 01/10/2005 - 30/09/2009 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Uitspraakvariatie in het Standaardnederlands: sjwa-insertie in Vlaanderen en Nederland. 01/10/2005 - 30/09/2008
| Abstract | Dit project beoogt de studie van sjwa-insertie in gesproken Standaardnederlands. Met sjwa-insertie wordt bedoeld: de invoeging van een sjwa in heterorganische consonantenclusters aan het woordeinde (bv. melk > mellek, dorp > dorrep) en middenin het woord (bv. werken > werreken, kalme > kalleme). Sjwa-insertie kan in verband worden gebracht met verschillende intra- en extralinguïstische factoren. Zo verbinden fonologen sjwa-insertie met factoren als klemtoon, syllabestructuur, de samenstelling van het consonantencluster en het aantal syllaben in het woord. Ook factoren als spreeksnelheid, woordfrequentie en de kwaliteit van de liquida zouden een rol kunnen spelen. Verder is bekend uit dialectstudies dat in de ene regio meer sjwa-insertie voorkomt dan in de andere. Ten slotte zou ook de manier waarop de spraak ontlokt is voor verschillen kunnen zorgen. Dit postdocproject wil deze variabelen empirisch onderzoeken en nagaan hoe ze onderling samenhangen. Dit zal gebeuren op basis van een ruime steekproef van sprekers uit verschillende regio''s in Vlaanderen en Nederland. | | Looptijd | 01/10/2005 - 30/09/2008 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Elektropalatografisch onderzoek van articulatorische settings in geografisch bepaalde taalvariëteiten van het Nederlands. 01/10/2005 - 31/12/2007
| Abstract | Geen abstract gevonden | | Looptijd | 01/10/2005 - 31/12/2007 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Consultancy op het vlak van modellering en dynamische logica zoals omschreven in het DYNAMO-project 050007 (IWT). 01/07/2005 - 30/06/2006
| Abstract | Geen abstract gevonden | | Looptijd | 01/07/2005 - 30/06/2006 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Coreferentieresolutie voor het extraheren van antwoorden. (STEVIN-COREA) 01/05/2005 - 31/10/2007
| Abstract | Coreferentieresolutie vervult een sleutelfunctie bij het automatisch interpreteren van tekst. Het is een probleem dat tot op heden vooral vanuit een linguïstisch standpunt werd bestudeerd. De nadruk lag daarbij dan vooral op pronominale coreferentieresolutie, nl. het zoeken van een antecedent voor een gegeven anaforisch voornaamwoord. Prakische toepassingen zoals informatie-extractie (IE), automatisch samenvatten en automatische vraag-beantwoord-systemen (QA) vereisen echter een correcte herkenning van de coreferentiële relaties tussen verschillende types nominale constituenten. Corpusgebaseerde computationele systemen die dergelijke relaties automatisch detecteren, moeten getraind en getest worden op voldoende geannoteerde data. Voor het Nederlands echter zijn er nauwelijks geannoteerde corpora beschikbaar en bovendien bestaan er geen automatische systemen voor de resolutie van coreferentiële relaties tussen nominale constituenten. In COREA zal er een robuust systeem ontwikkeld worden voor de resolutie van dergelijke coreferentiële relaties en zal het effect van coreferentieresolutie onderzocht worden op praktische toepassingen zoals IE en QA. | | Looptijd | 01/05/2005 - 31/10/2007 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Fonologische segmentatieprocessen bij Engelstalige en Nederlandstalige kleuters en beginnende lezers. De rol van talige en fonetische factoren. 01/05/2005 - 31/12/2006
| Abstract | Deze studie onderzoekt hoe Engelstalige en Nederlandstalige kleuters woorden segmenteren op een onbewust niveau, meer bepaald welke cohesiepatronen ze verkiezen boven andere. Belangrijke variabelen in het onderzoek zijn taal, fonetische eigenschappen van segmenten, letterkennis en schriftervaring. In een later stadium gaat de studie na of individuele verschillen in impliciete segmentatieprocessen ook worden gereflecteerd in de initiële leesontwikkeling. | | Looptijd | 01/05/2005 - 31/12/2006 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Morfosyntactische annotatie van drie Nederlandstalige kindertaalcorpora. 01/05/2005 - 31/12/2006
| Abstract | De doelstelling van dit project is om morfosyntactische annotatie toe te voegen aan drie databases met spontane kindertaal: het Maarten-corpus, het CLPF-corpus en het CI-corpus. We willen bereiken dat deze corpora een perfecte morfologische codering bevatten, dat de filler syllabes hierbij consistent getranscribeerd en geannoteerd zijn, en dat de substantiefgroepen overal zijn aangeduid. | | Looptijd | 01/05/2005 - 31/12/2006 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- OCAPI - Ontsluiting van CGN annotatie voor portabiliteit naar nieuwe informatiebronnen. 01/05/2005 - 31/12/2006
| Abstract | Geen abstract gevonden | | Looptijd | 01/05/2005 - 31/12/2006 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Lexicale en morfosyntactische ontwikkeling bij jonge kinderen met een cochleaire implantatie : een crosslinguïstisch onderzoek van het Nederlands en het Hebreeuws. 01/01/2005 - 31/12/2008
| Abstract | (1) De studie van de lexicale en morfosyntactische aspecten van de taalverwerving in een populatie van CI kinderen, in vergelijking met een groep van NH kinderen (gelijk(e) leeftijd I taalontwikkelingniveau). In dit opzicht sluit het dit project perfect aan bij het lopende FWO Onderzoeksproject over spraak- en taalverwerving bij jonge CI kinderen.
(2) Een crosslingurstische vergelijking van gematchte CI kinderen die Nederlands resp. Hebreeuws als moedertaal verwerven. waardoor de toetsing van specifieke hypothesen over taalverwervingsmechanismen mogelijk wordt, gezien de interessante opposities tussen deze typologisch heel verschillende talen (zie verder).
De afgeleide doelstellingen hebben betrekking op interventieprogramma.s na een CI. discrepanties tussen de verwerving bij CI en NH kinderen. kunnen specifieke repercussie hebben voor interventieprogramma''s. | | Looptijd | 01/01/2005 - 31/12/2008 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Ondertiteling van Nederlandstalige televisieprogramma's in Vlaanderen: een ontvangergericht onderzoek naar doelstellingen en wenselijkheid. 01/01/2005 - 31/12/2006
| Abstract | Onderhavig onderzoeksproject neemt een nieuwe trend op de Vlaamse televisie onder de loep: de toenemende Nederlandstalige ondertiteling van Nederlandstalige programma''s. Het project wil de wenselijkheid hiervan onderzoeken in relatie tot hoe Vlaamse kijkers hun linguïstische identiteit ervaren, welk ''Nederlands'' of ''Vlaams'' zij als het hunne beschouwen, welke variëteiten begrepen worden (en welke niet), en welke variëteiten als ''vreemd'' worden ervaren. | | Looptijd | 01/01/2005 - 31/12/2006 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Het verband tussen impliciete segmentatiepatronen en de ontwikkeling van expliciete segmentatie, lees- en spelvaardigheden. 01/10/2004 - 20/11/2007
| Abstract | Deze longitudinale studie bestudeert hoe jonge niet-lezers spraak segmenteren op een onbewust (impliciet) en intentioneel (expliciet) niveau en onderzoekt of individuele verschillen in het impliciete segmentatieproces weerspiegeld worden in de latere ontwikkeling van expliciete segmentatie, lezen en spellen. | | Looptijd | 01/10/2004 - 20/11/2007 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Een constructivistische analyse van 'fillers' in Nederlandse kindertaal. 01/10/2004 - 30/09/2007
| Abstract | Wanneer jonge kinderen hun eerste meerwoordzinnen produceren, gebruiken ze vaak `fillers''. Dat zijn vocaliseringen die geen conventionele woorden zijn. Zo is het in voorbeeld (a) niet duidelijk waar de syllabes [m] en [''] voor staan. Meestal hebben fillers de vorm van een syllabische nasaal of een sjwa, zoals in de zinnen (a) en (b). Soms bestaan ze uit meerdere syllabes, zoals in zin (c).
(a) [m] pick [''] flowers (Engelstalige jongen van 1 jaar en 6 maanden, uit Peters & Menn, 1993)
(b) [''] oiseau [''] vole (Franstalig meisje van 1 jaar, uit Veneziano & Sinclair, 2000)
(c) [lala] open door (Engelstalige jongen van 1 jaar en 10 maanden, uit Feldman & Menn, 2003)
Fillers komen typisch voor op plaatsen waar in de volwassen taal functiemorfemen (zoals lidwoorden, pronomina) staan. Als dusdanig zijn het voorbeelden van een taalleermechanisme dat pas recent volledig erkend werd: `vorm-gedreven'' leren, waarbij het kind eerst een vorm verwerft en pas daarna de betekenis en de functie van die vorm doorgrondt. Intuïtief uitgedrukt: het kind heeft klankmateriaal op bepaalde plaatsen in de input ontdekt, maar noch de vorm noch de functie ervan accuraat geanalyseerd. Toch probeert het die elementen al in de eigen taaluitingen te integreren. Slechts na enige tijd ontdekt het kind de volledige distributie, functie en vorm van wat functiemorfemen blijken te zijn. Dit leermechanisme staat in schril contrast met `functie-gedreven'' verwerving zoals die in nativistische theorieën aan bod komt: morfosyntactische verwerving wordt daar gezien als een zich ontrollend stramien van morfosyntactische functies die lexicaal opgevuld worden.
Tot nu toe is er in het Nederlands nauwelijks onderzoek gebeurd naar fillers (met uitzondering van Wijnen et al., 1994). Het doel van dit onderzoeksproject is om de rol van fillers te onderzoeken in de verwerving van het Nederlands, en om het mechanisme van het `vorm-gedreven'' leren te analyseren vanuit een constructivistische benadering van taalverwerving. | | Looptijd | 01/10/2004 - 30/09/2007 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Syntactische aspecten van taalontwikkelingsstoornissen : de verwerving van determineerders. 01/10/2004 - 30/09/2007
| Abstract | De doelstelling van het project is het ontwikkelingspatroon te bestuderen van de vroege morfosyntaxis van 3 groepen van kinderen met een taalstoornis (kinderen met SLI, hoortoestel, cochleair implantaat, CI) in vergelijking met een controlegroep van normaalhorende kinderen en na te gaan of de resultaten kunnen gekoppeld worden aan de klinische eigenschappen van deze kinderen. De focus ligt op één specifiek aspect van de nominale syntaxis, nl. de verwerving van lidwoorden. Het onderzoek richt zich op de volgende vragen: (i) op welke manier verschilt de verwerving van het lidwoordsysteem bij SLI-kinderen met die van kinderen met een normale taalontwikkeling? Is er een tijdelijke of permanente achterstand in de projectie van een overeenkomstig syntactisch niveau en indien dit het geval is, wat is de oorzaak voor deze achterstand?; (ii) is er een verschil in syntactische ontwikkeling tussen CI-kinderen en kinderen die klassieke hoortoestellen gebruiken (cfr. Van den Broek 1998 contra Geers 2003 voor spraakperceptie en -productie)?; (iii) is er een gelijklopende ontwikkeling tussen de syntaxis van zeer vroeg geïmplanteerde CI-kinderen en een normaalhorende controlegroep of zijn er gelijkenissen met andere taalstoornissen die typische grammaticale gebreken vertonen?; (iv) Wat zijn de factoren die een invloed hebben op de verwerving van de syntaxis van lidwoorden bij CI-kinderen? (v) uit theorie-intern oogpunt: zijn er argumenten om de projectie van een D-positie toe te schrijven aan neurologische rijping? Is deze projectie gevoelig voor input en derhalve beïnvloedbaar door een toename in auditieve perceptie? | | Looptijd | 01/10/2004 - 30/09/2007 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Semi-supervised leertechnieken voor Informatie Extractie. 01/10/2004 - 31/12/2005
| Abstract | Informatie Extractie (IE) heeft als doel het extraheren van relevante data uit een verzameling meer of minder gestructureerde documenten. Huidige systemen werden steeds ontwikkeld op basis van geannoteerde data die echter duur en moeilijk te verkrijgen zijn. Daarom wil dit project IE systemen ontwikkelen door middel van semi-supervised leertechnieken, waarbij gebruik wordt gemaakt van grote verzamelingen niet-geannoteerde gegevens, die gemakkelijk te verkrijgen zijn. | | Looptijd | 01/10/2004 - 31/12/2005 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Databank van veertiende-eeuwse niet-lineaire Nederlandse teksten. Opbouw en linguïstisch onderzoek. 01/01/2004 - 31/12/2007
| Abstract | Geen abstract gevonden | | Looptijd | 01/01/2004 - 31/12/2007 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Situationele factoren bij de productie van geflecteerde woordvormen: een psycholinguïstische en computationele benadering. 01/01/2004 - 31/12/2007
| Abstract | De productie van geïnflecteerde woordvormen zoals het meervoud of de verleden tijd wordt traditioneel beschouwd als een proces dat vooral steunt op morfologische, fonologische en syntactische karakteristieken van de basisvorm. Hoewel descriptieve grammatica''s in deze context ook metalinguïstische informatie vermelden, wordt daar in recente invloedrijke modellen van taalproductie, zoals Steven Pinkers Words and Rules theorie uit 1999, geen aandacht aan besteed. In een recent experiment toonden wij echter aan dat sprekers van het Nederlands metalinguïstische informatie gebruiken als hen gevraagd wordt meervouden te genereren voor pseudowoorden. Deze resultaten ondermijnen niet enkel Minkers assumptie dat het Nederlands twee default meervouden heeft die enkel op basis van fonologische informatie toegekend worden, maar ze werpen ook de fundamentele vraag op of modellen met een regelgebaseerde component überhaupt in staat zijn om metalinguïstische informatie te incorporeren. | | Looptijd | 01/01/2004 - 31/12/2007 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Pattern Analysis, Statistical Modelling and Computational Learning (PASCAL). 01/12/2003 - 29/02/2008
| Abstract | Pascal is een FP6 netwerk met als doel het oprichten van een gedistribueerd instituut voor onderzoek naar patroonherkenning, statistische modellering en zelflerende systemen, als kerntechnologieën voor multimodale interfaces. Deze interfaces zijn in staat tot natuurlijke interactie met mesnelijke gebruikers. De rol van CNTS in het netwerk is de toepassing van zelflerende systemen bij problemen van natuurljke taal verwerking. | | Looptijd | 01/12/2003 - 29/02/2008 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Tijd en subjectiviteit: een cognitief en vergelijkend onderzoek naar het conceptuele statuut van aspectuele en tempus-categorieën in de grammatica 01/10/2003 - 30/09/2006
| Abstract | Het onderzoek behandelt de relatie tussen categorieën van tempus (en vormen van grammaticaal aspect) enerzijds, en gradaties van ''subjectivering'' in hun semantisch profiel anderzijds. Bovenop hun grammaticale status als grounding predication. Dit type vult initiële instanties van grammaticalisering aan en gaat dus verder dan de transformatie van een lexicale in een grammaticale uitdrukking. Het geeft aanleiding tot de ontwikkeling van niet-referentiële, evaluatieve betekenissen voor items die in prototypische gebruiken nog elementen van temporele verwijzing inhouden. Het onderzoek spitst zich daarom toe op gebruikstypes die zich verwijderen van de beschrijving van objectieve relaties in de tijd, in de richting van subjectieve bekommernissen. | | Looptijd | 01/10/2003 - 30/09/2006 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Heeft een step op de maan wielen? Semantische activatie bij het lezen van interlinguale homografen. 01/10/2003 - 31/12/2005
| Abstract | Nederlands-Engelse bilingualen worden in Engelstalige experimenten getest om te onderzoeken in hoeverre zij hun kennis van het Nederlands onderdrukken terwijl zij Engels lezen. De kritische stimuli zijn Nederlands-Engelse homografen (b.v. dat in het Engels ''trede'' betekent) die in een semantisch priming paradigma aangeboden worden om te toetsen of hun Nederlandse betekenis automatisch geactiveerd wordt. De homografen worden als losse woorden en in volledige zinnen aangeboden om het effect van zinscontext op lexicale verwerking te bestuderen, met primes die of visueel of auditief aangeboden worden. Controle-experimenten worden met monolinguale Engelse proefpersonen uitgevoerd. | | Looptijd | 01/10/2003 - 31/12/2005 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Reductieverschijnselen in de hedendaagse standaardtaal in Vlaanderen en Nederland. 01/10/2003 - 30/09/2005
| Abstract | Dit project beoogt de studie van reductieverschijnselen in spontaan, d.w.z. niet-voorgelezen, Standaardnederlands. Reductie wordt onderzocht in mono-, bi- en trisyllabische woorden, meerbepaald in pronomina, suffixen en leenwoorden. Daarbij wordt gebruik gemaakt van spraak die reeds verzameld, gedigitaliseerd en getranscribeerd is voor het Corpus Gesproken Nederlands en in het kader van het VNC-project Variatie in de uitspraak van het Standaardnederlands. Het spontane VNC-materiaal bestaat uit gesprekken met leerkrachten Nederlands. Uit het Corpus Gesproken Nederlands worden drie componenten geselecteerd: toespraken, mondelinge presentaties en lessen (van niet-neerlandici). Deze drie types spontane spraak zijn zeker vergelijkbaar: telkens gaat het om niet-uitgezonden taal die door één persoon voor een publiek wordt uitgesproken. Specifieke doelstelling van het project is na te gaan of we evidentie vinden voor de stelling dat de uitspraak van hoogopgeleide sprekers zonder taalkundige training verschilt van de uitspraak van leerkrachten Nederlands, die vaak als prototypische standaardtaalsprekers worden beschouwd. Het hier geschetste onderzoek sluit aan bij de hernieuwde belangstelling voor de standaardtaal in Vlaanderen en Nederland, waarbij variatiepatronen in het Standaardnederlands bestudeerd worden vanuit het perspectief van divergentie en convergentie. De studie ligt ook in het verlengde van internationaal onderzoek naar variatie in de standaardtaal, b.v. in het Duits (o.a. Duitsland, Oostenrijk, Zwitserland) en het Frans (o.a. Frankrijk, Canada, België). | | Looptijd | 01/10/2003 - 30/09/2005 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Het gebruik van heel grote tekstcorpora om automatisch structuur te vinden in natuurlijke taal. 01/10/2003 - 28/02/2005
| Abstract | van teksten en woordenboeken in vele verschillende talen. Deze corpora worden nog niet altijd gebruikt bij het onderzoeken van taalhypothesen en fundamentele vragen in de linguïstiek.
Computers worden nu meer en meer gebruikt, en dit onderzoek wil bijdragen aan het ontwikkelen van deze trend. Het uiteindelijke doel is het introduceren van bestaande technieken in de taaltechnologie om specifieke hypotheses over taalstructuur, -functie, -verandering en ''typologie beter te kunnen bestuderen. | | Looptijd | 01/10/2003 - 28/02/2005 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Is de onset-rime structuur van belang in het impliciete en expliciete klankbewustzijn van jonge kinderen? Een cross-linguïstische studie bij Engelstalige en Nederlandstalige kleuters en beginnende lezers. 01/10/2003 - 31/12/2005
| Abstract | Deze studie onderzoekt of onsets en rimes eenheden zijn in het klankbewustzijn van jonge kinderen. De onset-rime hypothese is algemeen aanvaard maar bijna exclusief gebaseerd op Engelstalig onderzoek. Recente experimenten in het Nederlands vonden geen evidentie voor deze hypothese. Om na te gaan of taalverschillen verantwoordelijk zijn voor deze dissociatie wordt een cross-linguïstische vergelijking gemaakt met Engelstalige en Nederlandstalige kleuters en beginnende lezers. Taken die het impliciete en expliciete klankbewustzijn meten worden gebruikt (b.v. geheugentaak versus segmentatietaak). | | Looptijd | 01/10/2003 - 31/12/2005 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Zijn morfologische representaties in het mentale lexicon modaliteitsspecifiek of amodaal? Een benadering via gemaskerde cross-modale priming. 01/10/2003 - 31/12/2006
| Abstract | Het doel van dit projectvoorstel is door te bouwen op de bestaande kennis omtrent cross-modaliteitseffecten in geschreven en gesproken woordherkenning enerzijds en de priming literatuur anderzijds. Er kan een stap voorwaarts gezet worden als we de tekortkomingen van intra-modale priming kunnen wegnemen. Inderdaad, in het geval van visuele-visuele priming kunnen we niet de kwestie van integratie over modaliteiten adresseren (cross-modale integratie) omdat de fonologische informatie geactiveerd wordt door de visueel gepresenteerde stumulus en niet aangeboden wordt aan de deelnemer in de vorm van een auditieve stimulus. Het gebruik van een andere techniek zou ons beter in staat stellen om de vraag te beantwoorden i.v.m. de integratie van informatie die origineel met verschillende modaliteiten geassocieerd is (met name: bij stimulusinput). | | Looptijd | 01/10/2003 - 31/12/2006 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Textmining uit biologische tekst (BioMinT). 01/10/2003 - 31/03/2006
| Abstract | Het doel van het BioMinT project is de ontwikkeling van generieke text mining software die (1) verschillende types van informatievragen interpreteert, (2) relevante documenten uit de biologische literatuur zoekt, (3) de gezochte informatie uit deze documenten extraheert, en (4) het resultaat presenteert als de vuller van velden in een database of als een gestructureerd rapport. Het consortium bestaat uit biologen (University of Manchester, Zwitsers instituut voor Bio-informatica) en data / text mining groepen (CNTS Universiteit Antwerpen, PharmaDM, Oostenrijks instituut voor AI, Geneve AI Lab). | | Looptijd | 01/10/2003 - 31/03/2006 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Semi-supervised leertechnieken voor Informatie Extractie. 01/10/2003 - 30/09/2004
| Abstract | Informatie Extractie (IE) heeft als doel het extraheren van relevante data uit een verzameling meer of minder gestructureerde documenten. Huidige systemen werden steeds ontwikkeld op basis van geannoteerde data die echter duur en moeilijk te verkrijgen zijn. Daarom wil dit project IE systemen ontwikkelen door middel van semi-supervised leertechnieken, waarbij gebruik wordt gemaakt van grote verzamelingen niet-geannoteerde gegevens, die gemakkelijk te verkrijgen zijn. | | Looptijd | 01/10/2003 - 30/09/2004 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- FLaVoR: Flexible Large Vocabulary Recognition: Incorporatie van taalkundige kennisbronnen in een modulaire spraakherkennersarchitectuur 01/10/2003 - 30/09/2006
| Abstract | In dit project wordt onderzocht of de ''alles-in-een'' strategie die in de huidige spraakherkenners gevolgd wordt, waarbij taak-specifieke, syntactische, en lexicale kennis verweven is in een enkel op eenvoudige formalismen gebaseerd taalmodel, vervangen kan worden door een modulaire architectuur waarbij naast akoestisch-fonetisch en intonatie-gerelateerde parameters ook generische en domeinspecifieke taalkundige informatiebronnen worden gebruikt. | | Looptijd | 01/10/2003 - 30/09/2006 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Functies van audiovisuele prosodie. 01/10/2003 - 30/09/2005
| Abstract | Het hier voorgestelde onderzoeksproject richt zich op een functionele benadering van visuele en verbale prosodie (samengevat als ''audiovisuel prosodie'') in gesproken interacties. Het is intuitief duidelijk dat prosodie een belangrijke communicatieve functie heeft: prosodie kan uitingen voorzien van ''extra'' informatie die niet reeds besloten ligt in de woorden of de syntactische structuur van een zin. Terwijl we al redelijk wat weten over de pragmatiek van verbale prosodie, is echter nog onvoldoende duidelijk hoe auditieve cues combineren met visuele informatie voor het signaleren van bepaalde communicatieve functies. De meeste evidentie over de rol van visuele cues is impressionistisch en anecdotisch van aard, en de weinige descriptieve resultaten over visuele signalen zijn niet zo expliciet dat ze bijvoorbeeld kunnen worden geincorporeerd in een echt computationeel model. Meer specifiek wil ik me richten op de signaalwaarde van audiovisuele prosodie voor het aangeven van beurtwisseling (2.1), informatiestructuur (2.2), positieve en negatieve terugmeldingssignalen (2.3) en emotionele en attitudinele connotaties van uitingen (2.4).
2.1 Beurtwisseling : Uit eerder onderzoek komt naar voren dat gesprekspartners in een dialoog heel precies de beurt van elkaar kunnen overnemen. In dit postdoc project wil ik nagaan in hoeverre gesprekspartners in de beurtwisseling gevoelig zijn voor specifieke visuele cues: daarbij kan ik voortbouwen op inzichten van ethnomethodologen die eerder aantoonden dat oogcontact erg van belang is voor het aangeven van het einde van een ''turn''.
2.2 Informatiestructuur : Uit vroeger werk is gebleken dat sprekers auditieve prosodie gebruiken om belangrijke (nieuwe, contrastieve) informatie te onderscheiden van minder belangrijke (gegeven). Dat gebeurt, voor talen zoals het Nederlands en het Engels, doorgaans door middel van distributie van toonhoogteaccenten. Uit verkennend onderzoek blijkt nu dat luisteraars ook ''accenten'' waarnemen op basis van wenkbrauw-bewegingen (eerder werk samen met Emiel Krahmer). Dit werk zou ik graag verderzetten, waarbij het mij van belang lijkt om dit crosslinguistisch op te zetten.
2.3 Feedback: Tijdens mijn vorige mandaat heb ik me in belangrijke mate gericht op het gebruik van auditieve prosodie voor het aangeven van ''positieve'' en ''negatieve'' terugmeldingssignalen. Pilotonderzoek geeft aan dat gesprekspartners ook erg gevoelig zijn voor specifieke visuele prosodie die hetzelfde doel dienen (met name bewegingen van wenkbrauwen, hoofd , ogen en mond), en dat die op interessante manier interageren met auditieve prosodie.
2.4 Attitutidinele en emotionele structuur: Uit verschillende studies is gebleken dat mensen via prosodie kunnen signaleren wat ze vinden van een uiting die ze uitspreken (attitude), of hoe ze zich voelen terwijl ze een uiting produceren (emotie). Het een open vraag is hoe auditieve en visuele cues in dynamische stimuli emotie en attitude kunnen signaleren. | | Looptijd | 01/10/2003 - 30/09/2005 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- De verwerving van fonoactische en prosodische kennis bij kinderen : een empiristisch, inductief alternatief voor de huidige nativistische, deductieve benadering. 01/10/2003 - 30/09/2004
| Abstract | In het huidige onderzoek naar de verwerving van fonologie wordt vaak beroep gedaan op Optimality Theory als verklaringskader. Volgens dit nativistisch, deductief model wordt linguïstische kennis in het taalsysteem van het kind gerepresenteerd, en vormt daar een aparte module met expliciete taalkennis (de `competence''). In dit project exploreren / ontwikkelen we een empiristisch, inductief alternatief voor deze benadering. Een empiristisch, inductief model wordt hierbij omschreven als een model waarin het mentaal lexicon centraal staat bij de verwerving. Linguïstische kennis wordt in het lexicon opgebouwd en opgeslagen.
Dit contrast tussen taalsysteem en lexicon zal in vier cruciale verschilpunten uitgewerkt worden:
1. Regels versus analogie
2. Stadia versus lexicale diffusie
3. Minimale versus maximale rol van de input
4. Competence versus processing
In dit project focussen we op de verwerving van fonotaktische en prosodische kennis. Deze twee thema''s worden immers vaak aangehaald als voorbeelden van deductieve verwerving. | | Looptijd | 01/10/2003 - 30/09/2004 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Multilingual subtitling of multimedia content (MUSA). 01/10/2003 - 28/02/2005
| Abstract | Het doel van MUSA is het creeren van een multimodaal, multilinguaal systeem dat spraak en andere audio omzet naar transcripties in tekst, deze transcripties vertaalt naar andere talen, en dan ondertitels genereert op basis van deze vertalingen. MUSA zal voor het Engels, Frans, en Grieks gemaakt worden. Een state-of-the-art spraakherkenningssysteem zal uitgebreid worden en aangepast aan de context van het project. Een innovatief scenario voor automatische vertaling zal ontwikkeld worden waarin machinevertaling, vertaalgeheugens en term-substitutie gecombineerd zullen worden. De Antwerpse groep is verantwoordelijk voor de samenvatting van zinnen ten behoeve van ondertitelgeneratie met behulp van een automatische analyse van de taalkundige structuur van de zin. | | Looptijd | 01/10/2003 - 28/02/2005 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Machine learning technieken voor datamining en hun toepassingen. 01/10/2003 - 31/12/2006
| Abstract | De onderzoeksgemeenschap streeft naar de versterking en de coordinatie van het Vlaamse onderzoek op het gebied van machine learning voor datamining in het algemeen, en bepaalde belangrijke toepassingen zoals bioinformatica en tekstmining in het bijzonder. Vlaamse participanten: Computational Modeling Lab (VUB), CNTS (UA), ESAT-SISTA (KU Leuven), DTAI (KU Leuven), ADReM (UA). | | Looptijd | 01/10/2003 - 31/12/2006 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- De interactie tussen fonologie en orthografie bij het proces van visuele woordherkenning: afhankelijkheid leidt tot eenheid? 01/10/2003 - 31/12/2005
| Abstract | In de meeste talen met een alfabetisch schrijfsysteem is de uitspraak van een woord vaak niet de som van de utspraak van elk individueel letterteken in dat woord. Er zijn diverse gevallen waar de ene letter de uitspraak van de andere bepaalt. Vergelijk bij voorbeeld de Nederlandse woorden MOOT-MOET-MORT, waar de uitspraak van de letter O door de volgende letter bepaald wordt. Talen verschillen echter in de mate waarin letters in hun uitspraak van elkaar afhangen. Het onderzoek richt zich specifiek op de vraag hoe dergelijke afhankelijkheidsrelaties tussen letters (dwz relaties die een effect hebben op het vlak van uitspraak) de verwerking van het woord beïnvloeden. | | Looptijd | 01/10/2003 - 31/12/2005 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- OntoBasis : extractie van ontologieën uit tekst. 01/10/2003 - 31/12/2005
| Abstract | De belangrijkste doelstelling van CNTS voor dit project is de toepassing en aanpassing van eerder ontwikkelde "shallow parsing" technologie voor (i) de extractie van lexons (ontologische relaties) uit niet- of semi-gestructureerde bronnen, (ii) de evaluatie van bestaande ontologieën, en (iii) de adaptatie van ontologieën (bijv. WordNet) voor specifieke domeinen. Een tweede doelstelling is het onderzoeken van de bruikbaarheid van ontologieën voor de verbetering van tekstanalyse met behulp van "shallow parsing". | | Looptijd | 01/10/2003 - 31/12/2005 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Semaduct : combinatie van deductieve en inductieve technieken voor lexicale semantiek 01/10/2003 - 31/12/2005
| Abstract | Doel van dit project is de confrontatie en integratie van deductieve en inductieve benaderingen van computerlinguistiek in het domein van de lexicale semantiek. Subprojecten zijn onder meer: de combinatie van gesuperviseerde en niet-gesuperviseerde leertechnieken voor semantische kennisverwerving en desambiguering, incorporatie van linguistische kennis in inductieve technieken, en de verfijning van bestaande semantische tagsets met behulp van machine learning. | | Looptijd | 01/10/2003 - 31/12/2005 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Tonale dialecten in het Nederlands : structuur, perceptie en functie. 01/10/2003 - 31/12/2005
| Abstract | In dit project wordt onderzoek gedaan naar de fonetiek en fonologie van tonale accenten in Limburgs dialecten, naar de perceptieve waarneembaarheid van die accenten, en naar hun functie voor het markeren en interpreteren van de informatiestructuur van uitingen. Het onderzoek heeft drie doelen. Allereerst is het de bedoeling om een bestaand databestand (fonetisch en fonologisch) van Nederlands Limburgse dialecten aan te vullen met vergelijkbare data voor Vlaams Limburgse dialecten. Daarnaast zal worden nagegaan in hoeverre het bestaan van een meer of minder opvallend tonaal contrast kan worden verklaard vanuit de afstand van het dialect tot niet-tonale dialecten, om zo beter begrijpen hoe dialecten elkaar kunnen beinvloeden en hoe tonale contrasten kunnen vervagen in de loop van een fonologisch proces. Tenslotte zal worden onderzocht, in zowel een noordelijke als een zuidelijke groep dialecten, in hoeverre de realisatie van een tonaal contrast afhangt van de informatiestructuur van een zin, om zo te achterhalen wat de interactie is tussen de aard van lexical toononderscheiden en de focusdistributie binnen een zin. | | Looptijd | 01/10/2003 - 31/12/2005 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Incrementele semantische verwerking van zinnen: hoe komen we tot specifieke interpretaties? 01/10/2003 - 30/09/2004
| Abstract | De opzet van het voorgestelde project is om inzichten uit mijn eigen psycholinguïstisch onderzoek naar semantische verwerking te verbinden met de meest recente theorieën in de hedendaagse generatieve semantiek. Door middel van oogbewegingsonderzoek zullen linguïstische principes, die beschrijven hoe er gekomen wordt tot semantisch verrijkte interpretaties, getest worden. Het Underspecification Model dat ik voorgesteld heb voor de on-line verwerking van figuurlijk taalgebruik kan hierdoor uitgebreid en verfijnd worden. De bedoeling is om uiteindelijk te komen tot een algemeen model van de on-line, incrementele semantische verwerking van geschreven taal. | | Looptijd | 01/10/2003 - 30/09/2004 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Psycholinguïstiek : verwerkings- en verwervingsprocessen van lezen en spellen. 01/10/2003 - 31/12/2005
| Abstract | De doelstelling van deze Wetenschappelijke Onderzoeksgemeenschap is de integratie van de Vlaamse, Nederlandse en internationale expertise omtrent de studie van (i) de verwerving van lezen en spellen en (ii) de verwerkingsprocessen bij ervaren lezers en spellers. Centraal staat de studie van het lezen en spellen van woorden (herkenning en productie van geschreven woorden), meer bepaald de rol die de fonologie en de morfologie daarbij spelen en het belang van de manier waarop de spelling van de taal deze linguïstische dimensies representeert. Concrete doelen zijn: uitvoering van gezamenlijk empirisch onderzoek door diverse subteams van de WOG (experimenten, corpusanalyses, simulaties), meer bepaald in een cross-linguïstisch perspectief, uitwisseling van expertise in de vorm van personeel en middelen, organisatie van workshops en één internationaal congres. | | Looptijd | 01/10/2003 - 31/12/2005 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Psycholinguïstiek: verwerkings- en verwervingsprocessen van lezen en spellen. 01/10/2003 - 31/12/2005
| Abstract | De doelstelling van deze wetenschappelijke onderzoeksgemeenschap is de integratie van Vlaamse, Nederlandse en internationale expertise omtrent de studie van (i) de verwerving van lezen en spellen en (ii) de verwerkingsprocessen bij ervaren lezers en spellers. Centraal staat de studie van het lezen en spellen van woorden (herkenning en productie van geschreven woorden), meer bepaald de rol die de fonologie en de morfologie daarbij spelen en het belang van de manier waarop de spelling van de taal deze linguïstische dimensies representeert. Concrete doelen zijn: uitvoering van gezamenlijk empirisch onderzoek door diverse sub-teams van de WOG (experimenten, corpusanalyses, simulaties), meer bepaald in een cross-linguïstisch perspectief, uitwisseling van expertise in de vorm van personeel en middelen, organisatie van workshops en één internationaal congres. | | Looptijd | 01/10/2003 - 31/12/2005 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Taalverwerving bij jonge kinderen met een cochleaire implantatie : een longitudinaal effectenonderzoek van hun auditieve, spraak- en taalontwikkeling. 01/10/2003 - 31/12/2004
| Abstract | In dit project onderzoeken we de auditieve ontwikkeling, de spraak- en taalverwerving bij congenitaal dove kinderen met een cochleair implantaat (CI) geïmplanteerd tijdens het tweede levensjaar. Het doel is systematisch het effect van de CI te onderzoeken op verschillende aspecten van de taal- en spraakontwikkeling:
? Onderzoek van het effect van een CI op het auditieve vlak;
? Onderzoek van het effect van CI op het articulatorisch vlak (de spraak);
? Onderzoek van het effect van CI op de taalverwerving en communicatieve ontwikkeling.
In essentie willen we nagaan hoe de toegang tot auditieve informatie evolueert en welke impact die toegang tot de gesproken taal heeft op de eigen spontane spraak en taal van het kind.
De wetenschappelijke doelstellingen van het onderzoeksproject zijn (i) descriptief en (ii) fundamenteel psycholinguïstisch.
(i)Descriptief: een longitudinale beschrijving van de auditieve ontwikkeling en de spraak-, taal- en communicatie-ontwikkeling na een CI. De descriptie zal ons een antwoord geven op de vraag: verloopt de taalverwerving kwalitatief en kwantitatief zoals bij normaal horende baby''s? Is er een kwalitatief en/of kwantitatief onderscheid in de auditieve ontwikkeling, spraak- en taalontwikkeling tussen baby''s afhankelijk van de leeftijd waarop ze een CI krijgen?
(ii) Fundamenteel psycholinguïstische doelstellingen:
? Onderzoek van de perceptie van segmentele en suprasegmentele karakteristieken van de spraak in relatie tot hun productie;
? Onderzoek van de fonologische ontwikkeling op segmenteel en suprasegmenteel vlak met bijzondere aandacht voor de evolutie van truncatiepatronen;
? Onderzoek van de lexicale en morfosyntactische verwerving met speciale aandacht voor de evolutie van `functiewoorden'' of gesloten klasse woorden t.a.v. open klasse woorden, een oppositie gerelateerd aan perceptuele saillantie;
? Onderzoek van communicatieve ontwikkeling, met bijzondere aandacht voor (1) het gebruik en de plaats van spraak tgo. (conventionele) gebaren, (2) het gebruik van interactionele middelen (aandacht trekken/richten/''), (3) de omvang en het gebruik van types interactiebeurten door kind en volwassen conversatiepartner. | | Looptijd | 01/10/2003 - 31/12/2004 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Tekstanalyse en zelflerende systemen voor prosodie. 01/10/2003 - 31/12/2004
| Abstract | Doel van dit project is empirisch te onderzoeken of een natuurlijk klinkende prosodie kan worden gegenereerd op basis van twee methodes die recent succesvol zijn gebleken in andere taalverwerkingsdomeinen: (a) robuuste analyse van tekst met behulp van technieken uit information retrieval en information extraction, en (b) geavanceerde zelflerende en meta-lerende systemen. | | Looptijd | 01/10/2003 - 31/12/2004 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Een computationeel psycholinguïstische benadering van primaire taalverwerving. 01/10/2003 - 30/09/2012
| Abstract | Het doel van dit project is de ontwikkeling van een computationeel psycholinguïstisch model van de primaire taalverwerving dat gekenmerkt kan worden als een datagedreven model waarin algemene (i.e., niet specifiek talige) leermechanismen vanuit de input taalkennis (grammatica, lexicon, etc.) verwerven. De term ''computationeel psycholinguïstisch'' karakteriseert de aard van het model dat we voor ogen hebben, een model van de taalverwervings- en taalverwerkingsprocessen die de primaire taalverwerving mogelijk maken en bewerkstelligen. De samenstellende delen van die term preciseren ook een methodologische optie: het voorgestelde onderzoek omvat namelijk twee luiken:
(1) een psycholinguïstisch luik waarin de verwerving van de natuurlijke taal bestudeerd wordt bij kinderen, gebruik makend van de gangbare psycholinguïstische methodologie, d.i. analyse van corpora van spontane spraak en experimentele toetsing van hypothesen die evt. door het corpusonderzoek gegenereerd worden.
(2) een computationeel luik waarin een computermodel van dezelfde taalaspecten wordt geïmplementeerd, gebruik makend van de principes van ''gelijkenis-gebaseerd redeneren''.
De relatie tussen de luiken is tweevoudig: (i) De ontwikkeling van een theorie over taalverwerving waarin de rol van structurele aspecten van de taalinput en het zelf-organiserend vermogen van de taalverwerver centraal staan. (ii) Een gezamenlijk studie-object maakt het mogelijk om een vruchtbare wisselwerking tussen de psycholinguïstische data en theorievorming en het computationeel model te bewerkstelligen. Dit houdt o.m. in dat gegevens uit de natuurlijke taalverwerving in de twee luiken van het onderzoek gebruikt worden, nl. als primair studieobject in het psycholinguïstisch luik en als effectief inputmateriaal voor de artificiële verwerver; de performantie van die laatste zal bovendien geëvalueerd worden aan de hand van de taalverwerving en -ontwikkeling van kinderen. | | Looptijd | 01/10/2003 - 30/09/2012 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Atranos : automatische transcriptie en normalisatie van spraak 01/10/2003 - 30/09/2004
| Abstract | Doel van het project is bij te dragen tot de ontwikkeling van betere producten voor de verbatim transcriptie van spraak, en voor de omzetting van deze transcripties naar een vorm die beter aangepast is aan de noden van de eindgebruiker. Een toepassing die als case study zal worden bestudeerd is het genereren van ondertitels ten behoeve van slechthorenden. CNTS zal leertechnieken onderzoeken voor de transcriptie van onbekende woorden en statistische technieken voor alignment en de voorspelling van ondertitels uit transcripties. | | Looptijd | 01/10/2003 - 30/09/2004 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Wetenschappelijke onderzoeksgemeenschap computerlinguistiek, taal- en spraaktechnologie. 01/10/2003 - 31/12/2004
| Abstract | Het doel van deze Wetenschappelijke Onderzoeksgemeenschap (met roepnaam CLIF: Computational Linguistics in Flanders) is het samenbrengen van de Vlaamse expertise in het domein van de taal- en de spraakverwerking. Voor de handhaving van het Nederlands als gelijkwaardig met grotere talen in Europa is deze bundeling van expertise essentieel. De samenwerking tussen de deelnemende onderzoeksgroepen zal verlopen volgens een aantal krachtlijnen:
''Het samenbrengen van de fundamentele onderzoeksinspanningen op het vlak van de taal- en spraakverwerking in Vlaanderen.
''Het faciliteren van de onderzoeksactiviteiten van de deelnemende onderzoeksgroepen met het oog op een zo ruim mogelijke (her-)bruikbaarheid van gegevensbestanden voor gesproken en geschreven taal.
''CLIF wil zich in de nabije toekomst heel specifiek toespitsen op de uitwerking van de integratie van fundamenteel onderzoek in de taal- en de spraaktechnologie in een Vlaamse context.
''CLIF wil zich ook inzetten bij dienstverlening door advies en specifieke onderwijsaktiviteiten. | | Looptijd | 01/10/2003 - 31/12/2004 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Vlaamse luik van het project Corpus gesproken Nederlands. 01/10/2003 - 30/11/2003
| Abstract | Het Nederlands-Vlaamse programma Corpus Gesproken Nederlands heeft tot doel een verzameling van ongeveer 10 miljoen gesproken woorden samen te stellen. Op technologisch vlak is een dergelijk corpus essentieel voor de verdere ontwikkeling van Nederlandstalige automatische spraakherkenning, en helpt op deze manier de toekomst van het Nederlands als cultuurtaal in het veeltalig Europa veilig te stellen. Het Corpus Gesproken Nederlands is ook voor andere onderzoeksgebieden van bijzonder belang.
Voorbeelden zijn lexicografie, taalonderwijs, spraak- en taalontwikkeling bij kinderen, sociolinguïstiek, psycholinguïstiek, fonetiek/fonologie en conversatieanalyse. | | Looptijd | 01/10/2003 - 30/11/2003 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
- Computationele psycholinguistiek : natuurlijke en artificiele taalverwerving en -verwerking. 01/10/2003 - 31/12/2003
| Abstract | Zijn taalverwerving en (volwassen) taalgebruik mogelijk zonder aanname van abstracte linguïstische representaties? Deze vraag wordt bestudeerd aan de hand van een nieuwe methodologie: technieken uit drie verschillende disciplines worden gebruikt, nl. het taalverwervingsonderzoek, de psycholingu''stiek en de Artificiële intelligentie. De eerste twee disciplines bestuderen de reële taalleerder/-gebruiker, terwijl de laatste de Artificiële taalleerder/-gebruiker bestudeert. In het verleden werden Artificiële leermodellen gebruikt om effecten te simuleren die in het reÙle taalgebruik werden geobserveerd. Hoewel simulaties de computationele kracht van het leersysteem demonstreren en interessante hypothesen suggereren omtrent de eigenlijke taalgebruiker, werden ze nooit gebruikt om hypothesen te falsifiÙren uit (ontwikkelings)psycholinguïstische studies. In het voorgestelde project willen we Artificiële taalleerders/-gebruikers niet enkel inzetten om het reÙle taalgebruik te simuleren maar tevens om factoren te isoleren die het gedrag van het model beïnvloeden en vervolgens de effecten van diezelfde factoren te bestuderen in psycholinguïstische experimenten en in taalverwervingsonderzoek. Als de effecten bij de Artificiële leerder/gebruiker verschillen van die bij de reÙle leerder/gebruiker, kan het leermodel worden aangepast om uiteindelijk zijn gedrag in overeenstemming te brengen met dat van de taalgebruiker. Deze methode waarbij de resultaten omtrent taalverwerving en psycholingu''stiek worden gerelateerd aan computationeel werk en omgekeerd is dus een heuristiek om eigenschappen te ontdekken van de representatie van taal in de reÙle taalleerder/-gebruiker. | | Looptijd | 01/10/2003 - 31/12/2003 | | Onderzoeker(s) | | | Onderzoeksgroep(en) | |
(toelichting
bij de getoonde projecten)
|
|
Expertise
|
Toon de expertise van deze onderzoeksgroep - Daelemans Walter
- Ontwikkeling systemen voor taalverwerking
Computermodellen taalverwerking en taalverwerving Textanalyse Computerstylometrie Corpusverwerving, -annotatie en -exploitatie| Techniek: | - Computermodellen, simulatie - Data Mining en zelflerende systemen - Systemen voor text analytics | | Gebruikers: | - Gebruikers van kennismanagementsystemen: intelligente zoekmachines, vraag-antwoord systemen, automatische samenvatting, domeinmodellering, ontologie-initiatie en integratie, terminologie-extractie en management, textcategorisatie, -filtering en -routing. - Forensische taalkunde: auteursherkenning, plagiaatdetectie. - Semantische Web: automatische metadatatoekenning, semantische analyse. - Serious Gaming: taalcompetentie voor spel-agents. - E-government: kennismanagement, informatiepresentatie, leesbaarheidscontrole overheidsteksten. - E-health: communicatie-hulpmiddelen, leesbaarheidscontrole patiënteninformatie. - Digitaal erfgoed: analyse van en informatietoegang tot gedigitaliseerde erfgoedverzamelingen, combinatie tekst- en audiomining. | | Trefwoorden: | TEXT MINING, COMPUTATIONAL LINGUISTICS, COGNITIVE SCIENCES, COMPUTATIONAL PSYCHOLINGUISTICS, DIGITAL HUMANITIES, ARTIFICIAL INTELLIGENCE |
- Gillis Steven
- Sandra Dominiek
- Verzorgen van lezingen over de ontwikkeling van geletterdheid en spellingproblemen.
| Techniek: | - Registratie van reactietijden op eenvoudige taalstimuli (bv. woorden)
- Experimentele designs voor de studie van taal | | Gebruikers: | - Personen die in het educatieve veld werkzaam zijn, meer bepaald op de domeinen van (leren) lezen en spellen
- Instellingen die zich met de alfabetisering van ongeletterden of anders-geletterden bezighouden
- Centra die remediëringsonderwijs voor zwakke lezers verzorgen | | Trefwoorden: | SPELLING PROBLEMS, READING PROBLEMS, REACTION TIME MEASUREMENT, COMPUTATIONAL MODELS |
|
|
|
|
|
|
|
|
|