Korpus over dansk tegnsprog

Indtil for få år siden har verdens tegnsprogsordbøger mere været ordlister end ordbøger og ofte baseret på det omgivende talesprog og ikke sproglige analyser af tegnsprogene. Moderne ordbøger er i dag korpusbaserede – det vil sige, at den viden, der præsenteres i ordbøgerne, er hentet gennem sproglige analyser af store tekstmængder.

Tegnsprogsordbog


Korpusbasering af tegnsprogsordbøger er en ny tilgang til tegnsprogsleksikografi, ligesom en leksikografisk beskrivelse af tegnsprog er en ny disciplin inden for tegnsprogslingvistikken. Dette projekt har ambitioner om at udbygge den tegnsprogsleksikografisk funderede Ordbog over Dansk Tegnsprog til en korpusbaseret ordbog.

Dokumentation af tegnsprog

Dansk tegnsprog er modersmål for ca. 2000 danskere. Forskning i og dokumentation af sproget er med til at beskytte et mindretalssprog og er med til at højne standarden af uddannelse i dansk tegnsprog og bl.a. sikre en sproglig høj kvalitet hos tegnsprogstolke i Danmark.

Ordbog over Dansk Tegnsprog er det sted, vi publicerer ny viden om sproget. I et korpus over dansk tegnsprog vil vi systematisk kunne hente viden til publicering i ordbogen fremfor som hidtil i al for høj grad at basere nyt indhold på redaktionens sproglige intuition.

Ud over de fordele der vil være for fremtidigt ordbogsarbejde ved at have et annoteret korpus over Dansk Tegnsprog, vil dokumentationen af sproget have stor betydning for fremtidig forskning og undervisning i dansk tegnsprog, for Dansk Sprognævns tegnsprogsafdelings oplysningsarbejde og i den komparative lingvistik, der er i kraftig vækst i den tegnsprogsforskning, der foregår globalt. Endelig vil en udvidelse af Ordbog over Dansk Tegnsprog give både uddannelsen og praksisfeltet et forbedret redskab i dagligdagen.

Projektet skal munde ud i:

  • En ikke-automatiseret, men IT-baseret opmærkningsmodel implementeret i et kodningsværktøj samt et multimodalt korpus bestående af opmærket videomateriale for dansk tegnsprog
  • En model til kobling mellem Korpus over Dansk Tegnsprog og Ordbog over Dansk Tegnsprog.
  • En minimum 40 % udbygning af Ordbog over Dansk Tegnsprog med tegn, udvalgt og analyseret ved hjælp af Korpus over Dansk Tegnsprog.

Perspektivet for projektet er at skabe mulighed for maskinelle undersøgelser af tegnsprogs tegnforråd og af dets fonologiske og syntaktiske mønstre og strukturer. Med tilgang til et korpus vil både analysen af de enkelte tegns brug og fremfindelsen af autentiske brugseksempler kunne effektiviseres markant. Desuden vil de allerede eksisterende ordbogsartikler på længere sigt kunne opdateres og kompletteres med basis i Korpus over Dansk Tegnsprog.

Hvad er et tegnsprogskorpus?

Et korpus er en søgbar tekstsamling, der viser, hvordan et sprog faktisk bruges. Tegnsprogskorpusser er multimodale korpusser, der forbinder videooptagelser af tegnsprog med en skreven opmærkning, der rummer en række oplysninger om hvert tegn, knyttet til videoen ved hjælp af tidskoder.

Pga. tegnsprogets visuelle modalitet – tegnsprog har ingen skreven standard – er opmærkningen af tegnsprogskorpusser en tidskrævende opgave. Hvor opmærkning af korpusser over skrevne sprog typisk foregår ved hjælp af automatisk genkendelse af ordene og i et vist omfang automatisk generering af fx ordklasseoplysninger til hvert ord, må opmærkning af tegnsprogskorpusser foretages manuelt, da der endnu er ikke udviklet et tilstrækkeligt følsomt værktøj til automatisk genkendelse og analyse af tegn.

Kort om projektet

Målet for projektet 'Korpus over dansk tegnsprog' (2014-2021) er at opbygge et sprogligt korpus for dansk tegnsprog samt – på basis af dette korpus – at analysere dansk tegnsprog og udvide og videreudvikle Ordbog over Dansk Tegnsprog.

Samarbejdspartnere

Projektet samarbejder bl.a. med Dansk Sprognævns Tegnsprogsråd, Den Danske Ordbog, Hamburg Universitets korpusprojekt og Warszawa Universitets ordbogs- og korpusprojekt.

Følgegruppe

Projektets følgegruppe har deltagere fra Danske Døves Landsforbund, Danske Døves Ungdomsforbund, Foreningen af Danske Døvblinde, Høreforeningen og tegnsprogstolkeuddannelsen på UCC.

 

Ordbog over Dansk Tegnsprog

Medarbejdere på projektet