Spring til indhold

Tekstkorpus

Fra Wikipedia, den frie encyklopædi
Den printbare version understøttes ikke længere, og har muligvis nogle renderingsfejl. Opdater venligst din browsers bogmærker og brug i stedet din browsers standard printfunktion.

Et tekstkorpus er en samling af maskinelt læsbare tekster, som tjener et bestemt formål, samt overholder regler for indhold og format.

Sprogforskere (datalingvister) anvender tekstkorpus som udgangspunkt for analyser af sprog. Til støtte for analysen er teksternes ord ofte 'annoterede', dvs. forsynet med oplysning om ordklasse, ordstamme eller faste vendinger. På basis heraf analyseres sætningers grammatiske struktur.

Anvendelsesområder er oversættelse og talegenkendelse.

Eksterne henvisninger

  • KorpusDK giver mulighed for at undersøge sprogbrugen i et stort antal danske tekster, i alt 56 millioner ord.


Sprog og litteraturSpire
Denne artikel om litteratur er en spire som bør udbygges. Du er velkommen til at hjælpe Wikipedia ved at udvide den.