Mojca Stritar (Avtor)

Povzetek

V prispevku je predstavljen pisni korpus usvajanja slovenščine kot tujega jezika KOST, poudarek pa je na njegovem položaju med obstoječimi korpusi tega tipa, zgrajenimi za druge ciljne jezike. Glede na sorodni sociolingvistični položaj je KOST mogoče primerjati s slabo desetino med več kot 190 korpusi usvajanja tujega jezika. Ugotovimo lahko, da je KOST s svojo zasnovo, trenutno velikostjo skoraj 835.000 besed, delno označenimi jezikovnimi napakami in prostim dostopom do podatkov s temi korpusi popolnoma primerljiv in kot tak uporaben vir za raznovrstne raziskave.

Ključne besede

slovenščina;slovenščina kot drugi jezik;korpus usvajanja tujega jezika;klasifikacija napak;jezikovni korpusi;KOST;

Podatki

Jezik: Slovenski jezik
Leto izida:
Tipologija: 1.16 - Samostojni znanstveni sestavek ali poglavje v monografski publikaciji
Organizacija: UL FF - Filozofska fakulteta
UDK: 811.163.6'243'322
COBISS: 131032579 Povezava se bo odprla v novem oknu
Št. ogledov: 28
Št. prenosov: 0
Ocena: 0 (0 glasov)
Metapodatki: JSON JSON-RDF JSON-LD TURTLE N-TRIPLES XML RDFA MICRODATA DC-XML DC-RDF RDF

Ostali podatki

Sekundarni jezik: Angleški jezik
Sekundarni povzetek: This article presents the written Slovenian learner corpus KOST, focusing on its position among other learner corpora for other target languages. In terms of the sociolinguistic position of the target language, KOST can be compared with approximately one-tenth of more than 190 learner corpora. With its design, current size of almost 835,000 words, partially tagged language errors, and free access to data, KOST is fully comparable to these corpora and thus a useful resource for various forms of language research.
Sekundarne ključne besede: Slovene;Slovene as a second language;learner corpus;error classification;language corpora;KOST;
Strani: Str. 323-334
DOI: 10.4312/Obdobja.41.323-334
ID: 19833947