Povzetek
V prispevku je predstavljen pisni korpus usvajanja slovenščine kot tujega jezika KOST, poudarek pa je na njegovem položaju med obstoječimi korpusi tega tipa, zgrajenimi za druge ciljne jezike. Glede na sorodni sociolingvistični položaj je KOST mogoče primerjati s slabo desetino med več kot 190 korpusi usvajanja tujega jezika. Ugotovimo lahko, da je KOST s svojo zasnovo, trenutno velikostjo skoraj 835.000 besed, delno označenimi jezikovnimi napakami in prostim dostopom do podatkov s temi korpusi popolnoma primerljiv in kot tak uporaben vir za raznovrstne raziskave.
Ključne besede
slovenščina;slovenščina kot drugi jezik;korpus usvajanja tujega jezika;klasifikacija napak;jezikovni korpusi;KOST;
Podatki
Jezik: |
Slovenski jezik |
Leto izida: |
2022 |
Tipologija: |
1.16 - Samostojni znanstveni sestavek ali poglavje v monografski publikaciji |
Organizacija: |
UL FF - Filozofska fakulteta |
UDK: |
811.163.6'243'322 |
COBISS: |
131032579
|
Št. ogledov: |
28 |
Št. prenosov: |
0 |
Ocena: |
0 (0 glasov) |
Metapodatki: |
|
Ostali podatki
Sekundarni jezik: |
Angleški jezik |
Sekundarni povzetek: |
This article presents the written Slovenian learner corpus KOST, focusing on its position among other learner corpora for other target languages. In terms of the sociolinguistic position of the target language, KOST can be compared with approximately one-tenth of more than 190 learner corpora. With its design, current size of almost 835,000 words, partially tagged language errors, and free access to data, KOST is fully comparable to these corpora and thus a useful resource for various forms of language research. |
Sekundarne ključne besede: |
Slovene;Slovene as a second language;learner corpus;error classification;language corpora;KOST; |
Strani: |
Str. 323-334 |
DOI: |
10.4312/Obdobja.41.323-334 |
ID: |
19833947 |