Povzetek

V okviru projekta Sporazumevanje v slovenskem jeziku nastaja referenčni govorni korpus slovenskega jezika, ki bo govorni vir za nekatere jezikovne priročnike in različne jezikoslovne raziskave. Zaradi praktične namembnosti govornega korpusa so ključni cilji njegove gradnje čim bolj pregledne iskalne možnosti in čim lažja berljivost transkripcij. V prispevku predstavljamo načela označevanja posnetkov ter segmentiranja in transkribiranja govora.

Ključne besede

slovenščina;korpusna lingvisitka;govorni korpus;govorjeni jezik;transkribiranje;segmentiranje;

Podatki

Jezik: Slovenski jezik
Leto izida:
Tipologija: 1.08 - Objavljeni znanstveni prispevek na konferenci
Organizacija: UL FF - Filozofska fakulteta
UDK: 811.163.6'271.16:003.035
COBISS: 43881570 Povezava se bo odprla v novem oknu
Št. ogledov: 15
Št. prenosov: 0
Ocena: 0 (0 glasov)
Metapodatki: JSON JSON-RDF JSON-LD TURTLE N-TRIPLES XML RDFA MICRODATA DC-XML DC-RDF RDF

Ostali podatki

Sekundarni jezik: Angleški jezik
Sekundarni povzetek: The project Communication in Slovene includes the construction of a reference corpus of spoken Slovene, which will function as a resource for certain language guides and research projects. Due to its practical goals, key aims of the corpus are straightforward search options and easy-to-read transcription. This paper presents the method to be used for the mark-up of recordings, and for segmenting and transcribing speech samples.
Sekundarne ključne besede: Slovene language;corpus linguistics;spoken corpus;spoken language;transcribing;segmenting;
Vrsta dela (COBISS): Članek v reviji
Strani: Str. 437-442
ID: 20861400