Iskalni niz:
išči po
išči po
išči po
išči po
Vrsta gradiva:
Jezik:
Št. zadetkov: 134
Izvirni znanstveni članek
Oznake: slovenščina;korpusna lingvistika;jezikovne tehnologije;
Urejene računalniške zbirke besedil, korpusi, so uporabni v številnih vejah jezikoslovja. Prispevek se osredotoči na računalniški zapis korpusov, predvsem na njihovo označevanje, tj. dodajanje interpretativnih informacij besedilu v korpusu. Predstavljeno označevanje temelji na upoštevanju mednarodni ...
Leto: 2003 Vir: dLib.si Digitalna knjižnica Slovenije
Video in druga učna gradiva
Oznake:
Ker je vedno več besedil dostopnih v elektronski obliki, postaja razmeroma enostavno zagotoviti digitalna besedila skupaj z njihovimi prevodi v druge jezike. Predavanje predstavi korake v obdelavi takšnih besedil, ki so potrebni, da se jih pretvori v vzporedne korpuse, ki so nato izredno koristen je ...
Leto: 2002 Vir: videolectures.net
Izvirni znanstveni članek
Oznake: korpusi (jezikoslovje);zbirke;noSketch Engine (spletni konkordančnik);CUWI (spletni konkordančnik);
Leto: 2013 Vir: dLib.si Digitalna knjižnica Slovenije
Video in druga učna gradiva
Oznake: computer science;natural language processing;humanities;linguistics
Leto: 2015 Vir: videolectures.net
Raziskovalni podatki
Oznake: historical language;word modernisation;lemmatisation;tagging;manual annotation;TEI
goo300k is a manually annotated reference corpus of historical Slovene. It contains 1,100 pages (about 300,000 tokens) sampled from 89 texts. Each text contains extensive meta-data and per-page links to facsimiles, while the word tokens in the texts are annotated with their modernised word-for ...
Leto: 2015 Vir: CLARIN.si
Raziskovalni podatki
Oznake: historical language;word modernisation;lemmatisation;tagging;digital library;TEI
The IMP digital library contains historical Slovene books and other publications, together 658 texts with over 45,000 pages from the period 1584-1919. Each text contains extensive meta-data, per-page links to facsimiles, and hand-corrected transcriptions with structural and editorial annotations. ...
Leto: 2014 Vir: CLARIN.si
Raziskovalni podatki
Oznake: historical language;modernisation;lemmatisation;TEI
The imp25k lexicon of historical Slovene was created automatically from the goo300k and foo3M annotated corpora and contains attested and manually verified word forms and their annotations with examples of use. A lexicon entry contains the modern lemma with its part-of-speech and, for archaic words, ...
Leto: 2014 Vir: CLARIN.si
Raziskovalni podatki
Oznake: WebLicht
Tokenisation, PoS tagging, lemmatisation and dependency parsing for Croatian
Leto: 2016 Vir: CLARIN.si
Video in druga učna gradiva
Oznake: humanities;social sciences
The abstract presents the CLARIN.SI supported WebAnno platform for manual annotation of corpora. We concentrate on the conversion of the corpus TEI encoding to the WebAnno format and the merge of WebAnno export into the original TEI. We also overview some annotation campaigns over Slovene corpora.
Leto: 2016 Vir: videolectures.net
Video in druga učna gradiva
Oznake: computers;digital media;humanities;languages;social sciences;society;politics
The paper describes the process of acquisition, up-translation, encoding, and annotation of the collection of the parliamentary debates from the Assembly of the Republic of Slovenia from 1990-1992, covering the period before, during, and after Slovenia became an independent country in 1991. The enti ...
Leto: 2018 Vir: videolectures.net
Št. zadetkov: 134
Ključne besede:
Leto izdaje:
Avtorji:
Repozitorij:
Tipologija:
Jezik: