SUMAT

data collection and parallel corpus compilation for machine translation of subtitles

Volha Petukhova (Avtor), Mirjam Sepesy Maučec (Avtor)

Povzetek

This paper describes the data collection and parallel corpus compilation activities carried out in the FP7 EU-funded SUMAT project. This project aims to develop an online subtitle translation service for nine European languages combined into 14 different language pairs. This data provides bilingual and monolingual training data for statistical machine translation engines which will semi-automate the subtitle translation processes of subtitling companies on a large scale.

Ključne besede

parallel multilingua corpora;statistical machine translation;subtitle translation service;

Podatki

Jezik:	Angleški jezik
Leto izida:	2012
Tipologija:	1.08 - Objavljeni znanstveni prispevek na konferenci
Organizacija:	UM FERI - Fakulteta za elektrotehniko, računalništvo in informatiko
UDK:	004.8
COBISS:	16027926
Št. ogledov:	1420
Št. prenosov:	53
Ocena:	0 (0 glasov)
Metapodatki:

Ostali podatki

Sekundarni jezik:	Neznan jezik
URN:	URN:SI:UM:
Vrsta dela (COBISS):	Delo ni kategorizirano
Strani:	Str. 21-28
Ključne besede (UDK):	science and knowledge;organization;computer science;information;documentation;librarianship;institutions;publications;znanost in znanje;organizacije;informacije;dokumentacija;bibliotekarstvo;institucije;publikacije;prolegomena;fundamentals of knowledge and culture;propaedeutics;prolegomena;splošne osnove znanosti in kulture;computer science and technology;computing;data processing;računalniška znanost in tehnologija;računalništvo;obdelava podatkov;artificial intelligence;umetna inteligenca;
ID:	1439062

Priporočena dela:

SUMAT

2012, data collection and parallel corpus compilation for machine translation of subtitles

Parse tree based machine translation for less-used languages

2008, ni podatka o podnaslovu

Čustvena umetnost vodenja

2008, diplomsko delo

Zbirka izpitnih nalog iz optimizacijskih problemov

2012, e-učno gradivo

Speech recognition system of Slovenian broadcast news

2011, ni podatka o podnaslovu