zaključna naloga Razvojno raziskovalnega programa I. stopnje Strojništvo
Matevž Jeršin (Avtor), Rok Vrabič (Mentor), Peter Butala (Komentor)

Povzetek

Strojno učenje se vedno bolj uporablja v vseh vedah, tudi v strojništvu V nalogi je predstavljen algoritem strojnega učenja za klasificiranje znanstvenih in strokovnih besedil. Razložena je tudi priprava besedila pred klasificiranjem, kar je zelo pomembno za končno uspešnost algoritma. Besedila, ki smo jih dobili na spletišču COBISS so uporabljena v nalogi so znanstveni članki, katerih soavtorji so zaposleni na Fakulteti za strojništvo, Univerze v Ljubljani. Članke smo klasificirali v deset kategorij iz akademije za proizvodnjo inženirstvo - CIRP. Predstavljene so bile najbolj pogoste izbire kategorij, v katerih so pisali avtorji in katere besede so se največkrat pojavljale.

Ključne besede

diplomske naloge;strojno učenje;klasifikacija besedila;spletno strganje podatkov;podatkovno rudarjenje;python;

Podatki

Jezik: Slovenski jezik
Leto izida:
Tipologija: 2.11 - Diplomsko delo
Organizacija: UL FS - Fakulteta za strojništvo
Založnik: [M. Jeršin]
UDK: 004.85:519.2(043.2)
COBISS: 16401947 Povezava se bo odprla v novem oknu
Št. ogledov: 774
Št. prenosov: 266
Ocena: 0 (0 glasov)
Metapodatki: JSON JSON-RDF JSON-LD TURTLE N-TRIPLES XML RDFA MICRODATA DC-XML DC-RDF RDF

Ostali podatki

Sekundarni jezik: Angleški jezik
Sekundarni naslov: Classification of research publications from the domain of mechanical engineering using machine learning
Sekundarni povzetek: Machine learning is getting more and more used nowadays, also in mechanical engineering. This thesis presents algorithm of research publications text classification using machine learning. It is shown the preparation of text step by step, which is very important before the actual classification because of the later performance of the algorithm. Texts used in this algorithm are research publications, which co-authors are employees in Faculty of mechanical engineering, University of Ljubljana. We classified the publications into ten different classes from the international academy for production engineering - CIRP. The most common used categories and most used words are shown and presented.
Sekundarne ključne besede: machine learning;text classification;web scraping;data mining;python;
Vrsta dela (COBISS): Zaključna naloga
Študijski program: 0
Konec prepovedi (OpenAIRE): 1970-01-01
Komentar na gradivo: Univ. v Ljubljani, Fak. za strojništvo
Strani: XIV, 25 f., [6] f. pril.
ID: 10959149
Priporočena dela:
, zaključna naloga Razvojno raziskovalnega programa I. stopnje Strojništvo
, diplomsko delo visokošolskega strokovnega študijskega programa
, delo diplomskega seminarja
, doktorska disertacija