doktorska disertacija
Povzetek
Vrednotenje metod strojnega učenja se tradicionalno izvaja z oceno delovanja na ročno označeni testni množici. Ta približek uporabljamo preprosto zato, ker nimamo na voljo boljše metode. Moramo se zavedati, da se je metoda strojnega učenja učila iz zelo sorodnih (podobnih) podatkov. Torej so posledično vsa predvidevanja o zmogljivosti na realnih podatkih, ki so ocenjena na podlagi testne množice, optimistična. Dejanska vrednost metode strojnega učenja temelji na njeni sposobnosti tvorjenja dobrih hipotez.
Ovrednotenje metod strojnega učenja z obdelavo naravnega jezika vpelje popolnoma nov vir: izsledke znanstvenih raziskav in študij, zapisanih v znanstvenih objavah. Ta vir ponuja objektivno metodo ocenitve rezultatov na podlagi podatkov iz raziskav. V veliki meri zmanjša delo domenskih strokovnjakov, ki je potrebno za ovrednotenje rezultatov strojnega učenja. Hkrati je tak pristop zmožen tvoriti enciklopedično zbirko formaliziranega znanja, ki je splošno uporabna.
Ključne besede
verifikacija;strojno učenje;podatkovno rudarjenje;validacija;obdelava naravnega jezika;
Podatki
Jezik: |
Slovenski jezik |
Leto izida: |
2013 |
Tipologija: |
2.08 - Doktorska disertacija |
Organizacija: |
UM FERI - Fakulteta za elektrotehniko, računalništvo in informatiko |
Založnik: |
[S. Pohorec] |
UDK: |
004.655.3:004.855(043.3) |
COBISS: |
266736128
|
Št. ogledov: |
2474 |
Št. prenosov: |
331 |
Ocena: |
0 (0 glasov) |
Metapodatki: |
|
Ostali podatki
Sekundarni jezik: |
Angleški jezik |
Sekundarni naslov: |
Evaluation of machine learning methods with natural language processing |
Sekundarni povzetek: |
Validation of machine learning methods has traditionally been performed with evaluation on hand annotated test sets. This procedure represents an approximation and is used for lack of a better approach. We should consider that the machine learning method has learned from very similar data, consequently all predictions on real data performance, based on this test, are optimistic. The real value of a machine learning method lies in its ability to form good hypothesis.
Natural language processing as a method of evaluation of machine knowledge introduces a new source of validation: research results from scientific studies and papers published in respected conferences and journals. This new source offers a method of objective evaluation of machine learning results. It can greatly diminish the manual effort of domain experts who perform machine learning evaluation. At the same time this approach is capable of forming an encyclopedic database of formal knowledge |
Sekundarne ključne besede: |
verification;machine learning;data mining;validation;natural language processing;Strojno učenje;Disertacije;Podatkovno rudarjenje; |
URN: |
URN:SI:UM: |
Vrsta dela (COBISS): |
Doktorska disertacija |
Komentar na gradivo: |
Univ. v Mariboru, Fak. za elektrotehniko, računalništvo in informatiko |
Strani: |
XX, 155 str. |
ID: |
8726095 |