diplomsko delo
Povzetek
V okviru diplomskega dela je implementirana aplikacija za prepoznavo izgovorjenih besed na sistemu Android. Prepoznava se izvaja s pomočjo lokalno shranjenega modela TensorFlow Lite na napravi. Model je naučen s pomočjo značilk MFCC, pridobljenih iz nabora zvočnih posnetkov. Faze delovanja si sledijo tako, da aplikacija najprej zajame zvok na vhodu naprave, ga nato obdela v značilke in na pridobljeni matriki opravi klasifikacijo. Tako dosežemo neprekinjeno prepoznavo besed. Postopek obdelave zvočnega signala v aplikaciji mora biti ekvivalenten postopku obdelave, ki je uporabljen v cevovodu za učenje. Model na testnih podatkih dosega natančnost 88.73%, medtem ko, storitev aplikacije pri uporabniškem testiranju dosega natančnost 82.23% na podatkih v realnem svetu.
Ključne besede
prepoznava besed;zaznava izgovorjenih besed;MFCC;Android;univerzitetni študij;diplomske naloge;
Podatki
Jezik: |
Slovenski jezik |
Leto izida: |
2023 |
Tipologija: |
2.11 - Diplomsko delo |
Organizacija: |
UL FRI - Fakulteta za računalništvo in informatiko |
Založnik: |
[E. Mugerli] |
UDK: |
004.5:004.934(043.2) |
COBISS: |
166292227
|
Št. ogledov: |
34 |
Št. prenosov: |
5 |
Ocena: |
0 (0 glasov) |
Metapodatki: |
|
Ostali podatki
Sekundarni jezik: |
Angleški jezik |
Sekundarni naslov: |
Custom wake-word detection on Android |
Sekundarni povzetek: |
As part of the thesis, an Android application for wake word recognition is implemented. Recognition is performed using a locally stored TensorFlow Lite model on the device. The model is trained using MFCCs obtained from a custom set of audio recordings.
The application operates by initially capturing audio from the device's input, subsequently transforming it into features, and then conducting classification on the resulting matrix. This process enables us to achieve continuous word recognition. The processing in the application must be equivalent to the processing from the model training. The model achieves an accuracy of 88.73% on test data, while the application, based on user testing, is 82.23% accurate on real-world data. |
Sekundarne ključne besede: |
mobile application;word detection;MFCC;Android;computer science;diploma;Mobilne aplikacije;Avtomatsko prepoznavanje govora;Računalništvo;Univerzitetna in visokošolska dela; |
Vrsta dela (COBISS): |
Diplomsko delo/naloga |
Študijski program: |
1000468 |
Konec prepovedi (OpenAIRE): |
1970-01-01 |
Komentar na gradivo: |
Univ. v Ljubljani, Fak. za računalništvo in informatiko |
Strani: |
40 str. |
ID: |
19921120 |