magistrsko delo
Povzetek
Matrična faktorizacija je metoda za zlivanje podatkov, ki jo lahko uporabimo za priporočilne sisteme. V magistrski nalogi smo se ukvarjali s priporočilnim sistemom iz domene turizma, ki uporabnikom priporoča turistična doživetja. Turistični ponudniki za predstavitev svoje ponudbe izberejo slike in opise. Naš cilj je bil izbrati take slike in opise, ki najbolje odražajo oceno ponudnika. Uporabljali smo sintetične podatke o uporabnikih in njihovih ocenah ponudnikov ter implementirali generator slik in opisov. S klasifikacijskimi algoritmi smo iz množice slik in besedil odstranili šum in izbrali slike in besedila, ki najbolje odražajo ponudnikovo povprečno oceno. Ustreznost izbranih primerov smo vrednotili tako, da smo jih uporabili za napovedovanje ocen z matrično faktorizacijo. Uspešnost napovedi smo primerjali z napovedmi matrične faktorizacije z uporabo naključno izbranih slik in besedil ter matrično faktorizacijo brez stranskih virov. Izkazalo se je, da uporaba izbranih slik in besedil ne izboljša napovedi v primerjavi z naključno izbranimi slikami ali besedili in matrično faktorizacijo brez dodatnih virov. Uporabili smo tudi zbirko realnih podatkov s spletnimi slikami in opisi nastanitev. Iz slik in opisov smo z algoritmoma k-najbližjih sosedov in naključni gozdovi napovedovali ocene nastanitev. Izkazalo se je, da iz podatkov nismo izluščili dovolj vzorcev, da bi z uporabljenimi pristopi lahko napovedali ocene na podlagi slik in opisov turističnih ponudnikov.
Ključne besede
priporočilni sistemi;matrična faktorizacija;zlivanje podatkov;računalništvo;računalništvo in informatika;magisteriji;
Podatki
Jezik: |
Slovenski jezik |
Leto izida: |
2020 |
Tipologija: |
2.09 - Magistrsko delo |
Organizacija: |
UL FRI - Fakulteta za računalništvo in informatiko |
Založnik: |
[T. Avbelj] |
UDK: |
004:338.48(043.2) |
COBISS: |
41053955
|
Št. ogledov: |
915 |
Št. prenosov: |
128 |
Ocena: |
0 (0 glasov) |
Metapodatki: |
|
Ostali podatki
Sekundarni jezik: |
Angleški jezik |
Sekundarni naslov: |
Recommending photos and descriptions to tourism providers |
Sekundarni povzetek: |
Matrix factorization is a method for data fusion that can be used for recommender systems. In the thesis, we implemented a recommender system for recommending experiences to tourists. Tourism providers promote their experiences with images and descriptions. Our goal was to choose images and descriptions that best reflect a provider's rating. We used synthetic data for users and ratings and implemented a data generator for images and descriptions. We removed noise from the data using k-nearest neighbors algorithm and for each provider selected one image or one description that represents the provider's rating. The selected images and descriptions were used as a source for matrix factorization for predicting ratings. We compared our process to matrix factorization with no additional sources and to matrix factorization where we chose random images and descriptions and used them as a source. Our process with selected images and descriptions did not improve the AUC score compared to selecting random images and descriptions and using no additional sources. We also tested on online images and descriptions of real accommodations. We used k-nearest neighbors and random forests algorithms to predict average ratings for accommodations from images and descriptions. We concluded that with the methods we used, we were not able to extract patterns from data, which would enable the prediction of ratings based on images and descriptions. |
Sekundarne ključne besede: |
recommendation systems;matrix factorization;data fusion;computer science;computer and information science;master's degree; |
Vrsta dela (COBISS): |
Magistrsko delo/naloga |
Študijski program: |
1000471 |
Konec prepovedi (OpenAIRE): |
1970-01-01 |
Komentar na gradivo: |
Univ. v Ljubljani, Fak. za računalništvo in informatiko |
Strani: |
74 str. |
ID: |
12195568 |