master's thesis
Samo Pahor (Avtor), Jure Demšar (Mentor)

Povzetek

Online advertising allows companies to reach a worldwide user base and engage key demographics to market their products. The cornerstone of modern online advertising is participating in real-time bidding (RTB) auctions, where ad space on websites is being dynamically sold to the highest bidder. A key part of RTB auctions is predicting click-through rate (CTR), or the probability that a user will click on a displayed ad. CTR prediction is performed with machine learning, where click responses are modeled based on a diverse set of contextual and historical features. We tackle the challenge of feature embedding for the purposes of improving the CTR prediction process. We focus on two popular prediction models, logistic regression and factorization machines, and propose different feature embedding modules to improve CTR prediction. We test the predictive performance of our augmented models on an offline dataset, which resembles production data, provided by Zemanta. Our results show that several proposed embedding modules provide an important increase in predictive performance without a drastic increase in training time or model size.

Ključne besede

real-time bidding;click-through rate prediction;feature embedding;feature transformation;computer science;computer and information science;master's thesis;

Podatki

Jezik: Angleški jezik
Leto izida:
Tipologija: 2.09 - Magistrsko delo
Organizacija: UL FRI - Fakulteta za računalništvo in informatiko
Založnik: [S. Pahor]
UDK: 004(043.2)
COBISS: 87422467 Povezava se bo odprla v novem oknu
Št. ogledov: 297
Št. prenosov: 48
Ocena: 0 (0 glasov)
Metapodatki: JSON JSON-RDF JSON-LD TURTLE N-TRIPLES XML RDFA MICRODATA DC-XML DC-RDF RDF

Ostali podatki

Sekundarni jezik: Slovenski jezik
Sekundarni naslov: Vložitev značilk pri napovedovanju verjetnosti klika
Sekundarni povzetek: Spletno oglaševanje podjetjem omogoča stik z uporabniki iz vsega sveta in marketing njihovih izdelkov ustreznim tržnim segmentom. Temelj modernega spletnega oglaševanja je sodelovanje na realnočasovnih (RTB) avkcijah, kjer se reklamni prostor na spletnih straneh dinamično prodaja najvišjim ponudnikom. Ključni del RTB avkcij je napovedovanje klikov (CTR), oziroma računanje verjetnosti, da bo uporabnik kliknil na prikazani oglas. CTR napovedovanje se izvaja s pomočjo strojnega učenja, kjer so kliki modelirani s pomočjo širokega nabora kontekstualnih in zgodovinskih značilk. Lotimo se vložitve značilk za potrebe izboljšanja CTR napovednega procesa. Osredotočimo se na dva popularna napovedna modela, logistično regresijo in faktorizacijske stroje, in predlagamo različne vložitvene module za izboljšanje končne napovedi. Napovedno točnost nadgrajenih modelov izmerimo na lokalnih podatkih podjetja Zemanta, ki so podobni produkcijskemu okolju. Naši rezultati kažejo, da več predlaganih modulov izboljša napovedno točnost brez bistvenega podaljšanja učnega časa ali velikosti modela.
Sekundarne ključne besede: realnočasovne avkcije;napovedovanje klika;vložitev značilk;pretvorba značilk;računalništvo in informatika;magisteriji;Računalništvo;Univerzitetna in visokošolska dela;
Vrsta dela (COBISS): Magistrsko delo/naloga
Študijski program: 1000471
Konec prepovedi (OpenAIRE): 1970-01-01
Komentar na gradivo: Univ. v Ljubljani, Fak. za računalništvo in informatiko
Strani: VI, 58 str.
ID: 13729661