Exjobbsförslag från företag

Detta är ett uppsatsförslag hämtat från Nationella Exjobb-poolen. Klicka här för att komma tillbaka till samtliga exjobbsförslag.

Förslaget inkom 2007-08-24

Knowledge discovery in large datasets: The Netflix prize

OBS! ANSÖKNINGSTIDEN FÖR DETTA EXJOBB HAR LÖPT UT.
Kommersiella dataset är ofta stora och det finns ofta ett stort kommersiellt värde i dessa stora databaser för att nå ökad kunskap om sina kunder.
Stora livsmedelskedjor har scanner-data på sina kunders inköp, exempelvis. Knowledge discovery blir kommersiellt allt viktigare. Neurala nätverk och grafiska modeller används med allt större framgång för att hitta relevanta dimensioner i stora dataset i dessa sammanhang.

Detta examensarbete går ut på att implementera en viss algoritm på ett tillgängligt kommersiellt dataset från det s.k. Netflix prize. Netflix har publicerat ett dataset bestående av 100 miljoner betyg på video-filmer från sina kunder. De har också utfärdat ett pris på en miljon dollar till den som hittar en algoritm som slår deras kommersiella algoritm (med en viss marginal).

Den algoritm som vi vill implementera i detta examensarbete bygger på en den så kallade Restricted Boltzmann Machine (RBM). RBM tillämpat på Netflix dataset finns publicerat, och uppgiften är i första hand att implementera algoritmen i fråga.

Du bör ha solida kunskaper i programmering. En bakgrund från D eller F är säkert lämplig.

Om du är intresserad av mera detaljer kan du skicka ett mejl till kontaktpersonen för ytterligare information och referenser angående algoritmen.

För Netflix prize, se
http://www.netflixprize.com/
och
http://www.cs.uic.edu/~liub/KDD-cup-2007/NetflixPrize-description.pdf



  GÅ TILL XJOBB.NU FÖR FULLSTÄNDIG INFO OM DETTA EXJOBB




Informationen om uppsatsförslag är hämtad från Nationella Exjobb-poolen.