33
16.07.2013 1 Fakultät Technik und Informatik Studiendepartment Informatik Ivan Demin

Radio Recommendation System

Embed Size (px)

Citation preview

Page 1: Radio Recommendation System

16.07.2013 1

Fakultät Technik und Informatik Studiendepartment Informatik

Ivan Demin

Page 2: Radio Recommendation System

1. Motivation 2. RLRadio 4. R-Learning for Undiscounted Tasks 3. Zusammenfassung

16.07.2013 2

Page 3: Radio Recommendation System

16.07.2013 3

[1]

Page 4: Radio Recommendation System

16.07.2013 4

[1]

[2]

Page 5: Radio Recommendation System

Was haben diese Dienste gemeinsam?

16.07.2013 5

[1]

[2]

[3]

Page 6: Radio Recommendation System

Benutzer weiß, dass sein Verhalten für die Bewertung relevant ist

Liedbewertungen Favorisierung

16.07.2013 6

Page 7: Radio Recommendation System

Benutzer weiß nicht, dass sein Verhalten als relevante Resonanz interpretiert wird

Klickraten Hördauer

16.07.2013 7

Page 8: Radio Recommendation System

16.07.2013 8

[4]

Page 9: Radio Recommendation System

Zwei Varianten: RLRadio P und RLRadio RL RLRadio P: Radiosenderauswahl nur anhand

des expliziten Feedbacks RLRadio RL: Radiosenderauswahl anhand des

expliziten und impliziten Feedbacks

16.07.2013 9

Page 10: Radio Recommendation System

16.07.2013 10

[5]

Page 11: Radio Recommendation System

Repräsentiert die Radiosender-Vorlieben des Benutzers

Beschränkung des Zustandsraums durch Aufzeichnung von zwei Radiosendern

Weitere Einschränkungen durch Präferenzen: tief(<15%), fair(15-40%), hoch(40%-60%) und sehr hoch(> 60%)

56133 mögliche Zustände

16.07.2013 11

Page 12: Radio Recommendation System

Neun mögliche Radiosender-Empfehlungen Keine Musikstück-Empfehlung möglich

16.07.2013 12

Blues

Jazz Fusion

Pop Top

Hits

Metal

Relax

Classic

Rock

Opera

Baroque

Page 13: Radio Recommendation System

Belohnung anhand der Hörlänge eines Musikstücks

Belohnung in drei Stufen eingeteilt:

<15% - null Punkte

15-60% - ein Punkt

>60% - zwei Punkte

16.07.2013 13

Page 14: Radio Recommendation System

Zustandswechsel anhand:

angegebenen Radiosender Präferenz

Prozentsatz der letzter zwei Musikstücke

Aktueller Zustand

16.07.2013 14

Page 15: Radio Recommendation System

Optimal Policy für RLRadio P mit Policy Iteration berechnet

Berechnete Strategie aus RLRadio P wird Startstrategie von RLRadio RL

Optimal Policy von RLRadio RL mit Hilfe R-Learning for Undiscounted Tasks verbessert

16.07.2013 15

Page 16: Radio Recommendation System

Off-Policy Verfahren Ohne Discountrate Bestrebung nach jedem Zeitschritt maximale

Belohnung zu erreichen

16.07.2013 16

Page 17: Radio Recommendation System

16.07.2013 17

Page 18: Radio Recommendation System

Lernraten: 𝛼&𝛽 Belohnung: 𝑟 Durchschnittliche Belohnung: 𝑝 E. a. Belohnungen: 𝑄 𝑠, 𝑎 M. E. a. Belohnungen: 𝑚𝑎𝑥a𝑄(𝑠, 𝑎)

16.07.2013 18

Page 19: Radio Recommendation System

Blues

Jazz Fusion

Pop Top

Hits

Metal

Relax

Classic

Rock

Opera

Baroque

16.07.2013 19

Page 20: Radio Recommendation System

16.07.2013 20

Page 21: Radio Recommendation System

1,5 0,5 1,1

1,2 1,9 0,6

1,3 0,7 0,9

16.07.2013 21

Page 22: Radio Recommendation System

1,5 0,5 1,1

1,2 1,9 0,6

1,3 0,7 0,9

16.07.2013 22

Page 23: Radio Recommendation System

𝑝 = 1,4 𝑟 = 2

16.07.2013 23

Page 24: Radio Recommendation System

16.07.2013 24

Page 25: Radio Recommendation System

1,5 0,5 1,1

1,2 1,975 0,6

1,3 0,7 0,9

16.07.2013 25

Page 26: Radio Recommendation System

r p Q(s,a)

0 1,76 1,6552

0 1,056 1,465

16.07.2013 26

Page 27: Radio Recommendation System

1,5 0,5 1,1

1,2 1,465 0,6

1,3 0,7 0,9

16.07.2013 27

Radiosenderwechsel

Page 28: Radio Recommendation System

Vorteile:

Kein Terminaler Zustand notwendig

schlechte Belohnungen führen zum sofortigen Radiosenderwechsel

für kontinuierliche Aufgaben geeignet

Nachteil:

Höhere Gefahr die „Klippe“ runterzufallen

16.07.2013 28

Page 29: Radio Recommendation System

16.07.2013 29

[6]

Page 30: Radio Recommendation System

Radiovorschlagssystem anhand explizitem und implizitem Feedback

R-Learning for Undiscounted Tasks eignet sich für diese Problemstellung

Transkription des Systems in andere Bereiche möglich

16.07.2013 30

Page 31: Radio Recommendation System

16.07.2013 31

Vielen Dank Für Ihre

Aufmerksamkeit

Fragen?

Page 32: Radio Recommendation System

[Bortz u. Lienert 2008] Bortz, Jürgen ; Lienert, Gustav A.: Kurzgefasste Statistik für die klinische Forschung -. Berlin : Springer DE, 2008. – ISBN 978–3–540–75738–2

[Jawaheer u. a. 2010] Jawaheer, Gawesh ; Szomszor, Martin ; Kostkova, Patty: Comparison of implicit and explicit feedback from an online music recommendation service. In: Proceedings of the 1st International Workshop on Information Heterogeneity and Fusion in Recommender Systems - HetRec ’10 (2010), 47–51.

[Lee 2005] Lee, Mark: 6.7 R-Learning for Undiscounted Continuing Tasks. http://webdocs.cs.ualberta.ca/~sutton/book/ebook/node67.html. Version: 2005

[Moling u. a. 2012] Moling, Omar ; Baltrunas, Linas ; Ricci, Francesco: Optimal radiochannel recommendations with explicit and implicit feedback. In: Proceedings of the sixthACMconference on Recommender systems - RecSys ’12 (2012), 75.

[Richard S. Sutton 1998] Richard S. Sutton, Andrew G. B.: Reinforcement Learning: An Introduction.http://webdocs.cs.ualberta.ca/~sutton/book/ebook/. Version: 1998

16.07.2013 32

Page 33: Radio Recommendation System

[1] spotify – Abruf:14.07.2013 http://www.smartdroid.de/wp-content/uploads/2012/03/spotify-logo.png

[2] Last.fm – Abruf:14.07.2013 http://sysout.be/wp-content/uploads/2013/01/last-fm-logo.png

[3] pandora - Abruf:14.07.2013 http://a1.mzstatic.com/us/r1000/033/Purple4/v4/16/38/4e/16384e69-3263-9d3f-484b-7c06488658ca/mzl.qpnxgmrs.png

[4] RLRadio & [5] Radio Präferenzen: Optimal radio channel recommendations with explicit and implicit feedback. In: Proceedings of the sixth ACMconference on Recommender systems - RecSys ’12 (2012), 75. http://dx.doi.org/10.1145/2365952.2365971. – DOI 10.1145/2365952.2365971. ISBN 9781450312707

[6] how i met your mother – Abruf:15.07.2013 http://images3.wikia.nocookie.net/__cb20110701174449/how-i-met-your-mother/de/images/b/b3/Future-Barney-how-i-met-your-mother-2590507-1280-720.jpg

16.07.2013 33