Freitag, 24. April 2009

Recommender der Woche (2): Renlifang





















Renlifang ist auch eine Suchmaschine. Die Abgrenzung von Empfehlungssystemen zu Suchmaschinen fällt aber teilweise schwer. Da hier automatische Empfehlungen (verwandte Personen bspw.) auf Basis eines gegegenen Kontextes gegebenen werden, erfüllt das System aber die formalen Anforderungen an ein Empfehlungssystem.
Die Empfehlungen werden auf Basis von Content Based Filtering ausgesprochen. Konkret werden auf Basis einer Korpus Analyse Kookkurrenzen ermittelt. Signifikante Kookkurrenzen werden dann zu Kollokationen. Der Korpus wird durch Webcrwaling auf Basis einer sehr großen Anzahl von Dokumenten erzeugt.
Ferner wird bei der Analyse der Empfehlungselemente noch eine NER (Named Entity Recognition) durchgeführt, um beispielsweise Personen zu erkennen.
Gemeinsam mit den Kollokation-Informationen können damit ver-wandte Personen gefunden werden.

Wer es sich einmal ansehen möchte, findet es unter Renlifang. Aber Achtung: das Ganze ist in Chinesisch gehalten. Wer der Sprache nicht mächtig ist, kann sich zumindest die recht schöne Visualisierung ansehen.

Donnerstag, 23. April 2009

Theoriefreie Vorstellung des Themas

Wer einen schenllen und einfachen Einstieg in das Thema "Empfehlungssysteme" (im Beitrag auch "Vorstellungssysteme" genannt) sucht, findet hier einen sehr gut gemachten Vidoe-Beitrag

Es wird neben den Collobarative Filtering Ansätzen von Amazon und lastfm auch das Content Based Filtering Verfahren von Pandora thematisiert. Insbesondere werden auch die Probleme "social loafing" und "Datenschutz" beim Collobarative Filtering behandelt.








Elektrischer Reporter – Vorschlagsysteme: Mit den besten Empfehlungen

Freitag, 17. April 2009

Recommender der Woche (1): Photoree


Auf Photoree.com findet sich ein schönes Beispiel für ein auf Colloborative Filtering aufsetzendes Empfehlungssystem für Bilder.

Nachdem man dort 100 Bilder bewertet hat werden "ähnliche" Bilder auf Basis der Bewertung anderer Benutzer ausgegeben.

Photoree basiert auf Collaborative Filtering. Es macht sich neben den Bewertungen der Benutzer zusätzlich als Feature der Empfehlungselemente (Bilder) noch manuell gesetzte Tags (Keywords) zunutze. Da der Benutzer mindestens 100 Bilder bewerten muss, bevor er das System verwenden kann, werden die Probleme der Spärlichkeit (zuwenig Bewertungen für Empfehlungselemente) und des Kaltstarts (zu wenig Empfehlungen für neue Benutzer und/oder Empfehlungselemente) vermieden. Zum einen haben auch neue Benutzer ausreichend viele Empfehlungen, zum anderen werden Empfehlungselemente auf diese Weise mit zahlreichen qualifizierten Bewertungen versehen. Da die zu bewertenden Bilder wahlfrei gestellt werden, kann auf diese Weise eine möglichst ausgeglichen gefüllte Benutzer-Element-Matrix erzeugt werden.

Mittwoch, 15. April 2009

Was ist ein Empfehlungsystem?

Ein Empfehlungssystem (oft auch „Recommender System“ genannt) ist ein System, das einem Benutzer in einem gegebenen Kontext aus einer gegebenen Entitätsmenge aktiv eine Teilmenge „nützlicher“ Elementen empfiehlt.

Als "Basis" für die weiteren Beiträge soll nun auch eine formale Definition erfolgen - also: "Achtung, Theorie" ;-)

Der Kontext besteht aus dem Benutzerprofil P, der Entitätsmenge M und der Situation S.

Dabei kann das Benutzerprofil P aus expliziten (Geschlecht, Alter, Interessensgebiete et cetera) und impliziten Informationen (Besuchshäufigkeit einer Website, gelesene Texte, gekaufte Produkte et cetera) bestehen.

Die Entitätsmenge M ist die Menge, aus der Elemente empfohlen werden. Dabei kann es sich um so unterschiedliche Dinge wie Bücher, Musikstücke, Konzerte, Reisen, Nachrichten, Fachartikel, E-Mails, Fachleute et cetera handeln.

Die Entitätsmenge zählt zum Kontext, da sich auch alleine aufgrund Ihrer Änderung (neue Elemente) und ohne Änderung des Profils eine Empfehlung ergeben kann.

Die Situation S konstituiert sich aus Rahmenparametern der realen Welt (Datum, Uhrzeit, Geoinformation, verwendetes Endgerät des Benutzers, gerade angezeigter Text im Browser des Benutzers et cetera).

Die empfohlenen Elemente T (Teilmenge von M) sollten den Nutzen des Benutzers B im gegebenen Kontext K maximieren.

Formal besteht die Aufgabe eines Empfehlungssystems daher in folgender Optimierung: