Institut für Informatik
Michael WAND Wintersemester 2022/23 |
Wir schauen uns ein Problem an, das scheinbar nichts mit PCA zu tun hat: Wie kann man aus einer Sammlung von paarweisen Distanzen wieder die ursprüngliche Geometrie rekonstruieren. Es stellt sich herraus, dass dies eine “duale” Variante von PCA ist, bei der man nicht mit den Koordinaten von Punkten (Ortsvektoren) rechnet, sondern mit den Projektionen der der Ortsvektoren aufeinander.
Wenn man versteht, wie das funktioniert, kann man auch das wichtigste über die in der statistischen Datenanalyse und maschinellem Lernen populären Kernelmethoden verstehen. Und weil wir gerade dabei sind, schauen wir uns auch kurz an, wieviel Information eigentlich in paarweisen Distanzen steckt (Spoiler: weniger als man denkt), und wie man Algorithmen in der Art für Empfehlungen im Internet (“Recommender Systems”) anwenden kann (was auf den ersten Blick auch nichts mit alle dem zu tun haben scheint; es ist aber auch nur PCA).
Video: MDS & Co - Multi-Dimensional Scaling (72 min)
groß (3360x1080 mit Folien), mittel (1920x1080), klein(853x480), Folien (PDF)
Videos auf Panopto (Mirror)
Die Geschichte mit der Dualität, und warum Matrizen zwei verschiedene Seiten haben, hat noch etwas mehr Hintergrund. Bei Interesse gibt es hier zusätzliche Details.
Video: MDS & Co - Multi-Dimensional Scaling (21 min)
groß (3360x1080 mit Folien), mittel (1920x1080), klein(853x480), Folien (PDF)
Videos auf Panopto (Mirror)
Gesamtlaufzeit Videos: 72min (+21min optional)
Übungsaufgaben: Das achte Übungsblatt finden Sie hier: Modellierung-WS-22-23-Blatt-8.pdf. (Datei wird Freitags bereitgestellt.)
Hinweis: Klicken Sie auf diesen Link, um auf die Panopto-Seite zu gelangen. Hier finden Sie alle Videos im mp4-Format für alle Geräte.