JGU Mainz

Institut für Informatik

Michael  WAND
David  HARTMANN

Wintersemester 2021/22

Modellierung 1

Alles ist PCA. Ja wirklich!

Kapitel 8:

Drei Varianten: PCA, duale PCA (MDS), und die Mischung aus beidem (SVD)

Multi-Dimensional Scaling und Kernelalgorithmen

Wir schauen uns ein Problem an, das scheinbar nichts mit PCA zu tun hat: Wie kann man aus einer Sammlung von paarweisen Distanzen wieder die ursprüngliche Geometrie rekonstruieren. Es stellt sich herraus, dass dies eine “duale” Variante von PCA ist, bei der man nicht mit den Koordinaten von Punkten (Ortsvektoren) rechnet, sondern mit den Projektionen der der Ortsvektoren aufeinander.

Wenn man versteht, wie das funktioniert, kann man auch das wichtigste über die in der statistischen Datenanalyse und maschinellem Lernen populären Kernelmethoden verstehen. Und weil wir gerade dabei sind, schauen wir uns auch kurz an, wieviel Information eigentlich in paarweisen Distanzen steckt (Spoiler: weniger als man denkt), und wie man Algorithmen in der Art für Empfehlungen im Internet (“Recommender Systems”) anwenden kann (was auf den ersten Blick auch nichts mit alle dem zu tun haben scheint; es ist aber auch nur PCA).

Video: MDS & Co - Multi-Dimensional Scaling (72 min)

groß (3360x1080 mit Folien),     mittel (1920x1080),     klein(853x480),     Folien (PDF)

Optionale Ergänzung (kein Prüfungsstoff)

Die Geschichte mit der Dualität, und warum Matrizen zwei verschiedene Seiten haben, hat noch etwas mehr Hintergrund. Bei Interesse gibt es hier zusätzliche Details.

Video: MDS & Co - Multi-Dimensional Scaling (21 min)

groß (3360x1080 mit Folien),     mittel (1920x1080),     klein(853x480),     Folien (PDF)

Gesamtlaufzeit Videos: 72min (+21min optional)

Übungsaufgaben: Das achte Übungsblatt finden Sie hier.

Hinweis: Klicken Sie auf diesen Link, um auf die Panopto-Seite zu gelangen. Hier finden Sie alle Videos im mp4-Format für alle Geräte.







Datenschutz     Impressum