Uni-Tübingen

Newsletter Uni Tübingen aktuell Nr. 4/2015: Schwerpunkt

Wie Maschinen lernen: Ulrike von Luxburg analysiert Algorithmen zur Verarbeitung komplexer Daten

Grundlagenforschung für Bereiche wie Bildverarbeitung und -erkennung sowie der Sprach- und Objekterkennung

Zum 15. September 2015 ist Ulrike von Luxburg auf den Lehrstuhl für Theoretische Informatik am Wilhelm Schickard Institut der Universität Tübingen berufen worden. Die Besetzung ist Teil des erfolgreichen Zukunftskonzepts „Research – Relevance – Responsibility“ der Universität Tübingen. Professorin von Luxburg wird in Tübingen Algorithmen des maschinellen Lernens zur Analyse großer elektronischer Daten untersuchen.

In vielen Bereichen unseres Lebens werden heute große, komplexe Datenmengen verarbeitet, ausgewertet oder klassifiziert. Hinter vielen dieser Anwendungen stehen mathematische Algorithmen, die einen Computer in die Lage versetzen, neue Zusammenhänge aus den Daten zu lernen. Man „trainiert“ den Rechner, indem man ihm außer einem Datenbestand und einem Algorithmus zusätzliche Informationen zur Verfügung stellt. Diese auch „Maschinelles Lernen“ genannte Methode setzt den Rechner in die Lage, in der Folge neue Datenbestände nach dem antrainierten Muster zu klassifizieren. Im Bereich der Objekterkennung kann man mit diesen Verfahren beispielsweise einen Rechner so trainieren, dass er erkennt, ob eine Ampel gerade rot ist oder nicht. In der Medizin ist es so möglich, dass Computer bei der Diagnose von Krankheiten wie Krebs unterstützen: Der Rechner erhält dafür eine Reihe von Röntgenbildern sowie Informationen, welche Bilder von gesunden oder erkrankten Personen stammen. Daraufhin lernt der Computer, anhand von Röntgenbildern selbst eine Diagnose zu stellen. Diese vom Rechner erstellte Diagnose wird umso genauer, desto besser der Rechner trainiert wurde und desto größer der ausgewertete Datenbestand im Training war.

Ulrike von Luxburg arbeitet an dieser Schnittstelle zwischen Mathematik, Statistik und Informatik. „Ich untersuche Algorithmen zur Verarbeitung großer Datenmengen mit mathematischen Methoden auf ihre Korrektheit.“ Auf das genannte Beispiel mit den Röntgenbildern bezogen: Kann man beweisen, dass ein Lernalgorithmus, der Röntgenbilder klassifiziert und genug Trainingsbilder gesehen hat, mit hoher Wahrscheinlichkeit die richtige Diagnose trifft? Die von Professorin von Luxburg untersuchten Algorithmen sind generisch, d.h. man kann sie auf ganz viele verschiedene Arten von Daten anwenden, etwa in der Bioinformatik, der Medizin, der Bilderverarbeitung oder der Objekterkennung. „Mich interessieren generische Verfahren, die viele Anwender benutzen. Dazu gehe ich auf Konferenzen und schaue mir die neuesten Verfahren an.“ Diese Verfahren sind grundsätzlich bereits publiziert und somit für die Grundlagenforschung der Tübinger Informatikerin frei zugänglich.

„In meiner Forschung suche ich nicht nach numerischen Lösungen in bestimmten Anwendungen, sondern nach Beweisketten. Dazu stelle ich zunächst logische Überlegungen zu einem Algorithmus an und rechne viel auf Papier. Oft simuliere ich das Verhalten des Algorithmus auch in verschiedenen Testszenarien. Mein Ziel: statistische Aussagen zu beweisen, die garantieren können, wann und unter welchen Bedingungen ein Algorithmus mit hoher Wahrscheinlichkeit ein richtiges Ergebnis liefert.“, sagt Ulrike von Luxburg. „Letztendlich möchte ich für die Gültigkeit des von mir untersuchten Algorithmus zu einer Wenn-Dann-Ableitung kommen: unter welchen Voraussetzungen funktioniert eine Methode, unter welchen Bedingungen funktioniert sie nicht, und welche Garantien kann man beweisen. Wenn sich zum Beispiel herausstellt, dass eine Methode schon in einem einfachen Setting einen prinzipiellen Haken hat, wird sie auch für komplexere Fragestellungen nicht funktionieren.– Für mich als Theoretikerin sind gerade die Fälle, in denen eine bestimmte Methode nicht oder nur eingeschränkt funktioniert, die interessanteren. Denn diese Fälle sind für die Praktiker am relevantesten. “

Ulrike von Luxburg hat ihr Mathematikstudium 2001 mit dem Diplom in Tübingen abgeschlossen, mit Informatik als Nebenfach. Anschließend promovierte sie bei Professor Dr. Bernhard Schölkopf am Max-Planck-Institut für biologische Kybernetik in Tübingen. Nach Stationen in Canberra, Darmstadt und wieder in Tübingen, erhielt sie 2012 eine Heisenbergprofessur an der Universität Hamburg für Maschinelles Lernen.

Ein Anwendungsbereich der Informatikerin von Luxburg liegt im Gebiet Human Computation und Crowd Sourcing. Hier unterstützen Menschen Verfahren des maschinellen Lernens, indem sie Daten generieren. Beispielsweise ordnen Menschen Bilder nach deren Ähnlichkeit, und die so erhobenen Daten sollen dann Methoden der Bildverarbeitung unterstützen. Von Luxburg untersucht nun, ob solche ‚geordneten Reihenfolgen‘ überhaupt genug Information über die Ähnlichkeit von Bildern enthalten können. Um Algorithmen des Maschinenlernen zu unterstützen, benötigt man nicht nur ordinale Werte, also Größenvergleiche oder Ordnungen, sondern einen kardinalen Wert – eine konkrete Zahl, mit der das Verfahren rechnen kann. Die spannende Frage ist nun: Kann man für eine gegebene Menge von Bildern aus ganz vielen ordinalen Vergleichen die kardinalen Ähnlichkeitswerte der Bilder untereinander bestimmen? „Es gibt schon seit einigen Jahren Algorithmen, die so etwas versuchen, aber es gab bislang noch keine gesicherten Nachweise, dass diese wirklich funktionieren“, sagt Ulrike von Luxburg. „Dieser Nachweis ist meinem Team und mir im letzten Jahr tatsächlich gelungen.“

Maximilian von Platen