Wie Roboter lernen

Am Institut für Mathematik arbeitet derzeit eine Forschungsgruppe unter der Leitung von Prof. Ulrich Oberst an neuen Entwicklungen im Bereich der Künstlichen Intelligenz. Mit Hilfe von zugrunde liegenden Theorien und Algorithmen erlernen Maschinen durch Versuch und Irrtum in Interaktion mit der Umgebung neues Verhalten.
roboter_170x130.jpg
"Reinforcement Learning" heißt der Ansatz, bei dem der lernende Agent aus mehreren möglichen Varianten eine Aktion wählt. Das Ergebnis dieser Wahl wird von einer vorgegebenen Umgebung bestimmt und der Lernende erhält dafür eine Belohnung oder auch eine Bestrafung, ausgedrückt in einem bestimmten numerischen Wert. Das Ziel der Lernalgorithmen ist es, jene Aktionen vorzuziehen, die Belohnungen auf lange Sicht maximieren. Im Zentrum der Theorien des "Reinforcement Learning" standen bisher ausschließlich Verfahren, die ein Verhalten in einer Umgebung betreffen.

Das Innsbrucker Team hat nun ein Verfahren entwickelt, das das gleichzeitige Erlernen mehrerer Verhalten in einer nicht vorher fixierten Umgebung möglich machen soll. Die neue Methode "General Policy Improving" wurde von den zwei Doktoranden Andreas Matt und Georg Regensburger entwickelt und befindet sich derzeit im Teststadium. Zu diesem Zweck kooperieren die Innsbrucker Forscher mit dem Departamento de Computacion an der Universidad de Buenos Aires, das seine Infrastruktur für die experimentelle Erprobung des in Tirol erarbeiteten Ansatzes zur Verfügung stellt.