Christian Honey

Wissenschafts- und Investigativjournalist, Berlin

1 Abo und 2 Abonnenten
Artikel

Der künstliche Intelligenztest

Der künstliche Intelligenztest Kann ein Roboter ein Ikea-Regal aufbauen? Auf einer Seite lesen

Für Menschen gibt es den IQ. Und für Maschinen? Forscher suchen nach Tests, um festzustellen, wie intelligent eine künstliche Intelligenz wirklich ist - und wann sie den Menschen hinter sich lassen wird.

Im Jahr 1979 betrat ein Wunderkind aus der Sowjetunion die Bühne des Schachsports: Garri Kasparow gewann mit gerade mal 16 Jahren das internationale Schachturnier in Banja Luka im ehemaligen Jugoslawien. Erst im Jahr 1997 wurde Kasparow wieder in einem wichtigen Turnier geschlagen, diesmal nicht von einem Menschen, sondern von IBMs Schachprogramm Deep Blue. Das war eine Weltsensation.

Schach galt lange als exklusiv menschliche Verstandesleistung. Noch ein Jahr vor dem Spiel soll Kasparow gesagt haben, er werde nie von einem Schachprogramm geschlagen. Nach seiner Niederlage beeilten sich die Experten, die Bedeutung des Schachs zu relativieren: "Der Sieg von Deep Blue wurde einerseits als ,Meilenstein' der KI-Forschung bezeichnet, andererseits als ,Sackgasse', da die Überlegenheit des Schachcomputers auf reiner Rechengewalt beruhe und nichts mit ,wirklicher KI' zu tun habe", fasst Martina Heßler, Sozialwissenschaftlerin an der Universität Hamburg, die damaligen Reaktionen zusammen.

Aber auch weitere vermeintliche Bastionen menschlicher Intelligenz haben Maschinen längst erobert. Sprachrätsel und subtile Anspielungen? Verstand die KI Watson von IBM bereits 2011 besser als die besten Spieler der Welt. Erkennung von Objekten? Schaffte Microsofts Software MRSA 2015 bei der "Large Scale Visual Recognition Challenge" mit einer Fehlerrate von unter fünf Prozent zuverlässiger als menschliche Versuchspersonen.

Entziffern von Handschrift oder Verstehen gesprochener Worte? Können künstliche neuronale Netze ebenfalls längst besser als natürliche. Selbst bei Menschenkenntnis und Einfühlungsvermögen findet der Mensch in der Maschine mittlerweile seinen Meister. Allein aufgrund von Facebook-Likes konnte eine Software von Forschern der University of Cambridge die Persönlichkeitsmerkmale von Menschen besser einschätzen als ihre Lebenspartner. Und Wissenschaftler der Cornell University haben ein Programm geschrieben, das besser als jeder Mensch voraussagt, wann ein Spieler in einem Rollenspiel Verrat begehen wird.

Trotz solcher Erfolge könne von wahrer Intelligenz noch immer nicht die Rede sein, meinen Kritiker wie David Gelernter. Ihr Tenor: Die künstlichen Intelligenzen seien Fachidioten, die immer nur eine Aufgabe beherrschten. Wie intelligent sind Maschinen also wirklich? Der Urvater aller maschinellen Intelligenztests stammt von Informatik-Pionier Alan Turing persönlich. Turing schlug bereits 1950 ein "Imitationsspiel" vor, bei dem Menschen erraten sollen, ob ein Chat-Partner ein Bot ist oder ein anderer Mensch. Wenn man bei diesem Spiel Mensch oder Maschine nicht mehr unterscheiden kann, darf die Maschine nach Turing als intelligent gelten.

Im Jahr 2014, zum 60. Todestag des Mathematikers, unterzog die University of Reading fünf Supercomputer dem Turing-Test: Die Maschinen absolvierten eine Serie schriftlicher Gespräche von jeweils fünf Minuten Dauer. Jene Computer, die in mehr als 30 Prozent der Fälle für einen Menschen gehalten wurden, hatten den Test laut Definition bestanden. "Eugene", eine Entwicklung aus Russland, erreichte eine Überzeugungsquote von 33 Prozent.

Beobachter wiesen allerdings darauf hin, dass Eugene einen Jungen simulierte, dessen Muttersprache nicht Englisch ist. Das dürfte die Juroren dazu verleitet haben, über grammatikalische Fehler leichter hinwegzusehen. Außerdem sei die Zeit von fünf Minuten, die jedes Jurymitglied für die Konversationen sowohl mit Eugene als auch mit einem Menschen hatte, viel zu kurz. Mag sein. Und doch müssen sich die Kritiker eine Frage gefallen lassen: Ist Intelligenz immer das, was Maschinen gerade noch nicht können? Welche Tests müssten Maschinen bestehen, damit wir ihnen so etwas wie "wahre" Intelligenz zugestehen?

Diese Fragen sind weit mehr als philosophische Spitzfindigkeiten. Zum einen "braucht KI wie jedes Forschungsfeld, klare Ziele", schreibt Gary Marcus, Psychologe an der New York University. "Der Turing-Test war ein netter Anfang. Jetzt wird es Zeit für eine neue Generation von Herausforderungen." Zum anderen könnten derartige Tests nicht nur zeigen, wie nah die Maschinen uns wirklich gekommen sind - sondern auch viel über uns selbst verraten. Denn wer die Intelligenz von Computern vermessen will, muss unweigerlich die Frage beantworten: Was meinen wir eigentlich mit Intelligenz?

Lange galt das rein analytische Denken als Messlatte. Doch spätestens mit dem Sieg einer KI beim Brettspiel Go ist sie gerissen. Der "Stanford Question Answering Dataset" (Squad) geht daher einen Schritt weiter. Er ermittelt die Fähigkeit, die Bedeutung von Texten zu verstehen. Die Datenbank besteht aus über 50000 kurzen Ausschnitten aus Wikipedia-Artikeln und über 100000 Verständnisfragen dazu. Seit Oktober 2017 führt ein neuronales Netz von Microsoft die Rangliste mit 79 Prozent korrekter Antworten an.

Dieser Text ist der Zeitschriften-Ausgabe 03/2018 von Technology Review entnommen. Das Heft kann, genauso wie die aktuelle Ausgabe, hier online bestellt werden.

Zum Original