Haupt Innovation Google Künstliche Intelligenz 'Alpha Go Zero' hat gerade auf Zurücksetzen gedrückt, wie man lernt

Google Künstliche Intelligenz 'Alpha Go Zero' hat gerade auf Zurücksetzen gedrückt, wie man lernt

Ihr Horoskop Für Morgen

Erinnern Sie sich (vage) daran, wie Sie laufen, sprechen, Fahrrad fahren oder Auto fahren gelernt haben? Es war chaotisch und voller Fehler, aber die Fähigkeiten, die Sie so gelernt haben, sind geblieben. Außerhalb lebender Systeme war es eine Herausforderung, stark genug Algorithmen zu strukturieren, um „reale Lebenserfahrungen“ aufzunehmen und klebrige, anpassungsfähige Verhaltensweisen für künstliche Intelligenz zu entwickeln.

Nun, Alpha Go Zero hat es gerade geschafft.

„Es beginnt auf einer leeren Tafel und findet es nur für sich selbst heraus, nur durch Selbstspiel und ohne menschliches Wissen oder menschliche Daten oder Merkmale oder Beispiele oder Eingriffe von Menschen. Es entdeckt, wie man das Go-Spiel nach den ersten Prinzipien spielt“, sagt DeepMind-Professor David Silver.

Die KI hat mehrere Iterationen durchlaufen, jede intelligenter und leistungsfähiger als die vorherige. Die vorherige Version verwendete eine riesige Datenbank früherer Spiele zusammen mit einer Reihe von Algorithmen, die auf den Gewinn hindeuteten. Dieser Ansatz führte zur Niederlage des amtierenden professionellen Go-Weltmeisters. Im Poker hat der AI Libratus kürzlich die besten Pokerspieler der Welt um fast 2 Millionen US-Dollar gehäutet, auch durch das Lernen durch Selbstspiel anstelle von menschlichen Spieldaten.

Hillary liebt es oder listet es auf Alter

Jetzt, in dieser neuesten Version von Alpha Go, lehrte das Programm der künstlichen Intelligenz selbst wie man Go spielt - ohne menschlichen Hintergrund.

Es hat Millionen von Spielsimulationen gegen sich selbst ausgeführt und es dauerte 40 Tage, bis es von Grund auf lernte, die Weltmeisterversion seiner selbst zu besiegen. Das ist wirklich bahnbrechend, nicht nur für Go, sondern auch dafür, wie neues Wissen entdeckt wird. Wie genau oder vollständig ist Ihre Domänenexpertise? Es gibt viel mehr zu entdecken, sagt uns dieses faszinierende Experiment beim Lernen mit Alpha Go Zero.

„Die Idee von Alpha Go besteht nicht darin, hinauszugehen und Menschen zu besiegen, sondern tatsächlich herauszufinden, was es bedeutet, Wissenschaft zu betreiben – damit ein Programm von sich selbst lernen kann, was Wissen ist“, so Silver in einem YouTube-Beitrag über die Errungenschaft.

Das Alpha Go Zero Deep Mind-Team nennt es das erste Prinzip, „tabula rasa“ (leere Tafel).

'Wenn du erreichen kannst tabula rasa Wenn Sie lernen, haben Sie einen Agenten, der aus dem Spiel Go in jede andere Domäne übertragen werden kann, und die Besonderheiten des Spiels, in dem Sie sich befinden, entwickeln einen Algorithmus, der so allgemein ist, dass er überall angewendet werden kann', sagt er he . Das ist eine provokative Idee, wenn man das Konzept erweitert. Denken Sie nur daran, was wir mit einer Reihe von starken, lernenden Algorithmen tun könnten, die systematisch schwierige Probleme angehen und schneller lernen als das kollektive Wissen unserer Zivilisation. . . in Tagen, nicht in Jahrzehnten.

wie alt ist roselyn sanchez

Im Moment ist die große Erkenntnis, dass 'Algorithmen viel wichtiger sind als Computer oder verfügbare Daten', sagte Silver. Dies allein ist ein bahnbrechender Weg, um die bekannte Welt zu erweitern. Während Alpha Go auf Hardware im Wert von etwa 25 Millionen US-Dollar läuft – es ist nicht gerade ein leichtes System – wissen Sie, dass KI-Gurus seit langem daran arbeiten, sauberere, bessere Datensätze zu erstellen. Heutzutage gelten viele große Datensätze als zu verrauscht – voller schlechter Daten –, um eine künstliche Intelligenz genau zu trainieren. Wenn die KI aus Daten lernt und die Daten schlecht sind, lernt sie nicht. Großes Problem.

Was wäre, wenn Sie keine sauberen Daten, sondern nur Erfahrung brauchen und sich die künstliche Intelligenz selbst trainieren könnte?

Das ist die aufregende Leistung von Alpha Go Zero. Obwohl es sich um eine regelbasierte Nischenwelt der Spiele handelt, hat es große Auswirkungen auf jede Branche, die nach physikalischen Regeln arbeitet – denken Sie an Chemie, Verkehr, Biologie, Pharmakologie, Reisen, Logistik und Fertigung. Wenn wir Regeln so flexibel gestalten können, dass sie auf breiter Basis funktionieren, und so richtungsweisend, dass sie immer stärkere Fähigkeiten schaffen – wie Alpha Go Zero – dann ist es möglich, künstliche Intelligenz zu erreichen, die Systeme beherrscht. Diese Systeme würden keine externen Daten benötigen, keine Probleme bei der Datenbereinigung haben und keine Verlangsamungen durch den Menschen in der Schleife benötigen. Auch deshalb setzt Googles Mutterkonzern Alphabet auf künstliche Intelligenz und investiert rasant in künstliche Intelligenz. (Amazon investiert auch in künstliche Intelligenz, wie seine neueste KI-Akquisition BodyLabs.)

Wie alt ist Sean Giambrone?

Deep Mind-Professor David Silver sagt: 'Die Tatsache, dass wir gesehen haben, wie ein Programm eine hohe Leistung erbracht hat, sollte bedeuten, dass wir jetzt damit beginnen können, einige der schwierigsten und wirkungsvollsten Probleme für die Menschheit anzugehen.'

Dieser Beitrag wurde aktualisiert, um zu verdeutlichen, dass AI Libratus kürzlich Top-Pokerspieler mit einer Strategie besiegt hat, die eher auf Selbstspiel als auf von Menschen eingegebene Daten basiert.