Maschinen-Intelligenz für alle - Google Prediction API

Dieses Thema im Forum "Netzwelt" wurde erstellt von Melcos, 25. August 2010 .

Schlagworte:
  1. 25. August 2010
    Zuletzt von einem Moderator bearbeitet: 14. April 2017
    Maschinen-Intelligenz für alle

    Schlagwörter: Apps, Maschinenlernen, Cloud Computing

    Mit Hilfe der neuen Google Prediction API sollen Webentwickler in nur 20 Minuten eine Technologie in ihre Dienste einbauen können, die bisher vor allem Schwergewichten wie Amazon vorbehalten war.

    Wenn Amazon seinen Kunden ein Buch vorschlägt oder Pandora auf einen Song aufmerksam macht, der ihrem Musikgeschmack entsprechen könnte, ist das so genannte maschinelle Lernen – ein Verfahren aus der Künstlichen Intelligenz - im Spiel. Dahinter verbergen sich Algorithmen, mit deren Hilfe eine Software in der Lage ist, Muster und Gesetzmäßigkeiten in unstrukturierten Daten zu erkennen und so beispielsweise auf einen Nutzer persönlich zugeschnittene Informationen anzubieten. Mit der neuen „Google Prediction API“ soll das Maschinenlernen nun zu einer Standardtechnologie des Internet werden, die jeder Webentwickler mühelos in seinen Dienst einbauen kann.

    Die Algorithmen, die Google künftig über seine Schnittstelle zur Verfügung stellt, könnten beispielsweise darauf trainiert werden, einlaufende Emails automatisch nach „Lob“ und „Beschwerden“ zu sortieren. Voraussetzung ist nur ein Datensatz, aus dem das Programm „lernen“ kann. Alle weiteren Daten werden dann entsprechend der aus den Lerndaten erkannten Muster analysiert.

    Derzeit seien es nur einige hundert Entwickler, die Zugriff auf den Google-Dienst haben, sagt Travis Green, Produktmanager für die Prediction API. „Einige machen aber schon erstaunliche Sachen damit.“ Von Entwicklern für mobile Apps bis hin zu Ölfirmen gebe es sehr unterschiedliche Tester, sagt Green. Vielen gehe es um die bekannten Produktempfehlungen. „Einige Nichtregierungsorganisationen haben auch interessante neue Ideen, etwa Informationen über Notsituationen aus Twitter und anderen Online-Quellen herauszuziehen.

    Maschinenlernen ist bislang nicht gerade leicht zu implentieren gewesen. Welche Algorithmen und mathematischen Verfahren sich eignen, hängt von den auszuwertenden Daten ab. Die richtigen Verfahren in ein Produkt einzubauen, erfordere Expertenwissen, betont Green.

    Der neue Google-Dienst vereinfacht die Technologie nun drastisch: Anwender übergeben an die Schnittstelle lediglich ihre Daten und bekommen Prognosen oder Empfehlungen zurück, ohne sich um die technischen Details kümmern zu müssen, die sich in der Blackbox der Prediction API befinden. Die Nutzer müssen nur drei Grundanweisungen kennen: eine für das Hochladen eines Trainingsdatensatzes, eine weitere für das Lernkriterium und eine dritte für das Übergeben neuer Daten, auf die das Maschinenlernen dann angewendet wird.

    „Entwickler können die Maschinenlern-Schnittstelle in ihrer Website oder App innerhalb von 20 Minuten einrichten“, versichert Green. „Wir wollen einen wirklich einfachen Dienst anbieten und den Entwicklern monatelange Arbeit an den Algorithmen ersparen.“

    In der Google-Blackbox befindet sich ein ganzer Satz von verschiedenen Algorithmen. Lädt ein Nutzer neue Daten und Lernkriterien hoch, werden die zunächst an alle vorhandenen Algorithmen übergeben. Die Rechenprozedur, die die besten Ergebnisse bringt, übernimmt dann die Verarbeitung aller weiteren Daten desselben Nutzers.

    „Maschinenlernen im Google-Maßstab einzusetzen, hat erhebliche Bedeutung“, meint Joel Confino. Der Software-Entwickler aus Philadelphia baut für Banken und Pharma-Unternehmen umfangreiche Webanwendungen. Als Tester hat er mit Hilfe der Prediction API einen einfachen, aber effektiven Spamfilter konstruiert. Der Dienst habe auf jeden Fall ein kommerzielles Potenzial, urteilt Confino.

    Banken oder Kreditkartenunternehmen, die mittels Maschinenlernen die Geldbewegungen ihrer Kunden besser analysieren wollten, hätten selten das Knowhow und die Rechenkapazitäten dafür. „Die Google-Schnittstelle bietet hier eine billige Lösung für ein Problem, das normalerweise enorme Summen kosten würde“, betont Confino.

    Der neue Google-Dienst könnte auch Unternehmen gelegen kommen, die sich schwer damit tun, ihre Daten Anbietern von Cloud-Computing-Diensten zu überlassen, fügt er hinzu. „Sie können den Dienst auch mit unleserlich gemachten Daten nutzen“, erläutert Confino. „Google selbst muss nicht wissen, ob die Zahlen, die hochgeladen werden, Immobilienpreise oder Aktienkurse sind.“

    Ganz ohne Einblick in die Daten seiner Nutzer ist der Internetriese aber doch nicht. „Wir schauen uns die Daten nicht im Detail an, aber sehen dieselben Messergebnisse der Prognosequalität wie unsere Nutzer, damit wir unseren Dienst verbessern können“, sagt Produktmanager Green. Die Ingenieure, die die Prediction API betreuen, können feststellen, ob bestimmte Algorithmen nur selten zum Einsatz kommen, oder neue hinzufügen, um bestimmte Datenarten besser zu verarbeiten.

    Die Prediction API habe das Zeug dazu, die Unterschiede zwischen etablierten Unternehmen und Start-ups einzuebnen, urteilt Pete Warden. Der ehemalige Apple-Mitarbeiter hat OpenHeatMap.com gegründet, ein Internet-Dienst,der Datensätze auf Karten mit geographischen Informationen verknüpft. „Große Firmen wie Amazon hatten bisher einen Wettbewerbsvorteil, wenn sie mittels Maschinenlernen Produktempfehlungen erzeugen“, sagt Warden. „Jetzt brauchen Sie zwar noch ordentliche Trainingsdaten, aber nicht mehr dieselbe Expertise.“

    Warden selbst konnte die Prediction API noch nicht testen. Er will mit ihrer Hilfe einen Dienst verbessern, der Personen anhand bestimmter Begriffe oder Sätze auf Twitter lokalisiert. „Interessant wäre auch herauszufinden, wo diese Personen sich zu bestimmten Themen negativ oder positiv äußern.“ Die Prediction API könnte darauf trainiert werden, ärgerliche oder anerkennende Twitter-Mitteilungen zu unterscheiden, sagt Warden.

    Tester Chris Bates vom Online-Musikdienst Grooveshark erwartet ebenfalls, dass der Blackbox-Ansatz von Google den Einsatz von Maschinenlernen ausweiten wird. Der Dienst müsse aber noch besser werden. „Im Moment ist er gut darin, natürlichsprachliche Texteingaben zu verarbeiten und auch wertende Äußerungen zu erkennen“, so Bates.

    Da man aber keinen Zugriff auf die Rechenprozeduren hinter der Schnittstelle habe, um sie für die eigenen Zwecke zu optimieren, seien die Einsatzmöglichkeiten begrenzt. „Die Prediction API eignet sich für Anwendungen, solange sie nicht geschäftskritisch und Fehler tolerierbar sind“, bemerkt Bates. Bei einem Spamfilter sei es nicht dramatisch, wenn die eine oder andere unerwünschte Mail durchrutscht. Ein Kreditkartenunternehmen hingegen können sich keine Fehler leisten.

    Quelle: Technology Review

    ------------------------

    Es ist faszinierend wie Google es immer wieder schafft seine Anwender dazu zu begeistern Google mit noch mehr Daten zu füllen. Als Programmierer kann man solch einem Feature fast nicht wiederstehen, wenn man etwas Social Network Analysis machen will :]

    Mit dem Vorhersagen von Dingen ist Google selber wieder einen Schritt weiter gekommen. Damit hat man einen noch besseren Einblick in seine Benutzer.

    Was kommt als nächstes Google? Eine erweiterte Version von Google StreetView, die vorhersagt wo man hingehen sollte... oder ein Google MyView, dass mir sagt was ich tuen werde

    Bild
     
  2. Video Script

    Videos zum Themenbereich

    * gefundene Videos auf YouTube, anhand der Überschrift.