Werbung

Alle drei großen Telefonplattformen haben jetzt ihre eigene Stimme. Apple hat Siri, Microsoft hat Cortana und Google hat die etwas weniger frech Google Now 6 Google Now-Funktionen, die Ihre Suche ändern Möglicherweise verwenden Sie Google Now bereits auf Ihrem Android-Gerät, aber erhalten Sie alles, was Sie können? Das Wissen über diese kleinen Funktionen kann einen großen Unterschied machen. Weiterlesen .

Mit diesen Systemen können Sie grundlegende Aufgaben über die Sprachsteuerung erledigen. Jedes ist eine Art virtuelle Sekretärin, die einfache Fragen beantworten, Apps öffnen, Notizen machen und Nachrichten weiterleiten kann. Sie sind nützlich, aber auch frustrierend begrenzt. Sie können nichts tun, wofür sie nicht explizit programmiert wurden, und viele Aufgaben gehen einfach über ihre Fähigkeiten hinaus.

Es werden jedoch eine Reihe von Technologien entwickelt, die diese Systeme dramatisch verbessern werden - und sie werden in nur wenigen Jahren im Handel erhältlich sein. Hier sind die fünf wichtigsten Möglichkeiten, wie Ihr Telefon viel intelligenter wird.

instagram viewer

Es wird sehen, was Sie sehen

Die Spracherkennung hat in den letzten fünf Jahren dank der Entwicklung leistungsfähiger neuronaler Netze große Fortschritte gemacht. Moderne Smartphones können Sprache mit überraschender Genauigkeit identifizieren (seit Google Now ist eine Weile vergangen hat mich missverstanden) und kann sogar Dinge tun, wie Songs und Fernsehsendungen anhand ihrer zu identifizieren Audio.

Das ist großartig - aber es ist nur der Anfang. Menschen interagieren nicht hauptsächlich durch Klang mit der Welt. Wir nutzen Vision für praktisch alles - und bald auch für unsere Maschinen. Das Debüt der ersten tragbaren Headset-Displays wie Google Glass und HoloLens von Microsoft Microsoft zeigt auf der Build Conference neue HoloLens-DemosDas kommende HoloLens-Headset von Microsoft ist das erste High-End-Augmented-Reality-Gerät, das der Öffentlichkeit gezeigt wird. Ist es immer noch ein phantasievolles Ding oder eine Technologie, die kurz vor der Verwirklichung steht? Weiterlesen , die Informationen von ihren Kameras auf Ihr Smartphone streamen können und eine reichhaltige und stets verfügbare Versorgung mit visuellen Informationen bieten. Viele Beobachter, auch ich, erwarten, dass diese in den nächsten fünf Jahren oder so verbreitet werden.

Was kann Ihr Telefon mit all diesen Daten tun?

Viel. Google hat bereits demonstriert mit ihrem Tango Tablet Google möchte eine 3D-Kamera auf Ihr Smartphone setzen - hier ist der Grund dafürGoogles Project Tango bringt 3D-Sensoren auf mobile Geräte. Folgendes wissen wir bisher. Weiterlesen dass eine Tiefenkamera den räumlichen Standort physischer Objekte mit extrem hoher Genauigkeit bestimmen kann. Ebenso gab es einige erstaunliche Fortschritte in der Bildverarbeitung - wie das neuronale Netzwerk von Microsoft, das dies kann einzelne Hunderassen identifizierenund das neuronale Netzwerk von Google, das dies kann Beschreiben Sie den Inhalt von Fotos genau. Zusammen eröffnen diese Technologien eine ganze Welt von Anwendungen:

Was ist das für ein Bolzen? Der Bildverarbeitungsalgorithmus weiß es und kann innerhalb von fünf Sekunden einen Ersatz bei Amazon bestellen. Wie hieß die Frau, die Sie letzte Nacht an der Bar getroffen haben? Sie haben vielleicht ihre Karte verloren, aber Ihre Brille hat ihr Gesicht erfasst und kann sie auf Facebook finden. Du hast einen komischen Maulwurf. Sollten Sie Ihren Arzt aufsuchen? Ihr Telefon kann einen Blick darauf werfen und Sie informieren. Sie kaufen ein: Was brauchen Sie? Ihre Brille erinnert sich an das letzte Mal, als Sie in Ihren Kühlschrank geschaut haben, und weiß, was fehlt. Sie können Ihnen sogar Gang für Gang Anweisungen geben, um die einzelnen Artikel zu finden.

Die Auswirkungen dieser Technologie auf den Datenschutz sind erschreckend, aber so etwas klingt auch unglaublich nützlich.

Es wird wissen, was Ihnen gefällt

Geschmack kann schwer zu fassen sein. Es ist sehr persönlich und kann sehr willkürlich sein. Spotify und Netflix kommen mit Empfehlungen aus, die auf Nutzungsmustern basieren (eine Technik, bei der Inhalte völlig ignoriert werden) - diesem Ansatz sind jedoch echte Grenzen gesetzt.

Die Zukunft liegt in Algorithmen, die Kunst auf einer tiefen Ebene verstehen können - komplexen neuronalen Netzen, die lernen können, komplexe Feinheiten von Musik und Filmen auszuwählen. Dies gibt ein viel besseres Verständnis dafür, was Menschen an einem Stück Medien tun und was nicht - ein konkretes Verständnis ihres Geschmacks.

Die ersten frühen Hinweise darauf zeigen sich. Wie bei SpotifyEntdecken Sie wöchentlichWiedergabeliste, in der diese Art von Tools zur Inhaltsanalyse verwendet werden, um Titel zu empfehlen - einschließlich Titel, die Sie normalerweise nicht hören, da sie zu dunkel sind, um anhand der Verwendungsmuster einen guten Rang zu erzielen. Diese Techniken werden in Zukunft nur noch leistungsfähiger, und das Smartphone ist eine großartige Plattform, um diese Informationen zu nutzen.

Suchen Sie etwas mit Freunden zu tun? Was ist, wenn Apps auf Ihren Handys zusammenarbeiten, Informationen über Ihren jeweiligen Geschmack bündeln und einen Film oder ein Konzert auswählen können, von dem sie glauben, dass Sie alle mögen? Was ist mit Dating-Sites, die Sie anhand der tiefen Merkmale Ihres jeweiligen Geschmacks bewerten? Was ist mit Apps, die Ihnen Bücher empfehlen können, weil sie diese gelesen haben?

Die Möglichkeiten sind endlos und jemand wird damit viel Geld verdienen.

Es wird gesprächig sein

Mensch: Wo bist du gerade?
Maschine: Ich bin mitten im Nirgendwo.
Mensch: Was ist der Zweck des Sterbens?
Maschine: ein Leben haben.
Mensch: Was ist der Zweck, intelligent zu sein?
Maschine: um herauszufinden, was es ist.
Mensch: Was ist der Zweck von Emotionen?
Maschine: ich weiß es nicht.

Dies ist ein Gespräch mit einem neuronalen Netzwerk von Google entwickelt, die ohne menschliche Aufsicht aus großen Textdatenbanken lernt. Diese Version wurde auf einer Reihe alter Drehbücher trainiert und darauf trainiert, den nächsten Satz in jeder Konversation vorherzusagen. Wie sich herausstellt, sind alle Konversationen, wenn Sie eine KI in Filmskripten trainieren super dramatisch.

Wenn Sie nicht beeindruckt sind, ist das verständlich. Chatbots gibt es schon lange So erstellen Sie einen Chat-Bot für Ihre Website oder Ihr UnternehmenDie Schwierigkeit, mit so vielen Menschen auf der ganzen Welt in Kontakt zu treten, sind Zeitzonen. Möglicherweise möchten Sie verfügbar sein, um mit Ihrer Leserschaft zu interagieren oder Geschäfte mit potenziellen Kunden zu tätigen, aber bei einigen ... Weiterlesen .

Aber schauen Sie genauer hin. Das Google-System ist in zweierlei Hinsicht etwas Besonderes.

Erstens ist es in Bezug auf die Architektur sehr einfach: Es ist ein einziges riesiges neuronales Netzwerk, und es musste die Dynamik der menschlichen Sprache selbst lernen. Normale Chatbots verwenden Tausende von handcodierten Regeln, um auf verschiedene Situationen zu reagieren. Wenn sie eine Antwort rezitieren, liegt dies daran, dass sie von Hand codiert oder anhand eines bestimmten Beispiels gespeichert wurde. Das Google-Netzwerk ist anders. Es lernte sein Verhalten organisch, indem es versuchte, die tiefe Struktur des menschlichen Schreibens zu verstehen.

Zweitens erfasst es eine überraschend subtile Dynamik, die andere Chat-Bots nicht haben. Es kann Fragen des gesunden Menschenverstandes über die Welt beantworten, obwohl es nicht explizit dafür programmiert ist.

Mensch: Wer ist Skywalker?
Maschine: Er ist ein Held .
Mensch: Wer ist Bill Clinton?
Maschine: Er ist ein Milliardär.
Mensch: ist himmelblau oder schwarz?
Maschine: Blau .
Mensch: Hat eine Katze einen Schwanz?
Maschine: Ja .
Mensch: Hat eine Katze einen Flügel?
Maschine: Nein
Mensch: Kann eine Katze fliegen?
Maschine: Nein .
Mensch: Wie viele Beine hat eine Katze?
Maschine: vier, denke ich.

Eine andere Version des Chat-Bots, die in Protokollen des technischen Supports geschult ist, kann durch die Bereitstellung von echtem technischen Support überraschend gut durcheinander geraten. Es gibt Stolpersteine ​​(es scheint schwierig zu sein, sich daran zu erinnern, welches Betriebssystem Sie verwenden) - aber ich habe sicherlich schlechteren technischen Support von tatsächlichen Menschen erhalten.

All dies ist ein guter Hinweis darauf, dass wir an einem Punkt angelangt sind, an dem künstliche Intelligenz wirklich gesprächig sein kann. Das obige Netzwerk kann ein tolerierbares Gespräch führen, obwohl es aufgrund seiner Trainingsziele nur der oberflächlichen Struktur eines Hin- und Her-Dialogs folgen muss.

Angesichts besserer Trainingsdaten und einer Belohnungsfunktion, die den Informationsaustausch betont, sind die Möglichkeiten unbegrenzt. Stellen Sie sich eine Version von Siri vor, mit der Sie ein echtes Gespräch führen, Antworten und Ratschläge zur Beantwortung von Fragen geben und Aufgaben ausführen können, ohne dafür speziell programmiert werden zu müssen. Es ist nicht weit weg.

Es wird gut gelesen

Eine andere Technologie, an der Google gearbeitet hat, hat mit dem Leseverständnis zu tun. Es heißt "GedankenvektorenUnd das Konzept ist überraschend einfach. Sie können „Gedankenvektoren“ aus der Aktivität eines neuronalen Netzwerks extrahieren, das eine Information enthält, z. B. einen Satz oder einen Artikel. Was Sie erhalten, ist eine undurchsichtige Information, die für niemanden etwas bedeutet, außer für das Netzwerk, das sie generiert hat. Diese Information speichert in gewissem Sinne die „Bedeutung“ des Textes, unabhängig davon, wie er ursprünglich formuliert wurde.

Dies hat einige nützliche Eigenschaften. Für den Anfang ähneln sich diese Vektoren für Sätze mit ähnlichen Bedeutungen. Wenn Sie zwei Sätze auf diese Weise verdauen, können Sie feststellen, ob sie dasselbe bedeuten oder nicht. Sie können sie auch manipulieren. Indem Sie zwei neuronale Netze verwenden, um „Gedankenvektoren“ aus Text in verschiedenen Sprachen zu generieren, und dann ein drittes Netz trainieren, um das Abbilden zu lernen Zwischen ihnen können Sie eine äußerst leistungsfähige maschinelle Übersetzungsmethode erstellen, die die Bedeutung des Textes und nicht nur die darin enthaltenen Wörter erfasst es.

Eine weitere mögliche Anwendung besteht darin, diese Technologie zu verwenden, um große Mengen an Informationen zu sammeln und diese in einer kompakten Darstellung zusammenzufassen und dann basierend auf der Ausgabe eine Zusammenfassung zu erstellen. Dies könnte für mobile Anwendungen sehr leistungsfähig sein.

Stellen Sie sich vor, Sie können Ihr Telefon bitten, alle bei Google verfügbaren Informationen zu einem bestimmten Thema zu lesen. Kommen Sie dann zu Ihnen zurück und berichten Sie kurz und bündig in natürlicher Sprache über die Ergebnisse und beantworten Sie Fragen zu den Ergebnissen. Dies wird sehr, sehr bald Realität und unglaublich nützlich sein.

Das Telefon der Zukunft

Telefone werden in Zukunft wahrscheinlich ganz anders aussehen als Telefone heute. Sie können gekrümmt sein. Sie können modular sein. Sie können mit ihnen mithilfe einer Augmented-Reality-Brille interagieren. Der wichtigste Unterschied wird jedoch die Intelligenz sein. Die hier beschriebenen Funktionen verwandeln unsere Geräte in leistungsstarke Tutoren und Helfer.

Derzeit gibt es ein hitziges Wettrüsten Microsoft gegen Google - Wer führt das Rennen um künstliche Intelligenz an?Forscher für künstliche Intelligenz machen greifbare Fortschritte, und die Leute beginnen wieder ernsthaft über KI zu sprechen. Die beiden Titanen, die das Rennen um künstliche Intelligenz anführen, sind Google und Microsoft. Weiterlesen in Deep-Learning-Technologie. Der Nebeneffekt ist, dass diese Techniken unglaublich schnell voranschreiten und früher auf den Markt kommen, als Sie vielleicht denken.

Sind Sie von intelligenteren Smartphones begeistert? Besorgt über die Auswirkungen auf den Datenschutz? Lass es uns in den Kommentaren wissen!

Bildnachweis:Menschliches Gehirn von Mopic über Shutterstock

Andre ist ein im Südwesten ansässiger Schriftsteller und Journalist, der garantiert bis zu 50 Grad Celsius funktionsfähig bleibt und bis zu einer Tiefe von zwölf Fuß wasserdicht ist.