Das Future Today Institute (FTI) hat seinen 15ten Tech Trend Report herausgegeben und gibt einen umfassenden Überblick über technologische Trends, die unseren Lebens- und Arbeitsalltag verändern werden. Der Bericht ist über 650 Seiten stark und gibt einen gut strukturierten Überblick über technologische Trends in einer Vielzahl von Bereichen – Digitalisierung, Künstliche Intelligenz (KI), B3D-Druck, Drohnen, Blockchain und mehr.
Der Trendreport basiert hierbei auf der Auswertung umfangreicher Daten zu Konsumentenverhalten, aber auch auf Einblicke in die Aktivitäten und Erfolge zahlreicher Forschungsinstitutionen. Aufgrund dieser quantitativen Basis des Trendberichts ergibt sich eine belastbare Kurz- bis Mittelfristperspektive. An manchen Stellen bricht das Buch aus dem engen zeitlichen Rahmen aus und blickt in optimistischen (oder auch pessimistischen) Szenarien weiter in die Zukunft. Das erinnert im Übrigen an die Entwicklung verschiedener Szenarien rund um Künstliche Intelligenz (KI), was die Gründerin des FTI (Amy Webb) in ihrem Buch The Big Nine The Big Nine durchgespielt hat.
Nachfolgend stelle ich einige ausgewählte Fakten aus dem Tech Trend Report 2022 vor. Ich kann den kostenlosen Report als Lektüre wärmstens empfehlen; der Bericht ist in kleinen Lesehäppchen strukturiert, so dass man hier immer mal wieder drin schmökern kann. Zu jedem Kapitel (insgesamt: 13) gibt es eine Übersicht zu besonders relevanten Trends und Neuerungen.
Nachfolgend eine Auslese der spannendsten Trends und Entwicklungen rund um KI (=Kapitel 1); zu jedem der weiteren 12 Kapitel gibt’s außerdem einen spannenden Entwicklungstrend als „Appetizer“.
Hier geht’s zum Download: Tech Trend Report 2022
Künstliche Intelligenz
KI ist auch in der Kreativszene schon längst angekommen. Von Musikkomposition bis Malerei. Einen interessanten Einblick in die Dynamik dieser Entwicklung gibt etwa das KI-basierte Programm GauGAN, das vom Chiphersteller Nvidia zur Bildkomposition entwickelt wurde. Nachfolgendes Video (2 min) zeigt, wie das Programm Vorgaben der Nutzer in fotorealistische Landschaftsaufnahmen umsetzt:
Durchaus noch interessanter oder anspruchsvoller im Bereich der Bildgenerierung ist das Projekt DALL-E von OpenAI. DALL-E wurde letztes Jahr entwickelt. Dabei handelt es sich um ein KI-Modell, das darauf trainiert ist, visuelle Konzepte durch Sprache zu manipulieren. Startpunkt ist eine Aufforderung bzw. Bildbeschreibung in natürlicher Sprache, hieraus werden dann eine Reihe von Bildern generiert, die eine Interpretation der sprachlichen Beschreibung widergibt.
Nachfolgend das generierte Bildmaterial zu folgendem Textprompt: „an armchair in the shape of an avocado, an armchair imitating an avocado“. Das Bildmaterial stammt von folgender Webseite: DALL·E: CreatingImages from Text.
Unbedingt erwähnenswert sind die Fortschritte bei Sprachmodellen, die im vergangenen Jahr Schlagzeilen produziert haben. Hier gab es 2021 einen (weiteren) Durchbruch. Zur Messung von Sprachverständnis gibt es den sogenannten General Language Understanding Evaluation (GLUE) benchmark: Der Ausgangswert für den Menschen liegt bei 87, und zwischen Mai 2018 und August 2020 haben sich die KI-Systeme zur Verarbeitung natürlicher Sprache von 60 auf 90,6 verbessert und damit bereits den Menschen übertroffen. Der SuperGLUE-Benchmark ist eine neue Messung mit schwierigeren Aufgaben zum Sprachverständnis. Als SuperGLUE eingeführt wurde, betrug der Abstand zwischen dem besten Modell und dem Menschen fast 20 Punkte zwischen dem leistungsstärksten KI-Modell und der menschlichen Leistung auf der Bestenliste. Letztes Jahr haben die KI-Modelle von Microsoft und Google die menschliche Leistung übertroffen – wie vom FTI übrigens vorhergesagt.
Diese Verbesserung der Leistungsfähigkeit der Sprachmodelle geht – kaum überraschend – einher mit immer größeren Sprachmodellen. GPT-3 hat zu Beginn 2021 mit 175 Milliarden Parametern einen Benchmark gesetzt. Doch dieser ist bereits überholt: Googles Switch-Transformer- und GLaM-Modelle haben die schwindelerregende Zahl von 1 Billion und 1,2 Billion Parametern; aber noch größer ist das Modell Wu Dao 2.0 von der Pekinger Akademie für KI, das Berichten zufolge 1,75 Billionen Parameter hat.
Und nicht nur bei KI-Modellen werden kontinuierlich Superlative geschaffen; dies gilt auch für die Hardware: Heutige neuronale Netze benötigten lange Zeit eine enorme Rechenleistung, brauchten viel Zeit zum Trainieren und waren auf Rechenzentren und Computer angewiesen, die Hunderte von Kilowatt Strom verbrauchten. Das alles beginnt sich zu ändern. Die Rede ist vom SoC, dem System on a Chip („System auf einem Chip“). Im Jahr 2019 stellte Cerebras einen KI-Chip mit 1,2 Billionen Transistoren, 400.000 Prozessorkernen, 18 Gigabyte SRAM und Interconnects (winzige Verbindungsknoten) vor, die 100 Billiarden Bits pro Sekunde übertragen können. Das ist eine erstaunliche Menge an Komponenten und Leistung – und dennoch hat das Unternehmen letztes Jahr angekündigt, dass sein Chip der nächsten Generation, die Wafer Scale Engine 2 (WSE 2), mit über 2,6 Billionen Transistoren, 850.000 Kerne, 40 Gigabyte On-Chip-Speicher und Speicher und 20 Petabyte Speicherbandbreite Bandbreite.
Wo so viel Leistungsfähigkeit besteht, stellt sich natürlich die Frage, in welchen Bereichen dies im Wirtschaftsleben zum Einsatz kommt. Das Future Today Institute (FTI) hat hierzu eigene Modellierungen und Recherchen angestellt. Einen Produktivitätssprung durch KI sieht das FTI vor allem in folgenden Bereichen:
Quellen: “Occupational Employment and Wage Statistics,” U.S. Bureau of Labor Statistics; “The Impact of Artificial Intelligence on Labor Productivity,” Eurasian Business Review; “Economic Impacts of Artificial Intelligence (AI),” European Parliament; “A Future That Works: Automation, Employment, and Productivity,” McKinsey Global Institute; Reuters Institute, Oxford University
KI-Forscher sehen zudem inzwischen realistische Entwicklungspfade in Richtung einer allgemeinen künstlichen Intelligenz: Die Forscher entwickeln einzelne Algorithmen, die mehrere Aufgaben lernen können. DeepMind, das Team hinter AlphaGo, das gelernt hat, wie man Go mit dem Niveau eines menschlichen Großmeisters zu spielen, treibt seine Forschung weiter voran. MuZero meisterte mehrere Spiele, ohne dass ihm die Regeln mitgeteilt wurden, ein „bedeutender Schritt vorwärts bei der Entwicklung von Allzweckalgorithmen“, so DeepMind. In einer bahnbrechenden Arbeit, „Reward Is Enough“ (Ende 2021), stellten DeepMind-Forscher die Hypothese auf, dass künstliche allgemeine Intelligenz allein durch Verstärkungslernen erreicht werden könnte.
Fähigkeiten bzw. Anwendungsbereiche von KI stoßen auch zunehmend in Bereiche vor, die den Menschen lesbarer, vorhersagbarer und manipulierbarer machen. Etwa durch die Erkennung von Emotionen: Ein neuartiges neuronales Netz kann feststellen, wie sich Menschen fühlen. Mithilfe von Radiowellen kann die KI subtile Veränderungen im Herzrhythmus erkennen, eine Musteranalyse durchführen und den emotionalen Zustand einer Person in einem bestimmten Moment vorhersagen. Ein Team der Queen Mary University of London nutzte eine Sendeantenne, um Radiowellen an Testpersonen abprallen zu lassen und trainierte ein neuronales Netz, um Angst, Ekel, Freude und Entspannung zu erkennen, während den Personen verschiedene Videos gezeigt wurden. Das System konnte die emotionalen Zustände in 71 % der Fälle richtig zuordnen.
Die Rekognition-API von Amazon wiederum erkennt die Emotionen einer Person anhand Gesichtserkennung und körperlicher Erscheinung. Replika nutzt KI zur Auswertung von Sprache und Text und spiegelt mit der Zeit den Nutzer wider. Affectiva Human Perception AI analysiert komplexe menschliche Zustände mithilfe von Sprachanalytik, Computer Vision und Deep Learning. Zum Beispiel nutzt der Automobilsektor die Technologie von Affectiva, um den emotionalen Zustand eines Fahrers zu erkennen – wie Schläfrigkeit oder Wut im Straßenverkehr – und Echtzeit-Vorschläge zur Verbesserung der Fahrweise.
Wissenschaftler warnen auch davor, dass Werbetreibende das Kaufverhalten durch „Schlaf- und Traum-Hacking“ verändern und steuern. Und: „Sensory Clickbait“ ist auf dem Vormarsch, das darauf abzielt, die Gefühle der Nutzer zu manipulieren.
Unbestritten sind einige Anwendungsfälle und Anwendungsbereiche ethisch höchst kritisch zu sehen; Regulierungen und ethische Leitplanken werden zunehmen diskutiert. Mehrere Regierungen versuchen etwa, die Deepfake-Technologie zu regulieren. In Kalifornien, Texas und Massachusetts wurden Gesetzesentwürfe zur Regulierung oder zum Verbot von Deepfakes eingebracht, und eine Reihe von Gesetzesentwürfen auf Bundesebene werden derzeit diskutiert.
In anderen Bereichen wiederum treiben Regierungen den Einsatz von KI voran, der ethisch mindestens kontrovers ist: Im Jahr 2021 erklärte das US-Militär, dass es damit begonnen hat, KI zur Steuerung seiner Luftangriffe einzusetzen, indem es Algorithmen in einer Live-Kill-Chain einsetzt. Die Kill Chain ist ein Prozess, bei dem Informationen gesammelt, Analysen durchgeführt, Risiken abgewogen und Waffen zur Zerstörung eines Ziels eingesetzt werden. Mit einem modifizierten Prozess wurde ein KI-System in das Air Force Distributed Common Ground Common Ground System der Luftwaffe zur Analyse von eingesetzt. Das neue KI-System kann nicht selbständig einen Angriff anordnen, aber es identifiziert jetzt automatisch mögliche Ziele.
Im Übrigen gilt: Das Kapitel „Künstliche Intelligenz“ (ca. 60 Seiten) im Tech Trend Report bietet keinen abschließenden Überblick zu Neuerungen auf Basis von KI; Künstliche Intelligenz durchwirkt vielmehr als Basistechnologie im Grunde alle Bereiche, in allen nachfolgenden Kapiteln finden sich ebenfalls Trends und Innovationen, die KI-getrieben sind. Das erste Kapitel liefert allerdings einen guten Überblick zum Forschungsstand und Kernanwendungen wie Sprachmodellen.
Metaverse, Home of Things, Robotik, Blockchain, Drohnen und mehr
Für die weiteren 12 Kapitel beschränke ich mich darauf, die Headline zum Kapitel zu benennen und dazu einen spannenden Entwicklungstrend als „Appetizer“:
Scoring, Recognition & Privacy: Bereits im 14ten Tech Trend Report erklärten die Autoren als Hiobsbotschaft: „Anonymity is dead. Und: Everyone alive today is being scored.“ COVID-19 hat die Erwartungen an den Schutz der Privatsphäre weiter zerstört. Die Überwachung von Arbeitnehmern durch den Arbeitgeber hat sich beschleunigt, da die Pandemie die Fernarbeit normalisiert hat.
Metaverse, AR/VR, Synthetic Media: Die Menschen erstellen mehrere digitale Versionen von sich selbst erstellen, die jeweils für bestimmte Zwecke zugeschnitten sind. Dies wird zu einer Fragmentierung führen – und zu einer immer größeren Kluft zwischen dem, was eine Person in der physischen Welt ist, und den Personen, die sie auf verschiedenen Online-Plattformen darstellt. Mit Diminished Reality (DR) können Verbraucher bald visuell und akustisch in Echtzeit ausblenden, was – und wen – sie wollen.
Work, Culture & Play: Gaming ist zum Motor einer eines ganzen kulturellen und kommerziellen Ökosystems geworden.
News & Information: Natürlichsprachliche Suchschnittstellen – ob in KI-Assistenten oder als Funktion in browserbasierten Suchmaschinen – bedrohen die Vermarktungsstrategie vieler Medienunternehmen.
Health & Medizin: Die Telemedizin wird immer umfassender und Start-ups expandieren in neue in neue Bereiche der medizinischen Versorgung. Gerade auch Durchbrüche bei Sensoren und künstlicher Intelligenz erweitern die Möglichkeiten der Ferndiagnose. Technologie ermöglicht auch, Laborarbeiten zuhause durchzuführen.
Home of Things: HoT-Plattformen bedienen zunehmend ganze Haushalte und nicht nur eine Person. Infolgedessen werden die Verbraucher eher bereit sein, elektronische Geräte anzunehmen, die nahtlos in ihrem intelligenten Haus funktionieren. Häuser werden zudem empfindungsfähig: Automatisierte Systeme erkennen und regulieren Temperatur, Geräusche, Licht und andere Funktionen in Echtzeit zur Unterstützung von Familien.
Policy, Government & Security: Digitale ID-Systeme gibt es bereits in in einigen Ländern. Kanadas SecureKey ist ein Blockchain-gestütztes Identitätssystem das zur Vermittlung vertrauenswürdiger Interaktionen zwischen Finanzinstituten, Regierungen und Telekommunikationsnetzbetreibern Netzbetreibern. Die Bürger können sich verschiedene Online-Dienste mit einem digitalen Berechtigungsnachweis verbinden. Für Banken kann die digitale ID den Betrug verringern, die Sicherheit und den Schutz von Kundendaten verbessern, die Authentifizierung rationalisieren und automatisierte Transaktionen. In Estland müssen alle Bürger, unabhängig von ihrem Wohnort, eine vom Staat ausgestellte digitale Identität.
Logistics, Robotics & Transportation: “By 2025, 52% of current workplace tasks will be automated —DHL’s “Future of Work in Logistics” report.
Decentralization & Blockchain: Visa hatte das Monopol für Zahlungen bei den Olympischen Spielen seit 36 Jahren, und 2022 war Chinas e-CNY das bevorzugte Zahlungsmittel innerhalb der olympischen Community. Grundsätzlich gilt: China drängt auf eine breitere Nutzung seiner digitalen Währung, dem e-CNY, innerhalb und außerhalb des Landes.
Telecommunications & Computing: Die ersten Schritte zum Aufbau eines Quanteninternets sind bereits im Gange. Der weltweite Wettlauf der Quantencomputer ist in vollem Gange. Mehrere Länder, darunter die USA, Frankreich, das Vereinigte Königreich und China, wollen die weltweite führend im Quantencomputing werden.
Synthetic Biology, Biotechnology & AgTech: Neue DNA-Testkits bieten personalisierte Empfehlungen für Freizeitdrogen Drogen wie Marihuana und MDMA. Und: Bald werden wir vielleicht in der Lage sein Megabytes an Daten pro Sekunde auf synthetische DNA schreiben, die noch für Tausende von Jahren lesbar sind.
Climate, Energy & Space: Mehrere neue Geo-Engineering-Initiativen werden im Jahr 2022 getestet werden: Darunter die Wolkeninjektion (Salzpartikel werden in tiefliegende Wolken injiziert reflektierender gemacht), Versenkung von Eisen in den Ozeanen und Veränderung der Sonneneinstrahlung.