Die Entwicklung der Computerlinguistik in den letzten Jahren war rasant. Schon heute werden automatisch generierte Texte im eCommerce, bei Geschäftsberichten, bei Nachrichtenmeldungen oder Chatbots im Marketing eingesetzt – um nur einige wenige Beispiele zu nennen. Diese Entwicklung wird sich beschleunigen. Vergleiche auch den Blogpost Sprache und Computer: Regelbasierte Textroboter vs KI-basierte Sprachassistenten

Um den Fortschritt einzuordnen: Es gibt den sogenannten General Language Understanding Evaluation (GLUE)-Benchmark für die Evaluierung von Systemen zum Verstehen natürlicher Sprache. Der menschliche Basiswert liegt bei 87, und zwischen Mai 2018 und August 2020 stieg der erzielte Wert von Systemen zur Verarbeitung natürlicher Sprache von 60 auf 90,6; damit übertreffen diese Systeme den Menschen. Diese Entwicklungsdynamik setzt sich fort: Der SuperGLUE-Benchmark ist eine neue Messung mit schwierigeren Aufgaben zum Verstehen von Sprache. Das Future Today Institute prognostiziert, dass bis Ende 2021 auch dieser neue Benchmark übertroffen wird.

Die Fortschritte sind dergestalt, dass ein KI-Modell auch wissenschaftliche Literatur zusammenfassen kann. Das Allen Institute for Artificial Intelligence (AI2) verwendet dieses KI-Modell bereits in der Suchmaschine Semantic Scholar, wo kurze Zusammenfassungen von wissenschaftlichen Arbeiten erstellt werden.

Mithilfe von NLP (Natural Language Programming) und NLG (Natural Language Generation) können wir in Zukunft Content und Kommunikation in einem Maße und in einer kontextbezogenen Präzision produzieren, die zu verblüffenden Veränderungen führen wird. Es wird zu einigen kritischen Entwicklungen führen, aber natürlich auch zu positiven. Ich habe einfach mal drei Themen herausgegriffen, um die disruptive Dynamik herauszuarbeiten.

Contentflut im Internet

Schon vor einiger Zeit hatte ich folgenden Blog geschrieben: Content ist King: Über die Datenflut im Internet. Ein Kernsatz aus diesem Blog: “Wir erleben gerade die nächste Evolutionsstufe der Menschheit, nämlich den Kampf um Aufmerksamkeit im Internet. Denn wenn Sie als Unternehmen oder Experte im digitalen Zeitalter wahrgenommen werden wollen, dann geht’s nicht ohne Content.“. Wir haben uns bereits gewöhnt an Heerscharen von Content Writern. Aber was passiert, wenn man Content zukünftig automatisch produzieren lassen kann?

Im Tech Trend Report 2021 des Future Today Institute findet sich ein Beispiel, das die Dimension von automatisierter Textproduktion verdeutlich: Journalisten von Tamedia in der Schweiz experimentierten mit KI-Algorithmen zur Textproduktion, und zwar während der Wahlen in ihrem Land 2018. Ein Entscheidungsbaum-Algorithmus, den Tamedia Tobi nannte, generierte automatisierte Artikel mit detaillierten Wahlergebnissen für jede Gemeinde, die von den 30 Zeitungen der privaten Mediengruppe abgedeckt wurde. Er produzierte auch Inhalte in mehreren Sprachen. Insgesamt veröffentlichte Tobi 39.996 (sic!) verschiedene Versionen von Wahlberichten, die im Durchschnitt jeweils 250 Wörter umfassten. (Da es sich um Experiment handelte, trugen die Artikel eine spezielle Byline, die Leser*innen darauf hinwies, dass sie von einem Algorithmus verfasst worden waren.)

Es ist zu erwarten, dass KI-Algorithmen zur automatischen Generierung in den nächsten Jahren weiter verfeinert werden und weiter Verbreitung finden. Artikel zu Wellness-Themen, Gesundheit, Beauty, Technik, Autos, Sport und derlei mehr werden dann am Fließband produziert (mit oder ohne nachträgliches Finetuning durch einen Content Writer). Zunächst profitieren davon die größeren Unternehmen, die das Investment in eine solche Technologie finanziell stemmen können – später werden SaaS Angebote für kleinere Unternehmen verfügbar.

Die Frage liegt nahe, wie die Suchmaschinen damit umgehen. Es ist aber bereits klar, dass Google hiervon nicht überrascht wird. Google wird diese Entwicklung vielmehr mitgestalten. Interessanterweise kann Künstliche Intelligenz (KI) auch dabei helfen, solch automatisch verfassten Mediencontent zu identifizierten. Dazu der Tech Trend Report 2021: Maschinen können die Fälschung erkennen. Das liegt daran, dass ein Aufsatz, der von einer KI geschrieben wurde, statistische Muster im Text aufweist und eine geringe sprachliche Variation hat. Forscher des MIT-IBM Watson AI Lab und der Harvard University entwickelten den Giant Language Model Test Room (GLTR), der nach Wörtern sucht, die wahrscheinlich in einer bestimmten bestimmten Reihenfolge auftreten.

Es ist also durchaus realistisch, dass die Suchmaschinenbetreiber zukünftig KI-generierten Text von Content unterscheiden können, der von Menschen erstellt wurde. Die Contentflut kommt vermutlich trotzdem …

Dialogautomaten

Erinnern Sie sich noch an den spektakulären Cyberangriff im Jahr 2015 auf die Seitensprung-Agentur Ashley Madison? 32 Millionen Nutzer des Dienstes waren betroffen. Eine verblüffende Entdeckung bei der Aufarbeitung: (Vorwiegend) männliche Benutzer hatten bei Ashley Madison mit vermeintlich weiblichen Nutzern per Chat geflirtet – aber tatsächlich agierten im Namen der „virtuellen Nutzerinnen“ sogenannte Chatbots: Also Softwareprogramme, die Konversation fingieren.

Spätestens in 2015 war die Technologie reif genug für einen Flirt per Chat, der für die (vorwiegend) männlichen Benutzer quasi den „Turing-Test“ bestanden hätte. Weitere sechs Jahre an Entwicklung sind vergangen; mithilfe von NLP/NLG lassen sich heute noch ganz andere Anwendungsbereiche erschließen. Bleiben wir zunächst bei der Partnersuche: Es ist denkbar, dass der Prozess der Partnersuche künftig wie folgt abläuft:

Erstens, die Person auf Partnersuche definiert das Zielprofil. Zweitens, ein Suchalgorithmus identifiziert mögliche Kandidaten. Drittens, ein Chatbot lernt zunächst den schriftlichen Sprachduktus des Nutzers (beispielsweise auf Basis verschiedener hochgeladener Email-Korrespondenzen), dann führt eben dieser Chatbot „Vorgespräche“ mit potentiellen Partnerkandidat*innen; dabei fließen auch persönliche Vorlieben wie Hobbies und derlei mehr ein. Viertens, es kommt zu einem persönlichen Treffen – jetzt übernimmt die „reale“ Person. Das ist übrigens ein Szenario, das bereits eine hohe Ähnlichkeit einer (Zukunfts-)Beschreibung von Yuval Harari aufweist, der in seinem Bestseller Homo Deus sinniert, zukünftig könnten unsere „Digitalen Zwillinge“ (oder: KI-basierten persönlichen Assistenten) die Partnerwahl untereinander aushandeln. Das kann jeder/jede einmal für sich selbst einordnen.

Schauen wir uns weitere Bereiche der sprachlichen Interaktion an: Natürlich der eCommerce (hier werden KI-basierte Chatbots ja bereits eingesetzt). Und weiter gedacht: Könnten KI-basierte Dialogautomaten auch in der Politik eingesetzt werden? Politik ist Kommunikation, Überzeugungsarbeit. Bei Berufspolitikern gehen täglich Dutzende (wenn nicht Hunderte) von Nachrichten ein; und je einflussreicher ein Politiker, desto wahrscheinlicher, dass ein Team von Mitarbeitern einen Teil dieser Kommunikationsarbeit übernimmt: Basis für diese Arbeit sind parteipolitische Programmlinien, persönliche Überzeugungen, Versatzstücke der Argumentation und Stellungnahmen zu vergleichbaren Anfragen. Das gilt für die Korrespondenz per Email, per Brief oder in Social Media. Mindestens aus technologischer Sicht ist es denkbar, dass ein KI-basierter „Digitaler Zwilling“ eines Politikers in nicht allzu ferner Zukunft diese Korrespondenz übernimmt.

Das Gleiche gilt im Übrigen auch für Influencer, die – ebenso wie Toppolitiker – einen Stab an Mitarbeitern beschäftigen, um die diversen Kommunikationskanäle in Social Media zu bespielen. Vergleiche dazu auch den Blogpost So wird man Influencer.

Das Szenario der Interaktion zwischen KI-basierten „Digitalen Zwillingen“ entbehrt nicht einer grotesken Note. Hier werden möglicherweise Dialoge in der Größenordnung von Terabyte generiert, die am Ende des Tages kein Mensch jemals liest. Und die Maschinen selbst „verstehen“ den Dialog selbst ja nicht – NLP/NLG basiert nicht auf Weltverständnis, sondern auf bloßer Statistik (bzw. statistischer Korrelation).

Abschließend ein Wort zu den persönlichen digitalen Zwillingen. Auch das wird ja bereits Realität: Eine Reihe von Startups arbeitet bereits an eben solchen persönlichen digitalen Zwillingen, die einen Nutzer (online) repräsentieren können. Im Jahr 2021 gab es bei der jährlichen Frühlingsfest-Gala des chinesischen Staatsfernsehens (CCTV) Auftritte von Digitalen Zwillingen bekannter Persönlichkeiten. Vor schätzungsweise einer Milliarde Zuschauern ahmten die KI-Kopien ihre menschlichen Gegenstücke nach; hierbei wurden keine Verhaltensweisen, Reden oder Routinen vorgegeben. Das Angebot Replika (eines Start-Ups) ist ein programmierbarer digitaler Zwilling, den Sie für Ihre Freunde einsetzen können. Das Angebot Molly beantwortet Fragen per Text. Die nahe Zukunft könnte digitale Zwillinge für Fachleute Fachkräfte in vielen Bereichen sein, darunter Gesundheit und Bildung.

Social Bots

Das World Economic Forum hat im Jahr 2019 den Social Robot als eine der Top 10 Zukunftstechnologien bezeichnet, die starke Veränderungspulse in Gesellschaften und Volkswirtschaft geben würden. Die Industrie der Social Robots steckt zwar noch in den Kinderschuhen: Zwar gibt es immer wieder vielversprechende Projekte (wie z.B. JIBO vom MIT Media Lab), aber der entscheidende Durchbruch auf dem Markt gelingt (noch) nicht. Ein solcher Erfolg ist jedoch nur eine Frage der Zeit. Eine Vielzahl an Playern arbeitet daran. Da gibt es Sophia (Hanson Robotics), Milo robot (RoboKind), Furhat oder der Roboter Moxie, der die Entwicklung von Kindern unterstützen soll. Die rasant steigende Leistungsfähigkeit von Sprachassistenten ist hierbei ein Erfolgsfaktor und ebnet den Erfolgspfad von Social Robots.

Zunächst zur Definition eines Social Robot. Ein solcher Robot unterscheidet sich auf der einen Seite von Chatbots und Avataren insofern, als dass Letztere eben physisch nicht präsent sind. Ganz anders der Social Robot, der als einäugiger Haus-Roboter (JIBO) oder als Torso mit ausdrucksstarkem Gesicht (z.B. Furhat). Social Robots grenzen sich auf der anderen Seite von Industrierobotern insofern klar ab, als dass Industrieroboter keine (oder nur sehr begrenzte) soziale Fähigkeiten mitbringen. Der Zukunftsforscher Matthias Horx hatte JIBO einmal als „emotionalen Assistenten“ bezeichnet.

Klar ist, dass ein Social Robot das Potential hat, zum zentralen User Interface zu werden. Und dieses User Interface wird zu einem Ökosystem ebenso wie Alexa zum Ökosystem für Zehntausende von Apps und Anwendungen geworden ist.

Zum Weiterlesen

Author

Der Autor ist Manager in der Softwareindustrie mit internationaler Expertise: Prokurist bei einem der großen Beratungshäuser - Verantwortung für den Aufbau eines IT Entwicklungszentrums am Offshore-Standort Bangalore - Director M&A bei einem Softwarehaus in Berlin.