In Deutschland gibt es rund 3,5 Millionen Unternehmen, in der EU rund 23 Millionen und 26 Millionen in den USA. Undsoweiter. Die hierzu verfügbaren Informationen (öffentlich wie nicht-öffentlich) aus Webseiten, Wirtschaftsnachrichten oder Firmendatenbanken liegen im Petabytebereich. Sie sind dynamisch und zum überwiegenden Teil unstrukturiert. Und natürlich ist der Bedarf nach Transparenz enorm: Für Einkäufer, für Verkäufer und natürlich auch für Firmenkäufer.

Das Geschäftsmodell rund um den Aufbau von Informationsdatenbanken ist natürlich nicht neu. Aber die Methoden und Technologien entwickeln sich weiter. Heute unter der Lupe: Die B2B Company Search Engine www.delphai.com, die 2020 gegründet wurde und unter anderem auf freie Keyword-basierte Suche setzt. Und zwar in über 12 Millionen Unternehmensprofilen weltweit. Die Informationen werden gewonnen aus Webauftritten, Pressemitteilungen, News und mehr. Zu den Kunden zählen etwa: ING, Volkswagen, ABB, Siemens sowie namhafte Strategieberatungen.

In diesem Interview spreche ich mit Nikolaus Grefe (Zum LinkedIn Profil) von delphai über den methodischen Ansatz des Start-ups, die technologischen Herausforderungen und mehr. Nikolaus ist Head of Sales and Strategy, sowie Keynote-Speaker mit Fokus auf KI insbesondere Natural Language Processing. Kurz nach der Gründung ist er bei delphai eingestiegen und hat die Software mitentwickelt. Er hält einen Master in Statistik und einen Bachelor in Economics.

Sebastian: Vielen Dank für Deine Zeit. Lass‘ uns vielleicht erstmal einige grundlegende Fragen klären, damit wir von Anfang das gleiche Verständnis haben. Welche Daten fließen alles ein in Eure Informationsdatenbank, nutzt ihr zum Beispiel auch nicht-öffentliche Datenbanken?
Nikolaus: Vielen Dank auch für Deine Zeit, Sebastian. delphai integriert sowohl öffentliche Datenquellen wie Unternehmens-Websites, Pressemitteilungen, Stellenausschreibungen, Konferenzteilnahmen und Ähnliches, als auch Daten strategischer Partner, wie dem Handelsblatt oder TableMedia. Aus diesen extrahieren und generieren wir eigene maschinenlesbare Daten, beispielsweise Kunden-Lieferanten-Beziehungen, Akquisitionen oder Finanzdaten von Unternehmen. Diese Quellen- und Datenvielfalt ermöglicht delphai, einen genauen Fingerabruck eines Unternehmens zu erstellen. Unsere Suchmaschine ist damit in der Lage, innerhalb von Sekunden mehr und bessere Firmen zu finden als jede andere Software.

Sebastian: Wie unterscheidet sich nun Eure Methodik von der Herangehensweise anderer Wettbewerber in diesem Markt? Welcher USP ergibt sich daraus, welchen Mehrwert haben hierbei Eure Kunden?
Nikolaus: Im Wesentlichen unterscheidet sich unser Ansatz dadurch, dass wir vollständig auf die maschinelle Generierung von Daten setzen. delphai ist damit in der Lage viel größere Datenmengen, insbesondere umfangreiche Textdaten zu verarbeiten. Unsere Marktbegleiter bauen weiterhin auf die manuelle Erfassung von Daten. In der Praxis bedeutet dies, dass Firmen wie Dun & Bradstreet oder Moody’s Mitarbeiter- und Umsatzzahlen per Telefon und E-Mail bei den Unternehmen selbst abfragen. Jedem ist klar, dass dies kein skalierbarer Prozess ist. Um dennoch eine gewisse Datenqualität zu gewährleisten, spezialisieren sich diese Anbieter entweder auf bestimmte Datenfelder, bspw. Finanzdaten oder Eigentümerstrukturen, oder beschränken sich auf eine Region oder einen Firmentyp. So gibt es fast in jedem Land lokale, aber keine globalen Anbieter von Handelsregisterdaten. Andere fokussieren sich auf börsennotierte Firmen.

Die überwältigende Mehrheit der wirtschaftlichen Aktivität einer Volkswirtschaft findet jedoch durch private, mittelständische Unternehmen statt. In Deutschland sind nur ca. 400 Unternehmen börsennotiert. delphai muss mit seiner dynamischen Infrastruktur hingegen keine Kompromisse eingehen. Unser System ist global und deckt sämtliche Unternehmenstypen und Industrien ab. Ein weiterer USP ist die Modularität unserer Software. Wenngleich der natürliche Zugang zum delphai-Universum unsere Web-App ist, können wir unsere Daten und Modelle über intelligente Schnittstellen in sämtliche Oberflächen – vom CRM bis zum BI-Tool – integrieren und mit den Daten unserer NutzerInnen verbinden. Wir sprechen hier von Firmographic Fusion.

Sebastian: Der Gigant der Websuche ist bekanntlich Google, mit Tausenden von Entwicklern. Wie kann man mit wenigen Worten erklären, worin sich der Ansatz von Google von Eurem Geschäftsmodell unterscheidet?
Nikolaus: In Sachen Benutzerfreundlichkeit ist Google für uns in jedem Fall ein Vorbild. Der zentrale Unterschied zwischen uns ist jedoch der Fokus. Google orientiert sich am Durchschnittsnutzer des Internets. delphai richtet sich an Nutzer, die exklusiv Unternehmensinformationen suchen. Ferner sind delphais Outputs keine langen Listen von Websites, sondern bereits so formatiert, dass sie bequem weiterverarbeitet werden können und maschinenlesbar sind.

Sebastian: Wie lässt sich etwa bei der Auswertung von Inhalten einer Unternehmenswebseite differenzieren, ob es sich etwa um das Leistungsangebot des Unternehmens selbst oder aber um das Unternehmensprofil eines Referenzkunden handelt, der in einer Success Story beschrieben wird? Und etwas genereller formuliert: Was sind so typische Herausforderungen bei der KI-basierten Auswertung von Informationen?
Nikolaus: In der Tat ist es eine wichtiger Teil unseres Tech-Stacks, Inhalte in einem Text auf ihre Relevanz zu prüfen, bevor sie mit einem Unternehmensprofil verknüpft werden. Die Problemstellung beginnt aber noch früher. Zuerst müssen Unternehmen in einer Quelle identifiziert werden. Das Wort “Apple” oder der Name “Miele” reichen aufgrund ihrer Ambivalenz zur Frucht bzw. zum Namen des Unternehmenserben nicht aus, um beispielsweise einen Nachrichtenartikel mit einem Unternehmensprofil richtig zu verknüpfen. Hierfür haben wir eine Reihe von NLP-Verfahren entwickelt, die den Kontext einbeziehen, um sicherzustellen, dass es sich auch wirklich um ein Unternehmen handelt. Im nächsten Schritt wird dann ausgewertet, ob der Inhalt des Textes relevant ist. Ein typisches Beispiel für irrelevante Nachrichtenartikel sind autogenerierte Börsen-Updates. Hierin werden meist viele Unternehmen mit nur wenig Inhalten genannt. Solche Artikel können jedoch sehr verlässlich automatisiert rausgefiltert werden.

Sebastian: Angesichts der Datenflut ist es wichtig, Informationen nach Qualität oder Verlässlichkeit von Datenquellen zu priorisieren. Welchen Ansatz verfolgt ihr etwa bei dieser Frage, wie kann ein Algorithmus eine Datenquelle bewerten?
Nikolaus: In erster Linie kontrolliert delphai seine Quellen selbst. Diese weisen wir außerdem zu jedem Datenpunkt aus, sodass NutzerInnen prüfen können, ob sie den eigenen Anforderungen genügen. Wir sprechen hier von Datenprovenienz beziehungsweise Data Observability, einem zentralen Pfeiler unseres Produktversprechens. Des Weiteren entwickeln wir KI-Verfahren, die bei der Bewertung der Glaubwürdigkeit von Daten unterstützen. Da diese Fähigkeit nicht nur für unsere NutzerInnen zentral ist, werden wir durch einen Research Grant in Höhe von einer Millionen Euro vom Bundesministerium für Bildung und Forschung unterstützt, um Verfahren zur Bestimmung des Wahrheitsgehalts von Texten zu entwickeln.

Sebastian: Wie viele Data Scientists habt ihr heute, und wie viele Mitarbeiter insgesamt?
Nikolaus: Insgesamt hat delphai 20 Mitarbeiter, darunter Machine Learning Engineers, die unter anderem Lösungen für die oben genannten Probleme erarbeiten. Ferner bauen unsere Software Engineers unsere Dateninfrastruktur aus und gewährleisten deren Sicherheit und Zuverlässigkeit. Unser Team arbeitet aus Berlin Kreuzberg.

Sebastian: Kannst Du ein, zwei Sätze zu delphai’s Sprachmodellen sagen?
Nikolaus: Wenngleich delphai mittlerweile einige Sprachmodelle in seiner Toolbox hat, nimmt eines davon eine besondere Rolle ein. Wir haben ein generatives Model entwickelt, das in der Lage ist, sehr detaillierte Unternehmensbeschreibungen zu generieren. Neben ihrer hohen Qualität sind unsere Beschreibungstexte urheberrechtskonform. Im Kontext von Unternehmensdaten sind wir übrigens in der Lage, deutlich bessere Resultate zu erzielen als aktuelle Lösungen wie Open AI’s ChatGPT. Ein weiteres Bespiel eines Sprachmodels ist unser Recommender-System mit dem sich ähnliche Firmen identifizieren lassen. Dieses Verfahren berücksichtigt das individuelle Feedback unser NutzerInnen. Im Grunde ist es vergleichbar mit Vorschlagsalgorithmen von Amazon oder Netflix. Auf diese Weise lassen sich sehr gut und nahezu spielerisch Pipelines für die Buy- und Sell-Side erstellen, ohne dabei auf ungenaue und fehlerhafte Industrieklassifikationen zurückgreifen zu müssen.

Sebastian: Euer heutiges Kundenportfolio umfasst europäische Unternehmen. Plant ihr in Zukunft auch den Schritt in den US-Markt?
Nikolaus: Schon heute kommen 20 Prozent unserer Kunden aus den USA. Da wir delphai von Beginn an als globales und Use-Case-unabhängiges Tool entwickelt haben, ist es standortunabhängig anwendbar. Dies erlaubt es uns, unsere Software global zu vermarkten.

Sebastian: Wie sieht die Roadmap für die nächsten 3 oder 5 Jahre aus, wo erlauben neue Technologien ggf. gänzlich neue Features?
Nikolaus: Durch die Weiterentwicklung von NLP-Technologien sehen wir neue Möglichkeiten des Sammelns und Strukturierens von Unternehmensdaten. Transkripte von Earnings-Calls und Podcasts sind nur der Anfang. Versandinformationen von Häfen oder Satellitenbilder von Lagerbeständen könnten genauso Teil unseres zentralen Hubs werden. Des Weiteren gehen wir vom Ende des One-Size-Fits-All-Tools aus und sehen stattdessen das Aufkommen von Low-Code/No-Code-basierten Systemen, die individuell auf die Bedürfnisse jedes Unternehmens über Geschäftseinheiten und Funktionsbereiche hinweg angepasst werden können. Beispiele hierfür sind Microsoft Power BI-basierte MI/BI-Dashboards oder CRM Tools wie MS Dynamics und Salesforce, die nicht mehr nur einem Use Case dienen. delphais Anspruch ist es, die Anlaufstelle Nummer Eins für Firmographics zu werden und dass unsere Software über die M&A-Branche hinaus von hundertausenden Kunden eingesetzt wird.

Author

Der Autor ist Manager in der Softwareindustrie mit internationaler Expertise: Prokurist bei einem der großen Beratungshäuser - Verantwortung für den Aufbau eines IT Entwicklungszentrums am Offshore-Standort Bangalore - Director M&A bei einem Softwarehaus in Berlin.