Demokratisierung von Daten:Wenn generative KI auf Data Fabric trifft
22. November 2023Die EU verfolgt ehrgeizige Ziele bei der digitalen Transformation: So sollen unter anderem bis 2030 drei Viertel der europäischen Unternehmen Cloud Computing, Big Data und Künstliche Intelligenz (KI) nutzen. Ersteres hat sich zumindest in Deutschland schon weitgehend durchgesetzt. Bei Letzterem sieht dies aktuell jedoch noch anders aus. Dabei kann KI nicht nur Texte zusammenfassen, Übersetzungen anfertigen oder Bilder generieren, sondern auch den Datenzugang vereinfachen. Was dafür notwendig ist und wie Unternehmen davon profitieren.
Derzeit vergeht kaum ein Tag, an dem nicht ein weiteres Unternehmen neue KI-Fähigkeiten für seine Produkte vorstellt. Zuletzt gehörten dazu auch die beiden Vorreiter im Bereich generative KI, Microsoft und Google. Diese Fortschritte werden die Art und Weise verändern, wie wir mit Technologien interagieren und uns gerade im Arbeitsalltag viele langweilige oder monotone Aufgaben abnehmen. Bekannte Use Cases sind derzeit etwa Zusammenfassungen von Texten oder Meetings, das Schreiben von Texten aller Art – inklusive E-Mails – oder die Erstellung von Bildern beispielsweise für Präsentationen.
Ohne Frage, solche Funktionen sind sicherlich praktisch und nützlich. Es gibt aber einen weiteren Anwendungsfall, der bislang noch weitgehend unbeachtet bleibt, aber das Potenzial hat, den Umgang mit Unternehmensdaten zu revolutionieren.
Datenanfragen mit KI in SQL-Querys umwandeln
Dieser gestaltet sich in der Praxis – trotz aller Beschwörungen, dass „Daten das neue Öl“ sind – nämlich oft noch sehr mühselig. Das hat mehrere Gründe:
- Die Datenmengen: Bis 2027 soll das Volumen der digitalen Datenmengen weltweit auf über 284 Zettabyte steigen – fast eine Verdreifachung seit 2022. Neue Technologien wie generative KI treiben diese Entwicklung weiter voran. Auch Unternehmen bekommen dies zu spüren und fühlen sich zunehmend von ihren Datenmengen überfordert.
- Die fragmentierten IT-Landschaften: Hinzu kommt, dass diese riesigen Datenmengen über die gesamte IT-Landschaft hinweg verteilt liegen, in internen Repositories wie Datenbanken und Data Lakes sowie in der Cloud, zum Beispiel in SaaS-Anwendungen wie Salesforce oder Workday. Das heißt, die Suche nach ihnen kostet oft viel Zeit.
- Der Fachkräftemangel: Darüber hinaus brauchen Unternehmen Experten, die diese Daten suchen und in den Systemen anfragen. Doch solche Data Scientists oder Data Engineers sind auf dem Arbeitsmarkt rar und die im Unternehmen vorhandenen werden entsprechend mit Anfragen ihrer Kollegen nach Daten überhäuft.
Somit stellt sich die Frage: Wie kann generative KI den Unternehmen dabei helfen, diesen Herausforderungen zu begegnen?
Fortschrittliche KI-Systeme wie ChatGPT-basierte Engine-Bots sind in der Lage, natürliche Sprache in Query-Anfragen in Structured Query Language (SQL) umzuwandeln. Das bedeutet, dass jeder Mitarbeiter selbstständig nach benötigten Daten suchen kann – ohne tiefes technisches Wissen oder die Einbindung der Datenexperten.
Die Voraussetzung: Zugriff auf alle Unternehmensdaten
Damit dies möglich wird, müssen Unternehmen allerdings auch die technischen Voraussetzungen schaffen, damit nach der Umwandlung der Anfrage in eine SQL-Query die Daten überhaupt gesucht und gefunden werden können. An dieser Stelle kommt Data Fabric ins Spiel: Eine solche Plattform ermöglicht dank Schnittstellen den Zugriff auf praktisch alle Datenquellen, unabhängig davon, wo die Daten sich befinden. Zudem lassen sich mithilfe einer Data-Fabric-Plattform Richtlinien und Vorgaben für die Data Governance und Datensicherheit festlegen und implementieren, damit Mitarbeiter zum Beispiel keinen Zugang zu Daten erhalten, die nicht für ihre Augen gedacht sind.
Die Verknüpfung mit einer Data Fabric kann KI-Systemen außerdem beim „Lernen“ helfen: Durch die ständigen Nutzeranfragen und die Analyse dieser sind sie in der Lage, nicht nur zukünftige Abfrageausführungen zu optimieren, sondern auch selbstständig weitere potenziell relevante Daten vorzuschlagen.
Unternehmen können durch die Verbindung von einer Data-Fabric-Plattform, die Zugang zu allen Unternehmensdaten bietet, und einem fortschrittlichen KI-System, das aus natürlicher Sprache SQL-Anfragen generiert, den Datenzugang demokratisieren. Dadurch werden zum einen Engpässe, die heute bei den Data Scientists und Data Engineers entstehen, aufgelöst. Zum anderen können wichtige Geschäftsentscheidungen künftig schneller und auf einer fundierten Datengrundlage getroffen werden.
Otto Neuer ist Regional Vice President und General Manager bei Denodo.