Wie stark beeinflusst Deepseek die Zukunft der KI? Wirkung des transformativen Ansatzes

11. Februar 2025

Deepseek gestaltet mit spezialisierten Modellen und intelligentem Datenmanagement die KI neu – Unternehmen können leistungsstarke, kosteneffiziente KI-Systeme aufbauen ohne massive Investitionen in die Infrastruktur.

Vor wenigen Wochen hat das chinesische KI-Unternehmen Deepseek die Schlagzeilen auch in Deutschland dominiert. Kurz nachdem aus den USA ein 500 Mrd. Dollar-Programm für KI-Infrastruktur angekündigt wurde, konterte das Startup aus China mit einer – auf den ersten Blick bahnbrechenden – Lösung, die nur rund 6,5 Millionen Dollar gekostet haben soll.

Damit hat Deepseek einen transformativen Ansatz für die KI-Entwicklung eingeführt. Deepseek ist nicht einfach nur ein weiteres KI-Unternehmen, sondern ein Paradigmenwechsel. Das Team dahinter besteht aus Ingenieuren, die nicht an traditionelle KI-Methoden gebunden sind. Sie sind im Herzen Mathematiker, in der Ausführung Pragmatiker und kümmern sich nicht darum, wie KI in der Vergangenheit gemacht wurde. Sie sahen einen neuen Weg nach vorne, der die Denkweise über KI-Modelle, Datenmanagement und letztlich die Infrastruktur, die all dies antreibt, neu definiert.

Die wahre Wirkung von Deepseek liegt nicht nur in den Modellen, die das Unternehmen entwickelt hat, sondern auch in der Roadmap, die es für die Zukunft der KI-Infrastruktur vorgestellt hat. Dies wird sich auf Unternehmen und das Datenmanagement auswirken. Es ist davon auszugehen, dass es viele Experten bereits dazu gebracht hat, ihre Herangehensweise an KI selbst zu überdenken.

Der Aufstieg kleinerer, intelligenterer Modelle

Die KI-Branche war lange Zeit auf die Idee grundlegender Modelle fixiert – riesige, allwissende Netzwerke, die auf alles und jenes trainiert sind. Deepseek hat jedoch bewiesen, dass kleinere, stärker spezialisierte Modelle nicht nur realisierbar, sondern in vielerlei Hinsicht überlegen sind.

Der Ansatz sieht ein Expertenmodell vor, bei dem kleinere, hochspezialisierte Modelle im Tandem zusammenarbeiten. Dies ist zwar eine starke Vereinfachung des Ansatzes, aber Deepseek verwendet eine sehr intelligente Technik, um das richtige Expertenmodell auszuwählen, und achtet dabei darauf, ein effizientes System zu schaffen.

Das ändert alles. Anstatt dass ein einziges riesiges Modell versucht, alles zu tun, können Unternehmen ein System miteinander verbundener Modelle einsetzen, die jeweils auf einen bestimmten Bereich spezialisiert sind. Die Auswirkungen sind tiefgreifend:

  • Geringere Kosten: Kleinere Modelle erfordern deutlich weniger Rechenleistung, aber der wahre Vorteil liegt nicht nur in den geringeren Kosten. Der Ansatz hat nun bewiesen, dass eine leistungsfähigere KI möglich ist, während gleichzeitig die Kosten für Training und Inferenz gesenkt werden.
  • Einfachere Validierung: Fokussiertes Fachwissen bedeutet, dass es einfacher ist, die Leistung in realen Anwendungen zu testen und zu verifizieren. Dies bedeutet, dass es dadurch einfacher wird, stärker spezialisierte Modellfähigkeiten hinzuzufügen, ohne so viel Aufwand wie beim Aufbau eines Basismodells.
  • Schlussfolgerungsmodelle: Kleine Modelle werden viel einfacher Schlussfolgerungsfähigkeiten erlangen. Entscheidend ist: Das Hinzufügen von Schlussfolgerungen ist ein wichtiger Schritt in Richtung KI-Kontrolle und Transparenz.

Für Unternehmen bedeutet dies, dass die KI-Einführung über Chatbots hinausgehen wird. Es war nie vorgesehen, dass ein reguläres Unternehmen ein grundlegendes Modell erstellen würde, denn es ist schlicht zu kostspielig. Dies bietet die Blaupause für die einfache und kostengünstige Realisierung hochleistungsfähiger Modelle mit eigenen Daten.

Die Hürde für die Erstellung hocheffizienter und domänenspezifischer Modelle hat sich deutlich gesenkt. Als Nächstes werden die entsprechenden Tools sowie Basismodelle folgen, die eine effiziente Datenverdichtung ermöglichen, um leistungsfähige kleinere Modelle zu erstellen.

Datenmanagement: der Schlüssel zur Erschließung des vollen KI-Potenzials

Jahrelang war die KI-Branche davon besessen, so viele Daten wie möglich zu sammeln und zu horten. Der Fokus lag darauf, die Anzahl der Token zu maximieren, alles zu trainieren und zu hoffen, dass der Brute-Force-Ansatz zu besseren Ergebnissen führen würden. In der Welt der Mixture-of-Experts-Modelle steht jedoch das Datenmanagement im Mittelpunkt.

Die Herausforderung verlagert sich von der Anhäufung von Daten auf deren Auswahl, Organisation und Verfeinerung. Die Prioritäten lauten nun:

  • Kuratieren hochwertiger Daten: KI ist nur so gut wie die Daten, auf denen sie trainiert wird. Das Herausfiltern von Rauschen und die Konzentration auf Relevanz ist jetzt ein strategischer Vorteil.
  • Optimierung von Datenpipelines: Kontinuierliche Datenanreicherung, Versionierung und Rückverfolgbarkeit werden entscheidend.
  • Infrastruktur, die KI unterstützt: Unternehmen benötigen eine Infrastruktur, die in der Lage ist, Daten dynamisch zu indizieren, zu filtern und in großem Umfang abzurufen.

Deepseek hat diesen Ansatz bereits mit seiner „sorgfältig konzipierten Datenselektionspipeline“ demonstriert. Anstatt wahllos alle verfügbaren Daten zu trainieren, hat es seine Datensätze gefiltert und verfeinert, wodurch die Effizienz verbessert und gleichzeitig die Kosten gesenkt wurden. Die KI-gesteuerte intelligente Datenauswahl entwickelt sich zum Eckpfeiler des zukünftigen KI-Trainings und gewährleistet Effizienz und Präzision bei der Modellentwicklung.

Die Infrastruktur von morgen

Da sich KI in Richtung spezialisierter Modelle und Datenverfeinerung bewegt, muss sich die Infrastruktur weiterentwickeln, um diese neue Realität zu unterstützen. Zukünftige KI-Systeme werden Folgendes erfordern:

  • Mehrdimensionale Leistung: Unterstützung Tausender kleinerer Modelle, die parallel arbeiten, und Schlüsselwertspeicher, die zur Inferenzzeit effizient arbeiten.
  • Hohe Konnektivität und ständige Verfügbarkeit: KI-gesteuerte Datenpipelines werden Datensätze kontinuierlich aktualisieren und verfeinern.
  • Skalierbarer Hochgeschwindigkeitsspeicher: Die Fähigkeit, große Datenmengen in Echtzeit zu indizieren, abzurufen, zu filtern und darzustellen.

Branchenübergreifend stehen Unternehmen bei der Verwaltung von KI-gesteuerten Datensätzen vor ähnlichen Herausforderungen. KI-Modelle basieren auf sich ständig weiterentwickelnden Datensätzen, die exponentiell wachsen. Anstatt Daten nur zu speichern, werden sie von führenden KI-gesteuerten Unternehmen dynamisch indiziert und verfeinert.

Wenn sich die Modelle verbessern, werden die Daten neu verarbeitet, um neue Erkenntnisse zu gewinnen und die KI-Systeme entsprechend neu zu trainieren. Dieser kontinuierliche Zyklus der Datenverfeinerung ist der Schlüssel, um KI wirklich effektiv zu machen.

Eine neue Ära für KI

Deepseek hat eine grundlegende Wahrheit aufgedeckt: In der Zukunft der KI geht es nicht um größere Modelle – es geht um die Verwaltung und Verarbeitung von Daten. Der Ansatz zur Skalierung von KI hat sich geändert, und wir treten nun in eine Ära ein, in der jedes Modell ohne massive Kapitalinvestitionen unglaublich leistungsfähig werden kann. Die Argumentation ist nun für jedes Modell verfügbar. Auch die Infrastruktur, die Speicherung und das Datenmanagement werden sich nun ändern.

Die wichtigste Erkenntnis? Die echte Innovation findet an der Schnittstelle von KI, Datenwissenschaft und Datenmanagement statt. Bei der Speicherung geht es nicht mehr nur darum, Daten zu speichern, sondern sie zu verfeinern, zu indizieren, zu filtern, zu organisieren und wiederzuverwenden, während sie kontinuierlich für die nächste KI-Entwicklung optimiert werden.

KI-Plattform der Zukunft

Deepseek hat gezeigt, was möglich ist, wenn die KI-Entwicklung ein neues Paradigma annimmt. Die Herausforderung besteht nun für Unternehmen und Infrastrukturanbieter darin, die Möglichkeiten zu erkunden. Dies bedeutet, Systeme, Workflows und Architekturen neu zu konzipieren, die das Potenzial von KI-gesteuerten Erkenntnissen und Entscheidungen voll ausschöpfen.

Da sich die KI weiterentwickelt, benötigen Unternehmen eine Plattform, die sich mit der KI weiterentwickelt, die Komplexität beseitigt, die Effizienz steigert und mühelos skaliert werden kann. Pure Storage ist mit seiner Plattform einzigartig positioniert, um diese KI-gesteuerte Zukunft zu unterstützen. Die einheitliche Infrastruktur vereinfacht die Datenspeicherung in allen Umgebungen. Unternehmen können somit die Leistungsfähigkeit von KI nutzen und gleichzeitig Einfachheit, Zuverlässigkeit, Agilität und Effizienz in ihrem Datenmanagement sicherstellen.

Markus Grau, Pure Storage

Pure Storage

Lesen Sie auch