Was ist DeepSeek | Herausforderer, der die Zukunft der KI gestaltet
Der Aufstieg von DeepSeek
Am 20. Januar sorgte DeepSeek, ein relativ unbekanntes KI-Forschungslabor aus China, im Silicon Valley für Aufsehen mit der Veröffentlichung seines Open-Source-KI-Modells DeepSeek-R1. Laut dem Forschungsbericht des Labors übertrifft DeepSeek-R1 führende Modelle, einschließlich der Angebote von OpenAI, in Mathematik- und Denkfähigkeits-Benchmarks. Mit seinem Fokus auf Leistungsfähigkeit, Kosteneffizienz und Offenheit stellt DeepSeek eine bedeutende Herausforderung für die etablierten westlichen KI-Giganten dar.

Maximierung der Effizienz statt Hardware-Abhängigkeit
„Im Gegensatz zu vielen chinesischen KI-Unternehmen, die stark auf fortschrittliche Hardware angewiesen sind, hat DeepSeek die Ressourcenoptimierung durch Software priorisiert“, erklärt Marina Zhang, Professorin an der University of Technology Sydney, die sich auf chinesische Innovationen spezialisiert hat. „Durch die Nutzung von Open-Source-Methoden konnten sie kollektives Fachwissen bündeln und Zusammenarbeit fördern. Das hat ihnen ermöglicht, Hardware-Beschränkungen zu umgehen und gleichzeitig bahnbrechende Fortschritte zu erzielen.“
Die Ursprünge von DeepSeek
Die Geschichte von DeepSeek beginnt mit dem Mutterunternehmen High-Flyer, einem führenden quantitativen Hedgefonds in China. Gegründet im Jahr 2015, wurde High-Flyer schnell zu einer treibenden Kraft im Bereich Finanzanalysen und verwaltete auf seinem Höhepunkt über 100 Milliarden RMB (ca. 15 Milliarden US-Dollar). Der Hedgefonds investierte massiv in GPUs und Supercomputer zur Analyse von Finanzdaten.
Im Jahr 2023 beschloss Liang Wenfeng, ein Informatik-Masterabsolvent und visionärer Unternehmer, diese Ressourcen in die Gründung von DeepSeek zu investieren. Sein Ziel war es, bahnbrechende KI-Modelle zu entwickeln und künstliche allgemeine Intelligenz (AGI) voranzutreiben.
Fokus auf junge Talente
Statt auf erfahrene Branchenexperten zu setzen, konzentrierte sich Liang darauf, junge Doktoranden von angesehenen chinesischen Universitäten wie der Peking- und Tsinghua-Universität zu rekrutieren. Viele dieser Forscher hatten in führenden wissenschaftlichen Zeitschriften veröffentlicht, aber keine Branchenerfahrung.
„Unsere Kernpositionen im technischen Bereich sind mit Absolventen der letzten ein bis zwei Jahre besetzt“, erklärte Liang. Diese Strategie schuf eine Kultur der Zusammenarbeit und des Experimentierens, in der Forscher mutige Ideen verfolgen konnten, ohne den Druck kurzfristiger finanzieller Gewinne.
Innovation trotz Hardware-Einschränkungen
Im Oktober 2022 implementierte die US-Regierung Exportkontrollen, die chinesischen Unternehmen den Zugang zu fortschrittlichen Chips wie Nvidias H100 erschwerten. Während DeepSeek über ein Lager von 10.000 A100-Chips verfügte, stellten die Beschränkungen erhebliche Herausforderungen für die Skalierung dar. Statt sich diesen Einschränkungen zu beugen, entwickelte DeepSeek innovative Lösungen durch Optimierungen der Modellarchitektur und des Trainingsprozesses.
Die Rolle von Open Source
DeepSeeks Entscheidung, sein Modell als Open Source zu veröffentlichen, hat innerhalb der globalen KI-Forschungsgemeinschaft große Aufmerksamkeit und Zustimmung erhalten. Durch die gemeinsame Nutzung seiner Innovationen hat DeepSeek Mitwirkende und Nutzer angezogen, die das Modell weiter verfeinern.
Auswirkungen auf US-Exportkontrollen
Der Erfolg von DeepSeek wirft Fragen über die Wirksamkeit der aktuellen US-Exportkontrollen auf. Diese Beschränkungen sollten Chinas Zugang zu fortschrittlichen Rechenressourcen begrenzen. Doch DeepSeeks Fortschritte zeigen, dass auch mit effizienten Softwarelösungen erhebliche Erfolge erzielt werden können.
Eine neue Ära für chinesische KI
DeepSeeks Aufstieg markiert einen Wendepunkt in der chinesischen KI-Branche. Im Gegensatz zu vielen Unternehmen, die auf staatliche Finanzierung oder Partnerschaften mit Technologieriesen angewiesen sind, hat DeepSeek seine Unabhängigkeit bewahrt.
Mit seinem innovativen Ansatz – einer Kombination aus jungen Talenten, softwaregetriebener Entwicklung und einer Open-Source-Philosophie – hebt sich DeepSeek von seinen Konkurrenten ab.
In den kommenden Jahren könnte DeepSeek die KI-Entwicklung und geopolitische Landschaft maßgeblich beeinflussen. Ob durch neue Modellbauansätze oder die Herausforderung etablierter westlicher Unternehmen – das Unternehmen prägt bereits sein Vermächtnis. Während Liang Wenfeng und sein Team ihre Suche nach künstlicher allgemeiner Intelligenz fortsetzen, wird die Welt gespannt beobachten, wie weit sie noch gehen können.
