DeepSeek V4: Training auf Nvidia Blackwell-Chips trotz US-Sanktionen

Berichte über DeepSeeks Nutzung von Nvidia Blackwell-GPUs belasten das US-Embargo und verdeutlichen Chinas technologische Abhängigkeit.

DeepSeek V4: Die technologische Lücke und das Problem der Exportkontrollen Das chinesische KI-Startup DeepSeek sorgt in der globalen Technologiebranche erneut für Aufsehen. Nach Informationen aus US-Gründer- und Regierungskreisen soll das Unternehmen sein neuestes Modell, DeepSeek V4, auf den leistungsstärksten Blackwell-GPUs von Nvidia trainiert haben. Diese Entwicklung ist höchst brisant, da der Export dieser speziellen Hochleistungschips nach China durch das US-Handelsministerium strikt untersagt ist. Die Vorwürfe werfen ein Schlaglicht auf die erhebliche Porosität der aktuellen Exportbeschränkungen und die anhaltende Dominanz US-amerikanischer Hardware in der chinesischen KI-Entwicklung. Schattenwirtschaft und Rechenzentren in der Inneren Mongolei Laut Berichten von US-Offiziellen wurde die für das Training notwendige Rechenlast in einem Datenzentrum in der Inneren Mongolei lokalisiert. Diese Region hat sich aufgrund günstiger Energiekosten und kühler klimatischer Bedingungen zu einem Hub für chinesische Cloud-Infrastruktur entwickelt. Es wird spekuliert, dass DeepSeek über ein komplexes Netzwerk aus Drittanbietern und Briefkastenfirmen Zugriff auf die Blackwell-Flotte erhalten hat. Da die Chips offiziell nicht direkt an chinesische Unternehmen verkauft werden dürfen, deutet dieser Vorfall auf einen florierenden Graumarkt hin, der es Akteuren ermöglicht, die physische Kontrolle über Hardware zu erlangen, die technisch gesehen nie die Grenze hätte überschreiten dürfen. Huawei als unzureichende Alternative Die Tatsache, dass ein Vorzeigeunternehmen wie DeepSeek offenbar massive Risiken eingeht, um auf Nvidia-Hardware zuzugreifen, entlarvt den aktuellen Status der heimischen chinesischen Halbleiterindustrie. Trotz massiver staatlicher Subventionen und den Fortschritten von Huawei mit seiner Ascend-Serie scheinen die chinesischen Alternativen den Anforderungen für das Training von Large Language Models der nächsten Generation noch nicht gewachsen zu sein. Die Software-Stack-Integration von Nvidia (CUDA) und die schiere Recheneffizienz der Blackwell-Architektur bieten Vorteile, die durch einheimische Designs wie den Ascend 910B bisher nicht kompensiert werden können. Für DeepSeek ist die Wahl der Hardware eine strategische Notwendigkeit, um im globalen Wettbewerb mit OpenAI oder Anthropic konkurrenzfähig zu bleiben. Implikationen für die US-Handelspolitik Für die US-Regierung stellt dieser Vorfall eine strategische Niederlage dar. Er verdeutlicht, dass Exportverbote allein kaum ausreichen, um den Technologietransfer in den Bereich der Künstlichen Intelligenz vollständig zu unterbinden. Es ist zu erwarten, dass das Handelsministerium und das Office of Foreign Assets Control (OFAC) nun den Druck auf internationale Distributoren erhöhen werden. Gleichzeitig zeigt das Beispiel DeepSeek, dass die Innovationsgeschwindigkeit in China trotz der harten Sanktionen hoch bleibt. DeepSeek V4 wird als Modell erwartet, das durch extreme Effizienz bei der Nutzung von Rechenressourcen besticht – eine Fähigkeit, die das Unternehmen ironischerweise auf genau der Hardware perfektioniert hat, die ihm vorenthalten werden sollte. Fazit für den DACH-Markt Europäische Unternehmen und Analysten sollten die Entwicklung genau beobachten. Die Resilienz der chinesischen KI-Industrie gegenüber westlichen Sanktionen zeigt, dass technologische Autarkie dort mit aller Macht vorangetrieben wird. Die Abhängigkeit von Nvidia bleibt jedoch das Nadelöhr der Branche. Solange der Leistungsabstand zwischen Nvidia und den chinesischen Alternativen so eklatant bleibt, wird der findige Umweg über Graumärkte und Offshore-Strukturen das Modell der Wahl für Chinas KI-Elite bleiben.

Quelle: Fortune

Vollständigen Artikel auf ChinaAISignal lesen