DeepSeek wstrzymuje prace nad R2 przez brak chipów Nvidia

Klaudia Ciesielska
2 Min
?ród?o: Pexels

Gdy chi?ski startup DeepSeek zaprezentowa? swój model j?zykowy R1, wielu ekspertów przeciera?o oczy ze zdumienia. Model dorównywa? najnowszym konstrukcjom OpenAI i Anthropic, a jego trening kosztowa? znacznie mniej. Sukces okaza? si? jednak trudny do powtórzenia — wed?ug ustale? The Information, produkcja nast?pcy, modelu R2, zosta?a wstrzymana z powodu niedoboru procesorów graficznych Nvidia.

DeepSeek zbudowa? swój sukces na ogromnej skali — model R1 zosta? wytrenowany na 50 tys. GPU z rodziny Hopper, w tym na 10 tys. H100, 10 tys. H800 i 3 tys. chipów H20. Te ostatnie — specjalnie przygotowane do eksportu do Chin — s? dzi? szczególnie trudne do zdobycia. Od czasu na?o?enia przez USA kolejnych ogranicze? eksportowych, chi?skie firmy maj? utrudniony dost?p nawet do okrojonych wersji GPU Nvidii. DeepSeek zu?y? ju? wi?kszo?? dost?pnych zasobów, obs?uguj?c zapotrzebowanie lokalnych firm i agencji rz?dowych.

Sytuacja odbija si? nie tylko na planach zwi?zanych z modelem R2, ale równie? na bie??cej wydajno?ci R1. U?ytkownicy zg?aszaj? spadki jako?ci dzia?ania modelu, co mo?e ?wiadczy? o przeci??eniu systemu. Firma znalaz?a si? w pu?apce: bez nowych GPU nie jest w stanie rozwija? modelu, a malej?ca wydajno?? zniech?ca potencjalnych klientów.

Chi?scy producenci, tacy jak Huawei, oferuj? wprawdzie alternatywne akceleratory AI, ale ich wydajno?? wci?? odbiega od uk?adów Nvidii. Co gorsza, nie s? one zgodne z popularnym ekosystemem CUDA, co dodatkowo komplikuje migracj? modeli i infrastruktury.

Dla DeepSeek to powa?ny problem. Firma mia?a szans? sta? si? lokalnym odpowiednikiem OpenAI, jednak bez sta?ego dost?pu do zaawansowanego sprz?tu mo?e straci? tempo rozwoju. W praktyce potwierdza to szerszy problem chi?skiego ekosystemu AI — ograniczenia w dost?pie do technologii pó?przewodnikowej przek?adaj? si? na trudno?ci w skalowaniu modeli i us?ug.

W kontek?cie globalnego wy?cigu zbroje? w AI, opó?nienie modelu R2 pokazuje, jak istotne s? ?a?cuchy dostaw i dominacja kilku dostawców sprz?tu. Nawet najlepiej zaprojektowany model nie ma szans bez odpowiedniego zaplecza obliczeniowego.

Udostępnij
Redaktor Brandsit