Nvidia uvádí DGX Spark a vlastní procesor GB10: Nejmenší AI superpočítač, nebo taky RTX 5070 za 4000 $
Před 13 hodinami
Na CES 2025 v lednu odhalila Nvidia plán vydat minipočítač, který by měl dost výkonu pro různé lokálně běžící AI aplikace. Zařízení pojmenované tehdy Project Digits mělo mít v sobě GPU od Nvidie a ARM procesor, firma ale nesdělila moc podrobností mimo marketingových řečí o „AI superpočítači“. Teď na GTC 2025 dostal počítač oficiální jméno a konečně je toho o něm známo víc. Včetně mimochodem docela vysoké ceny. DGX Spark Počítač v lednu označovaný jako Project Digits se nakonec jmenuje DGX Spark. Podle Nvidie je nejmenším „AI superpočítačem“ na světě, ale to je samozřejmě čistý marketingový nesmysl. Zařízení o hmotnosti 1,2 kg a rozměrech 15,0 × 15,0 × 5,05 cm sice nebude mít špatný výkon, ale ten bude prostě odpovídat jeho třídě a spotřebě, reálné superpočítače jsou někde úplně jinde. Možná je spíš otázka, co ze své produkce Nvidia superpočítačem někdy nenazývala. V roce 2015 například takto vynášela do nebes čip Tegra X1, který o něco později začal pohánět Nintendo Switch a klišé o „výkonnostních orgiích“ byste s tímto handheldem v jedné větě asi nepoužili. Deset jader Cortex-X925 DGX Spark má procesor, který Nvidia označuje jako „GB10 Superchip“ (Superchip je další oblíbený slogan Nvidie a také byste ho mimochodem našli v tiskových zprávách ohlašujících Tegru X1). Nvidia uvádí, že má 20 jader architektury ARM a na jednom místě říká, že jde o architekturu „Grace Blackwell“. Ale od serverového procesoru Grace se GB10 silně liší (a podle dosavadních informací by ho s Nvidii měl vyvíjet MediaTek). Zatímco serverový Grace má 72 nebo u dvojčipové konfigurace 144 serverových jader ARM Neoverse V2, která už jsou starší a jsou odvozená od Cortexu-X3, GB10 je big.LITTLE procesor s pouze klientskými jádry, ale novějšími a výkonnějšími. Má deset loňských jader Cortex-X925 a k nim deset malých či prostředních jader Cortex-X725. Velká jádra Cortex-X925 byla vyvinutá s cílem dohnat architektury Applu v procesorech M1, M2 a M3 a s deseti kusy je tedy Nvidia GB10 poměrně silné CPU. Pokud tedy nemají nějakou nečekaně nízkou frekvenci – takty se Nvidia zveřejnit neobtěžovala (a dokonce ani výrobní proces). Výkon GeForce RTX 5070, ale se 128GB pamětí Firma bohužel také mlčí i o GPU části procesoru, o které bylo řečeno jen to, že používá architekturu Blackwell a podporuje AI výpočty s přesností FP4. V těch má GPU teoretický AI výkon 500 TOPS – nebo 1000 TOPS s využitím funkce sparsity. A pochopitelně jen v maticových operacích na tensor jádrech. To je výkon rovnající se GeForce RTX 5070, pro kterou tu Nvidia uvádí 988 TOPS včetně sparsity a která je jednou z nižších herních grafických karet firmy (což je důvod oné jízlivosti nad přirovnáváními k superpočítačům v předchozích odstavcích). Nvidia nesděluje, kolik má GPU v GB10 bloků SM a shaderů (a tensor jader), také nevíme, zda obsahuje RT jádra pro herní grafiku. GPU nejspíš má o něco víc výpočetních jednotek než GB205 v GeForce RTX 5070, ale na nižším taktu. Nvidia DGX Spark, vnitřní komponenty Autor: Nvidia Co Nvidia uvádí, jsou specifikace pamětí. Procesor GB10 má paměti LPDDR5X-8533 na 256bitové sběrnici s kapacitou 128 GB. Jde tedy o konfiguraci prakticky stejnou jako u Ryzenu AI Max+ 395 („Strix Halo“) od AMD, ale frekvence je o několik procent vyšší. Paměti takto poskytují propustnost 273 GB/s, což je o dost méně než v případě GeForce RTX 5070 (její GDDR7 na 192bitové sběrnici dává 672 GB/s), přičemž propustnost sdílí GPU i CPU. To, co zařízení nabízí, tedy nebude úplně výkon, ale ta 128GB kapacita unifikované paměti. Dovolí pracovat s velmi velkými modely, přičemž kapacita paměti je dnes asi největším limitujícím faktorem pro inferenci s pokročilými AI, nikoliv tolik samotný výpočetní výkon. GPU a CPU jsou na dvou kusech kř