Wnętrze GPU: od architektury po tryliony obliczeń
Często mówimy o wydajności nowoczesnych procesorów graficznych w kategoriach abstrakcji — tryliony operacji, stale rosnąca moc obliczeniowa. Mniej widoczna pozostaje jednak struktura, która to wszystko umożliwia.
W tym miejscu z pomocą, by wyjaśnić co dzieje się wewnątrz nowoczesnej karty graficznej, pojawia się film autorstwa Branch Education, który wykorzystuje układ GA102 z karty NVIDIA RTX 3090 jako punkt odniesienia.
Głównym założeniem filmu jest proste, ale odkrywcze pytanie: w jaki sposób pojedyncze urządzenie może wykonać dziesiątki bilionów obliczeń na sekundę? Oglądająć materiał dowiemy się, że niektóre procesory graficzne z najwyższej półki są w stanie wykonać ponad 36 bilionów operacji na sekundę. Te z najnowszej generacji jeszcze zwiększają tę liczbę.
Odpowiedź na zadane na początku pytanie leży w sposobie zaprojektowania procesorów graficznych. W przeciwieństwie do procesorów CPU, które obsługują zadania sekwencyjnie, procesory graficzne są zbudowane z myślą o przetwarzaniu równoległym, co pozwala na jednoczesne wykonywanie tysięcy mniejszych operacji. Zazwyczaj opisuje się to jako podejście typu Single Instruction, Multiple Data (SIMD), w którym ta sama instrukcja jest stosowana jednocześnie w wielu punktach danych.
Ta architektura, w połączeniu z pamięcią o dużej przepustowości, taką jak GDDR6X, umożliwia procesorom graficznym wydajną obsługę obciążeń wymagających intensywnego przetwarzania danych — od renderowania i transformacji obiektów po coraz bardziej złożone zadania związane ze sztuczną inteligencją.
W swoim filmie firma Branch Education pokazuje, że wydajność nie wynika z pojedynczego przełomu, ale jest wynikiem współdziałania tych elementów w ściśle zintegrowanym systemie, odzwierciedlając szerszą rolę, jaką procesory graficzne odgrywają obecnie w obliczeniach o wysokiej wydajności.



