NVIDIA GeForce RTX 4000 ‘SUPER’ Serisi Neler Sunuyor?

NVIDIA, aylar süren sızıntı serüveninin ardından “SUPER” haberlerle karşımızda. Mevcut RTX 4000 serisi ekran kartlarını yeni nesil modellerle genişleten şirket, CES 2024’te bir etkinlik düzenledi. Konuklara gelince; RTX 4070 SUPER, RTX 4070 Ti SUPER ve RTX 4080 SUPER bizlerle.

Yeni nesil ekran kartlarıyla birlikte SUPER olmayan mevcut muadillere kıyasla iyi performans artışları sunulduğunu söyleyebiliriz. Oyunculara yeni alternatifler getirecek olan orta-üst segment GPU’lar Ocak ayı içerisinde sıralı olarak piyasaya çıkıyor. Yeşil takım çıkış tarihlerini performans sıralamasının tersine olacak şekilde belirlemiş. RTX 4070 SUPER ilk sırada, sonra RTX 4070 Ti SUPER ve ardından RTX 4080 SUPER geliyor.

RTX 4080 SUPER, kademeli olarak piyasadan kaldırılacak olan mevcut RTX 4080’in yerini alıyor. RTX 4070 Ti SUPER ise mevcut RTX 4070 Ti ile belirgin farklara sahip. RTX 4070 SUPER, hafif bir fiyat avantajıyla da olsa mevcut RTX 4070 ile bir arada bulunacak.

RTX 4070 SUPER ve RTX 4070 Ti SUPER, NVIDIA tarafından tam ışın izleme ile maksimum 1440p oyun için tavsiye edilirken; RTX 4080 SUPER tam ışın izleme ile 4K’da maksimum oyun oynamak isteyenler için tasarlandı. Aslında RTX 4070 serisinin yeni üyeleri 1440p oyunculuk için ideal, ancak DLSS 3 ve Frame Generation’ın yaygınlaşmasıyla birlikte 4K çözünürlüklerde kabul edilebilir FPS değerleri elde edebilirsiniz.

Alt uçtan başlayalım. 4070 SUPER’i 56 SM (Streaming Multiprocessor) ve 7168 CUDA çekirdeğiyle bekliyoruz. Bellek arayüzü, RTX 4070 ve 4070 SUPER ile aynı 21 Gbps GDDR6X yongalarıyla 192 bit olarak kalacak. 504 GB/sn’lik bant genişliği korunacak. Sonuç olarak, RTX 4070’e göre %22 daha fazla işlem performansı ve RTX 4070 Ti’ye göre %11 daha az işlem performansı sağlanıyor.

2,48 GHz’lik resmi frekans hızı listelenmiş lakin NVIDIA ekran kartlarının çok daha yüksek seviyelere çıktığını biliyoruz. Ada Lovelace mimarili 4070 GPU’lar kullanım senaryosuna göre 2,8 GHz’e kadar erişebiliyor. Bu arada, frekans hızının RTX 4070 ile aynı olduğunu belirtelim.

Güç tüketimi tarafında bir miktar fark var. RTX 4070 hatırlarsanız 200W TGP ile sunuluyordu. SUPER varyant ise 20W’lık artışla birlikte 220W TGP’ye sahip. RTX 4070 Ti’nin 285W’lık TGP’si ise çok daha yüksekti.

Performans konusuna gelince, NVIDIA her zaman olduğu gibi DLSS 3 kare üretimini kullanmış. Ancak şirket, DLSS 3’ü hesaba katmadan bile önceki nesil RTX 3090’dan biraz daha iyi performans sağlandığını vurguluyor. Böyle bir iddia var olmasına lakin bu üstünlüğün kısıtlı senaryolarda sağlandığını düşünüyoruz. 4070 Ti, 3090’dan biraz daha hızlıydı. Bu bağlamda 4070 SUPER’in belirli alanlarda üstün olması normal.

Söylediğimiz gibi NVIDIA, üç yeni grafik kartını Ocak ayına yayılacak şekilde satışa sunacak. RTX 4070 SUPER, RTX 4070’in liste fiyatı olan 599 dolarlık başlangıç fiyatıyla 17 Ocak’ta raflarda olacak. RTX 4070 yine satılmaya devam edecek, ancak 549 dolarlık fiyatla. Mevcut perakende fiyatları kontrol ederseniz RTX 4070’lerin daha düşük fiyatlarla satıldığını görebilirsiniz. Performansın RTX 4070 Ti’ye nispeten yakın olmasını bekliyoruz, bu da önemli bir gelişme elde edeceğiniz anlamına geliyor. Zaman içinde daha detaylı testlerle karşınızda olacağız.

Tekrardan kullanılan AD104 GPU ile gelen RTX 4070 SUPER, 36 FP32 shader teraflop ve 568 FP8 (seyreklik ile) AI teraflop sunuyor. Bunlar önemli nitelikler, çünkü şu anda FP8 formatından ve/veya seyreklikten yararlanmayan çok sayıda yapay zeka iş yükü var ve bunların her birini kapatmak teorik performansı yarıya indiriyor (yani tensör çekirdeklerinde çalışan genel FP16 iş yükleri için 142 teraflop işlem yapıyor).

RTX 4070 Ti SUPER’e geçildiğinde işler biraz daha ilginç bir hal alıyor. Yeşil takım yeni kartında AD103 GPU silikonunu kullanacak ve 256 bit bellek arayüzüne kapı açacak. Özetle, normal RTX 4070 Ti’ye göre %33’lük bir iyileşmeden bahsediyoruz. Güncel GPU’nun 799 dolarlık fiyatı ve gelişmiş özelliklerini düşünürsek RTX 4070 Ti’nin aşamalı olarak piyasadan kalkması normal görünüyor.

Peki RTX 4070 Ti piyasadan kalkarsa tamamı etkinleştirilmiş AD104 çipler nasıl değerlendirilecek? Muhtemelen Mobil RTX 4080’in yanı sıra RTX 4000 Ada Generation gibi bazı profesyonel kartlarda kullanılacak.

RTX 4070 Ti SUPER, 66 SM’ye tekabül eden 8448 CUDA çekirdeğiyle sahne alıyor. Bu da kabaca %10’luk bir artış demek. Frekans hızı aynı şekilde 4070 Ti ile aynı şekilde 2,61 GHz olarak listeleniyor. Buun yanında, 44 teraflop FP32 shader performansı ve 706 teraflop FP8 verimliliği (706 teraops INT8) sağlanacak.

İyi olan şu ki güç tüketiminde bir artış yok: TGP değeri 285W, yani RTX 4070 Ti ile aynı kalmış. En büyük değişiklik bellek bant genişliği ve kapasite tarafında. 256 bit arayüzde çalışan 21 Gbps GDDR6X bellekler teorik olarak 672 GB/sn bant genişliği sunabiliyor. Bu arada bellek kapasitesinin 16 GB‘a çıktığını da hatırlatalım.

RTX 4070 Ti SUPER, tüm bu gelişmelerle birlikte rahatlıkla RX 7800 XT’nin önüne geçecek ve hatta RX 7900 XT ile rekabet edebilir. Üstün ışın izleme ve DLSS performansı da cabası. 4070 ailesinin üyesi RTX 4080’den yaklaşık %10 daha yavaş veya RTX 4070 Ti’den yaklaşık %15 daha hızlı olacak gibi görünüyor.

Ti olan model RTX 4070 SUPER’den bir hafta sonra, 24 Ocak tarihinde piyasadaki yerini alacak. Diğer iki modelin aksine, RTX 4070 Ti Founders Edition modelleri satılmayacak.

Üç yeni kartın içinde en az heyecan yaratan model RTX 4080 SUPER gibi görünüyor, ancak fiyatlandırma konusuysa iyi haberler var. RTX 4080 zaten 76 SM ile AD103 GPU’nun neredeyse tamamını kullanıyordu. RTX 4080 SUPER’de 80 SM’nin tamamı aktifleştirilmiş, böylelikle 10240 CUDA çekirdeğine çıkıyoruz. Yüzdeye vuracak olursak, iki model arasında %5’lik çekirdek farkı var.

NVIDIA, 256 bit bellek arayüzünü ve 16 GB kapasiteli GDDR6X bellekleri kullanmaya devam ediyor. SUPER’in 20 GB bellekle gelebileceği konuşuluyordu fakat umutlar artık söndü. Diğer yandan GDDR6X belleklerin çalışma frekansında hafif bir artış söz konusu. RTX 4080’de 22,4 Gbps olan hız SUPER ile 23 Gbps’ye çıkacak. Böylelikle de bant genişliğinde %2,7 gibi düşük oranlı bir yükseliş söz konusu.

Uzun lafın kısası, fabrika çıkışlı hız aşırtmalı olarak gelen premium RTX 4080’lerin RTX 4080 SUPER’e yaklaşması muhtemel. Ek olarak yeni GPU’nun selefiyle aynı şekilde 320 TGP’ye sahip olduğunu belirtelim.

İyi haber şu ki, teknoloji devi önemli bir fiyat indirimi yaptı. SUPER ekini taşıyan yeni kart RTX 4080’den 200 dolar daha ucuza, yani 999 dolara satılacak. Tahmin edebileceğiniz gibi, bu fiyat değişimiyle birlikte RTX 4080’ler kademeli olarak ortadan kaldırılacak. Kalan envanteri temizlemek isteyen şirketler de fiyat indirimleri yapabilir.

RTX 4080’i olan zaten SUPER’i almaz, bu nedenle NVIDIA, RTX 3080 Ti ve RTX 2080 SUPER ile performans karşılaştırmaları sağladı. Eğer RTX 2000 serisinde kaldıysanız performansın iki katına çıktığı belirtiliyor. İki kat fazla VRAM’in yanı sıra, yapay zeka iş yüklerinde 4080 SUPER’in 3080 Ti’den yüzde 50-70 oranında daha iyi performans gösterdiği söyleniyor.

999 dolardan başlayan fiyatlarla 31 Ocak’tan itibaren satışlar başlıyor. Stok hızda çalışan ve fabrika çıkışlı hız aşırtmalı modeller de dahil olmak üzere ASUS, Colorful, Gainward, GALAX, GIGABYTE, INNO3D, KFA2, MSI, Palit, PNY ve ZOTAC gibi markaların özel tasarımlarını görmeye başlayacağız.

RTX 4070 SUPER RTX 4070 RTX 4070 Ti SUPER RTX 4070 Ti RTX 4080 SUPER RTX 4080
GPU AD104 AD104 AD103 AD104 AD103 AD103
Üretim
Teknolojisi
TSMC 4N TSMC 4N TSMC 4N TSMC 4N TSMC 4N TSMC 4N
Transistör 32 milyar 32 milyar 45.9 milyar 35.8 milyar 45.9 milyar 45.9 milyar
Kalıp Boyutu 294.5 mm² 294.5 mm² 378.6 mm² 294.5 mm² 378.6 mm² 378.6 mm²
SM 56 46 66 60 80 76
Çekirdekler (Shader) 7168 5888 8448 7680 10240 9728
Tensor / AI Çekirdeği 224 184 264 240 320 304
RT Çekirdeği 56 46 66 60 80 76
Boost
Frekans
2480 MHz 2475 MHz 2610 MHz 2610 MHz 2550 MHz 2505 MHz
Bellek Hızı 21 Gbps 21 Gbps 21 Gbps 21 Gbps 23 Gbps 22.4 Gbps
VRAM 12 GB 12 GB 16 GB 12 GB 16 GB 16 GB
Bant Genişliği 192 192 256 192 256 256
L2 Önbellek 36 36 64 48 64 64
Render Çıktı Birimleri 80 64 96 80 112 112
Doku Eşleme Birimleri ~224 184 ~264 240 ~320 304
TFLOPS FP32 (Boost) 36 29.1 44 40.1 52 48.7
TFLOPS FP16 (FP8) 284 (568) 233 (466) 353 (706) 321 (641) 418 (836) 390 (780)
Bant Genişliği 504 GB/sn 504 GB/sn 672 GB/sn 504 GB/sn 736 GB/sn 717 GB/sn
TGP 220W 200W 285W 285W 320W 320W
Liste Fiyatı 599$ 599$ 799$ 799$ 999$ 1,199$

3. Nesil Ray Tracing Çekirdekleri

Işın izleme bir kez daha büyük önem kazanıyor ve üç yeni teknoloji hayatımıza giriyor: Shader Execution Reordering (SER), Opacity Micro-Maps (OMM) ve Displaced Micro-Meshes (DMM). Bu yeniliklerin tümüyle birlikte çeşitli iyileştirmeler sunuluyor, ancak geliştiricilerin yeni teknolojileri oyunlarına uygulaması gerekecek.


NVIDIA Shader Execution Reordering, performans kazanımları sağlıyor.

OMM Motoru, yapraklar, parçacıklar ve çitler için sıklıkla kullanılan dokuların çok daha iyi işlenmesini sağlıyor. DMM Motoru ise 20 kata kadar daha az BVH depolama alanı ile 10 kata kadar daha hızlı Bounding Volume Hierarchy (BVH) oluşturma süresi sunarak geometrik olarak karmaşık sahnelerin gerçek zamanlı ışın takibini mümkün hale getiriyor.


Opacity Micro-Maps (OMM)

Ada GPU içinde yer alan ışın izleme birimleri, Faster Ray-Triangle Intersection Throughput (Işın-Üçgen Kesişme Verimi) açısından iki kat daha gelişmiş ve bu da geliştiricilerin sanal dünyalarına daha fazla ayrıntı eklemelerini sağlıyor.

Shader Execution Reordering

Gelişmiş ışın izleme, bir sahne boyunca çok sayıda farklı nesneye çarpan, çok sayıda ışının hesaplamasını gerektiriyor. Böylelikle çekirdekler için farklı iş yükleri doğmuş oluyor. Shader Execution Reordering (SER) teknolojisi, önceden verimsiz olan bu iş yüklerini dinamik olarak yeniden düzenleyerek çok daha verimli hale getiriyor. SER, ışın izleme işlemleri için gölgelendirici performansını 3 kata kadar ve oyun içi kare hızlarını %25’e kadar artırabiliyor.

4. Nesil Tensor Çekirdekleri

Derin öğrenme ve yapay zeka iş yüklerine gelince, yine bu alanda büyük gelişmeler kaydedildiğini görüyoruz. Ada’nın dördüncü nesil Tensor çekirdekleri, ilk olarak Hopper H100 veri merkezi GPU’su ile tanıtılan FP8 Transformer Engine’i kullanarak verimi 5 kata kadar artırıyor ve 1.4 Tensor-petaFLOPS’luk güç ortaya çıkıyor.

Transformer Engine sayesinde FP16 yerine FP8 kullanabilen algoritmalar için Tensor çekirdeği başına hesaplama becerisi iki katına çıkıyor.

AV1 Kodek Desteği

Önceki nesil Ampere ekran kartlarında AV1 kod çözme desteği sunulsa da AV1 kodlama desteği sunulmuyordu. Ada mimarisi üzerine inşa edilen ekran kartları, AV1 kodlama desteği sunan sekizinci nesil NVIDIA Encoder’a (NVENC) sahip olacak. Böylelikle yayıncılar ve video işiyle uğraşanlar için yeni olanaklar sağlanacak. AV1 kodek, H.264’ten %40 daha verimli. Ayrıca 1080p’de yayın yapan kullanıcıların aynı bit hızı ve kalitede çalışırken yayın çözünürlüklerini 1440p’ye yükseltmelerine imkan verecek.


RTX 4000 Serisi AV1 ekosistemi.

Ada GPU’lar ayrıca çift NVENC kodlayıcı ile destekleniyor. Bu gelişim ise profesyonel video düzenleme için 8K/60 veya dört adet 4K/60 video kodlamasına olanak sağlıyor. DaVinci Resolve, Adobe Premiere Pro için popüler Voukoder eklentisi ve Çin’in en iyi video düzenleme uygulaması olan Jianying, AV1 desteğinin yanı sıra çift kodlama desteğiyle kullanıma sunulacak. NVIDIA ayrıca popüler efekt uygulaması Notch’a AV1 desteği getirmek ve Topaz yazılımına çift kodlama desteği sunmak için çalışıyor.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir