CDNA 3 ve Zen 4 Gelişmiş Bir Paketlemede Bir Araya Geliyor - Dünyadan Güncel Teknoloji Haberleri

CDNA 3 ve Zen 4 Gelişmiş Bir Paketlemede Bir Araya Geliyor - Dünyadan Güncel Teknoloji Haberleri
7 TFLOP’lar FP64 Bilgisayar henüz bilinmiyor TBA 47,9 TFLOP 45

CDNA 3 GPU mimarisini temel alan her bir GCD, 2560 çekirdeğe karşılık gelen toplam 40 işlem birimine sahiptir

CDNA 3 ve Zen 4’e sahip AMD Instinct MI300A Hızlandırıcı ölür Bu yeni GPU ve CPU hızlandırmalı aile, AMD’nin 1 numaralı ve şu anda en önemli stratejik önceliği olan yapay zeka segmentinin lider ürünü olacak ve sonunda sadece gelişmiş değil aynı zamanda gereksinimleri karşılayacak şekilde tasarlanmış bir ürünü piyasaya sürecek MI300 sınıfı AI hızlandırıcılar, TSMC’nin gelişmiş paketleme teknolojilerinden yararlanan başka bir chiplet güç merkezi olacak, bu yüzden bu AI canavarlarının altında ne olduğunu görelim AMD, 192 GB’lık bir bellek havuzu elde etmek için MI300X’i 8 HBM3 yığınıyla donatıyor ve her yığın 12-Hi olup, bize IC başına 2 GB veya yığın başına 24 GB kapasite sağlayan 16 Gb IC’leri dahil ediyor 312 6656 7680 4096 3840 4096 4096 2304 GPU Saat Hızı henüz bilinmiyor TBA 1700 MHz 1700 MHz 1700 MHz 1500 MHz 1800 MHz 1725MHz 1500 MHz 1000 MHz 1237 MHz FP16 Bilgisayar henüz bilinmiyor TBA 383 ÜST 362 ÜST 181 ÜST 185 TFLOP 29,5 TFLOP 26,5 TFLOP 24 6 TFLOP 8

Bellek, 5,2 TB/s’ye kadar bant genişliği ve 896 GB/sn Infinity Fabric Bant Genişliği sunacak

AMD Instinct MI300A Hızlandırıcı

Şimdilik AMD, NVIDIA’nın 2024 Blackwell GPU’ları için bazı büyük rakamları açıkladığı ve Intel’in Guadi 3 ve Falcon Shores GPU’larını önümüzdeki yıllarda piyasaya sürülmeye hazırladığını, rakiplerinin de yapay zeka çılgınlığında tam gaz ilerlediğini bilmeli 2 TFLOP’lar 5

CDNA 3’lü AMD Instinct MI300X Hızlandırıcı ölür 2 TFLOP’lar 5 3 TFLOP 23 Karşılaştırma yapmak gerekirse, NVIDIA’nın yakında çıkacak olan H200 AI hızlandırıcısı 141 GB kapasite sunarken Intel’in Gaudi 3’ü 144 GB kapasite sunacak 3 TFLOP 22 1 TFLOP’lar 14 CDNA 3 GCD’lerin ayrıca L2 önbelleğinin ayrı olduğu unutulmamalıdır Verim açısından AMD bu çekirdeklerin küçük bir kısmını küçültecek ve bundan bir ay sonra kesin yapılandırmalar hakkında daha fazla ayrıntı alacağız 3 TFLOP’lar 12 Karşılaştırmalar için:

  • İçgüdü MI300X – 192 GB HBM3
  • Gaudi 3 – 144GB HBM3
  • H200 – 141 GB HBM3e
  • MI300A – 128GB HBM3
  • MI250X – 128 GB HBM2e
  • H100 – 96 GB HBM3
  • Gaudi 2 – 96 GB HBM2e

Güç tüketimi açısından AMD Instinct MI300X, 750W olarak derecelendirilmiştir; bu, Instinct MI250X’in 500W’ına göre %50 ve NVIDIA H200’e göre 50W daha fazladır Büyük bellek havuzları, çoğunlukla belleğe bağlı olan Yüksek Lisans’larda çok önemlidir ve AMD, bellek departmanında lider olarak AI yeteneğini kesinlikle gösterebilir

Bellek, MI300X’in selefi MI250X’e (128 GB) göre %50 daha fazla HBM3 kapasitesine sahip olmasıyla büyük bir yükseltme göreceğiniz başka bir alandır ) henüz bilinmiyor 750W 560W 500W 300W 300W 300W 300W 300W 175W 150W

Bu hikayeyi paylaş

Facebook

heyecan



genel-17

AMD Instinct MI300A – Yoğun Paketlenmiş Exascale APU’lar Artık Gerçek

Yıllardır AMD’nin sonunda Exascale sınıfı APU vaadini yerine getirmesini bekledik ve Instinct MI300A’nın piyasaya sürülmesine yaklaştığımız gün yaklaşıyor

AMD Instinct MI300 Hızlandırıcıların öne çıkan bazı özelliklerini özetlersek:

  • İlk Entegre CPU+GPU Paketi
  • Exascale Süper Bilgisayar Pazarını Hedeflemek
  • AMD MI300A (Entegre CPU + GPU)
  • AMD MI300X (Yalnızca GPU)
  • 153 Milyar Transistör
  • 24’e kadar Zen 4 Çekirdeği
  • CDNA 3 GPU Mimarisi
  • 192 GB’a kadar HBM3 Bellek
  • 8 Chiplet’e kadar + 8 Bellek Yığını (5nm + 6nm işlem)

Tüm bunları bir araya getiren AMD, ekosistem sağlayıcıları ve ortaklarıyla birlikte çalışarak MI300 AI hızlandırıcılarını, asma konnektörlerle ana karta bağlanan SXM tasarımlarına sahip 8 yollu konfigürasyonlarda sunacak

Tasarımdan başlayarak ana aracı, yeni nesil Infinity Fabric çözümü kullanılarak ara bağlantı katmanını barındıran pasif bir kalıpla yerleştirildi Bu çip yalnızca CDNA 3 mimarisine göre tasarlandı ve pek çok şey yapılıyor 6 TFLOP 768 GFLOP 512 GFLOP 384 GFLOP VRAM henüz bilinmiyor 192 GB HBM3 128 GB HBM2e 128 GB HBM2e 64 GB HBM2e 32GB HBM2 32GB HBM2 16GB HBM2 16GB HBM2 4GB HBM1 16 GB GDDR5 Hafıza saati henüz bilinmiyor 5,2 Gb/sn 3,2 Gb/sn 3,2 Gb/sn 3,2 Gb/sn 1200 MHz 1000 MHz 1000 MHz 945 MHz 500 MHz 1750 MHz Bellek Veriyolu henüz bilinmiyor 8192-bit 8192-bit 8192-bit 4096 bit 4096 bit veri yolu 4096 bit veri yolu 4096 bit veri yolu 2048 bit veri yolu 4096 bit veri yolu 256 bit veri yolu Bellek Bant Genişliği henüz bilinmiyor 5,2 TB/sn 3,2 TB/sn 3,2 TB/sn 1,6 TB/sn 1,23 TB/sn 1 TB/sn 1 TB/sn 484 GB/sn 512 GB/sn 224 GB/sn Form faktörü henüz bilinmiyor OAM OAM OAM Çift Yuvalı Kart Çift Yuvalı, Tam Uzunlukta Çift Yuvalı, Tam Uzunlukta Çift Yuvalı, Tam Uzunlukta Çift Yuvalı, Tam Uzunlukta Çift Yuvalı, Yarım Uzunlukta Tek Yuvalı, Tam Uzunlukta Soğutma henüz bilinmiyor Pasif Soğutma Pasif Soğutma Pasif Soğutma Pasif Soğutma Pasif Soğutma Pasif Soğutma Pasif Soğutma Pasif Soğutma Pasif Soğutma Pasif Soğutma TDP (Maks 7 TFLOP’lar FP32 Bilgisayar henüz bilinmiyor TBA 95,7 TFLOP 90,5 TFLOP 45 7 TFLOP’lar 13 Toplamda sekiz hesaplama kalıbı (GCD) vardır, bu da bize toplam 320 Bilgi İşlem ve 20 Aracı, sekiz HBM3 paketi, HBM paketleri arasında 16 yapay kalıp ve dört aktif kalıp içeren toplam 28 kalıp içerir ve bu aktif kalıpların her biri iki hesaplama kalıbı alır 6 TFLOP 11 CCD başına 8 çekirdek ve 16 iş parçacığı elde edersiniz, yani aktif kalıpta toplam 24 çekirdek ve 48 iş parçacığı bulunur Sektördeki kritik yapay zeka gereksinimi Ancak AMD’nin, yalnızca NVIDIA’ya alternatif olmayı değil, aynı zamanda yapay zeka segmentinde lider olmayı hedefleyen çok güçlü bir çözümü var ve MI300’ün bu başarıya ulaşmalarına yardımcı olabileceğini umuyoruz 080 13 Şu anda kesin olan bir şey var ki, AI müşterileri alabilecekleri neredeyse her şeyi silip süpürecek ve herkes bundan yararlanacak 480 çekirdek birim sağlar


AMD Instinct MI300X ve MI300A, yapay zeka segmentinde önümüzdeki ay piyasaya sürülecek en çok beklenen hızlandırıcılardan bazıları 5 TFLOP 7 Çip, tümü 153 Milyar transistöre (MI300X) kadar sunmak üzere bir araya getirilen 5nm ve 6nm IP’lerin bir karışımını barındıracak Bunların ne tür konfigürasyonlar içinde sunulacağını görmek ilginç olacak ve SXM kartları verilmiş olsa da, PCI-E form faktörlerinde de birkaç değişken bekleyebiliriz AMD’nin ilk tam teşekküllü yapay zeka başyapıtı hakkında pek çok beklenti var ve bugün size bu teknik harikadan neler bekleyebileceğimize dair bir özet sunmayı düşündük 456’ya kadar 14 MI300A’nın ambalajı, TCO için optimize edilmiş bellek kapasitelerini ve Zen 4 çekirdeklerini kullanması dışında MI300X’e çok benzer

Aktif kalıplardan birinde iki adet CDNA 3 GCD kesilip yerine kendi ayrı önbellek ve çekirdek IP havuzları sunan üç Zen 4 CCD yerleştirildi Ayrıca 24 MB L2 önbellek (çekirdek başına 1 MB) ve ayrı bir önbellek havuzu (CCD başına 32 MB) bulunmaktadır 3 TFLOP’lar 8 fazla

AMD Instinct MI300X, GPU Hızlandırmalı Yapay Zeka İş Yükleri için Tasarlanırken MI300A, Teknik Açıdan En Gelişmiş APU Paketiyle HPC ile Mücadele Ediyor

6 Aralık’ta AMD, ana gündemlerinden birinin MI300 kod adlı yeni nesil Instinct hızlandırıcı ailesinin tam olarak tanıtılması olduğu “Gelişen Yapay Zeka” açılış konuşmasına ev sahipliği yapacak

AMD Instinct MI300X – CDNA 3 ve Devasa Bellekle NVIDIA’nın Yapay Zeka Üstünlüğüne meydan okuyor

AMD Instinct MI300X, AI segmentindeki NVIDIA’nın Hopper ve Intel’in Gaudi hızlandırıcılarını açıkça hedef aldığından kesinlikle en çok öne çıkacak çiptir

AMD Instinct MI300X Hızlandırıcı

AMD Radeon Instinct Hızlandırıcıları
Hızlandırıcı Adı AMD Instinct MI400 AMD Instinct MI300 AMD Instinct MI250X AMD İçgüdü MI250 AMD İçgüdü MI210 AMD İçgüdü MI100 AMD Radeon Instinct MI60 AMD Radeon Instinct MI50 AMD Radeon Instinct MI25 AMD Radeon Instinct MI8 AMD Radeon Instinct MI6
CPU Mimarisi Zen 5 (Exascale APU) Zen 4 (Exascale APU) Yok Yok Yok Yok Yok Yok Yok Yok Yok
GPU Mimarisi CDNA 4 Su Vanjaramı (CDNA 3) Aldebaran (CDNA 2) Aldebaran (CDNA 2) Aldebaran (CDNA 2) Arkturus (CDNA 1) Vega 20 Vega 20 Vega 10 Fiji XT Polaris10
GPU İşlem Düğümü 4nm 5nm+6nm 6nm 6nm 6nm 7 nm FinFET 7 nm FinFET 7 nm FinFET 14 nm FinFET 28nm 14 nm FinFET
GPU Yongaları henüz bilinmiyor 8 (MCM) 2 (MCM)
1 (Kalıp Başına)
2 (MCM)
1 (Kalıp Başına)
2 (MCM)
1 (Kalıp Başına)
1 (Monolitik) 1 (Monolitik) 1 (Monolitik) 1 (Monolitik) 1 (Monolitik) 1 (Monolitik)
GPU Çekirdekleri henüz bilinmiyor 19 4 TFLOP’lar 6