Oyun Teknolojileri Delisi: 2019

1 Eylül 2019 Pazar

Xbox One X GPU x 4... Gercekten mi?

Bir onceki "next-gen unleashed" yazisini "Phil Spence'in aletin gucu Xbox One X'in 4 kati olacak" iddasini inceleyecegimizi belirterek bitirmistik. Ozellikle X1X'in GPU performansina bakarsak, bu cok iddali bir soylem aslinda. Ne de olsa eger Xbox One X'in GPU'yu 4 kat buyuteceksek, bu 24 Gflops'luk bir hesap gucune ve 1.3 TByte/sn'lik bir hafiza erisimi anlamina geliyor ki bugun en yuksek performans GPU'larda bile bu rakamlar yok. Yine de "yok yav, bu mumkun degil" deyip kestirip atmak yerine, bunun ne kadar mumkun olabilecegine bakacagiz bu yazida.. Ama bunun icin ilk once X1X GPU'sunun sahip oldugu Graphics Core Next (GCN), daha sonra da yeni konsollarda olacak RDNA-Navi mimarisine bakmamiz gerekiyor... GCN ile baslayalim....

Graphics Core Next (GCN).. Yada artik Graphics Core Previous?

AMD'nin GCN mimarisini 2010'larin basinda uc tane ana hedef etrafinda tasarlamisti:

GPU kaynaklari ile normal hesap islemlerini (compute tasks) en az silikon ile en fazla miktarda yapilabilmek
Grafik islemleri ile normal hesap islemlerini verimli bir sekilde bir arada yapilabilmek (ve bu sayede daha once bilgisayar ana islemcisi uzerinde calisan ve paralel isleme gerektiren bir cok islemi grafik ile paralel sekilde GPU uzerine tasimak).
CPU ile GPU'nun ortak bir hafiza alani tanimlayabilmesine ve dahasi CPU ve GPU'nun tam etkilesimine olanak saglamak.

AMD bu hedefler etrafinda tasarladigi GCN mimarisini ilk kez 2012'de 78x0 serisi grafik kartlari ile tanitti. O zaman cok buyuk bir atlamayi temsil ettigi icin oldukca basarili olan bu mimarinin ikinci generasyonu ise 2013'de piyasaya cikan hem Xbox One, hem de PS4'de kullanilmisti. Her iki konsolun mid-gen guncellemeleri de bazi iyilestirmelere ragmen ayni ozellikleri tasimaktadir. AMD, 2017'ye kadar bu mimariyi 3 kere daha guncellemistir. Bugun piyasadan alabileceginiz Radeon RX5x0 serisi (4. generasyon Polaris) ve Vega serisi (5. generasyon Vega) GCN mimarisi tabanli en guncel video kartlaridir. AMD'nin Arcturus adini tasiyan 6. generasyon yeni bir GCN mimarisi guncellemesi uzerinde calistigi da bilinmektedir. Bu yeni mimariyi tasiyan kartlarin yuksek hesap gucu hedefleyen workstation/server'lar icin 2020'de piyasaya cikaracagi tahmin edilmektedir [1]. GCN mimarisi icin daha detayli bilgi isin su web-linkine bakabilirsiniz [2].

GCN compute islemleri icin cok guclu bir mimari olmasina ragmen grafik islemleri icin de ayni verime sahip oldugunu soylemek maalesef cok dogru olmaz. AMD'nin en guncel GCN mimarisi olan Vega kartlarinda bile Nvidia karsitlari ile karsilastirdigimizda da oyunlar icin genel olarak oldukca buyuk bir performans eksikligi goze carpar. Misal NVidia'nin ~4 Tflops ve 192 GB/sn memory bandwidth'e sahip 1060 serisi GPU'su, AMD'nin 6 Tflops'luk ve 256 GB/sn bandwidth'e sahip Radeon 580 karti ile es gorunur ortalamada.. Benzer sekilde Nvidia'nin ~8.5 Tflops'luk ve yaklasik 320 GB/sn bandwdith'e sahip 1080 serisi GPU'su ile de AMD'nin 12.5 Tflops'luk ve 484 GB/sn bandwidth'e sahip Vega 64 karti kafa kafaya bir performansa sahipdir. Peki AMD'de hesap gucu/hafiza erisimi neredeyse 1.5 kata kadar daha yuksek gorunurken, nasil Nvidia cok daha dusuk gucteki kartlarla AMD ile ayni performansi verebilmektedir? Bu sorunun cevabi aslinda AMD'nin GCN'in ana mimarisini olusturan hesap unitesi (compute unit) ve hafiza mekanizmasini inceledigimizde ortaya cikiyor...

(Yazarin Notu: Bu noktada eger teknik kisimlari "ben almayayim" diyorsaniz, "Peki Ya Performans...." kismina atlayabilirsiniz, ama teknik kisimlar da oldukca ilginc.. O yuzden devam edin derim...)

GCN Hesap Unitesi (Compute Unit)

GCN'de her hesap unitesi (Compute Unit-CU) temelde su bloklara sahiptir:

her clock'da bir 32-bit sabit/kayan nokta carpma ve bir toplama islemi yapabilen 64 adet aritmetik-mantik unitesi (arithmetic-logic unit (ALU))
tek data uzerine islem yapan (bu 64 bit double precision kayan nokta islemi de olabilir) scalar unitesi
bir tane trigonometri/x^y tipi islem unitesi
hafizadan okuma/yazma yapan unite
4 adet texture ornekleyici
cesitli data ve islem komutlarinin tutuldugu hafiza cacheler

GCN mimarisinde bir hesap unitesi max performans calistigi zaman, her clock cycle icinde 128 tane islem yapabilir. Cok sayida hesap unitesi, yuksek saat frekanslarinda calistigi zaman da bu cok yuksek TFLops (saniyede trilyon islem) seviyelerine cikmak mumkun hale gelmektedir.

Peki biraz daha detaya dalalim: GCN'deki hesap unitesinin barindirdigi bu 64 vektor ALU unite aslinda 4x16 olacak sekilde 4 adet hesap alt-unitesine bolunur. SIMD16 olarak da adlandirilan bu her alt-unite uzerinde 16 elemanli vektorler uzerinde bagimsiz bir fonksiyon calistirilir. Bu fonksiyonlar AMD sozlugunde wavefront ve uzerinde islem yaptigi tek elemanlar ise thread olarak adlandirlir. Yani ozetle GCN'de ayni anda bir hesap unitesi uzerinde 4 wavefront'a ait program calistirilir ve her cycle'da bu dort adet fonksiyona ait birer komut, fonksiyonun uzerinde calistigi 16 adet elemanlik vektore 16 ALU uzerinde ayni anda uygulanir. Bu 16'lik vektor, 16 elemanli pixel(fragment)/vertex dizisi yada 16 elemana sahip bir hesap vektoru olabilir. Buraya kadar guzel, ama isler simdi karismaya basliyor, demistik ya en az kaynak/silikon ile en fazla isi yapacagiz...

GCN mimarisinde her wavefront aslinda 16 degil 64 elemandan olusmaktadir (Wave64 olarak adlandirilir). Yani her wavefront aslinda 64 pixel(fragment)/vertex dizisi yada 64'luk bir hesap vektorunden olusmasi gerekmektedir. Yani bir CU'ya aslinda 64 tane elemandan olusan bir vektor girer. GCN bir komut calistiracagi zaman bu 64 elemanlik vektoru once 4 parcaya boler ve her komut bu 16 elemanli 4 vektor uzerinde SIMD16 uzerinde sirayla 4 clock cycle'da calisir. Daha sonra yeni bir komut okunur ve o yeni komut da yine benzer sekilde 4 cycle icinde calistirilir, ve bu boyle devam eder. Simdi dikkat ederseniz, her alt-unite icin 4 cycle'da bir yeni bir komuta ihtiyac var ve hatirlarsaniz bir CU'yu da 4 alt-hesap unitesine bolmustuk. Bu da bir CU uzerinde sadece tek bir decoder olmasina olanak tanir.. Decoder ne derseniz; gelen programlardaki siradaki islemin ne olacagini ve bu islemin hangi register/data uzerinde calisacagini cozen birimdir. Her CU uzerindeki tek decoder, her clock icinde sirasi gelen alt-hesap unitesinin komutunu cozer ve bir sonraki alt-uniteye gecer. Bu sekilde aslinda bir CU uzerinde kosan 4 tane is icin sadece tek bir decoder yetmektedir. Epeyce silikon kurtardik..

Bunun disinda bu mimarinin bir baska ozelligi ise ayni anda 4 is paketi calistirabilmesine ragmen her bir alt-unite uzerinde aslinda 10 tane'ye kadar is paketi tutalabilmesidir (bir CU icin toplamda 40). Bunun en buyuk sebebi ise bir is unitesi ana hafizadaki bir dataya erismeye ihtiyac duydugu zaman oldukca uzun bir sure beklemek zorunda kalmasidir. Bu ozellikle GDDR5/HBM Ram ise bekleme suresi yuzlerce clock cycle'i bulabilir. Burada bir alt-hesap unitesini bu sure boyunca dondurmak yerine, GCN mevcut is paketini durdurur, data gelene kadar beklemeye alir ve hali hazirda bekleyen obur is paketlerinden bir tanesini calistirmaya baslar. Boylece bu hesap unitelerini olabildigince bos birakmamaya calisilir.

Aslinda bu mimari genel hatti ile oldukca guzel duruyor. Ozellikle her CU cok fazla silikon alani istemedigi icin ise 14/16nm yari-iletken uretim teknolojisinde 500mm2 silikon alanini asmadan GCN GPU'larda bu CU-hesap unite sayisi 64'e (Vega ve Fiji) ve clock rate'de 1.8 Ghz'e (Radeon 7) yaklasabildigi icin toplamda 13-14 TFlops (saniyede 13-14 trilyon matematik islemi) yapilabilmesi teorik olarak mumkun hale gelmektir. Kagit uzerinde super gozukse de ozellike grafik islemleri icin bu mimari o kadar da verimli olmuyor, neden dersek...

GCN'in Patladigi Nokta

Eger bir cycle icinde hem carpma hem toplama yapmazsaniz o zaman GPU'yu tam performans kullanmiyor demeksiniz. Bir cok grafik ve compute islemleri matrix-matrix yada matrix-vektor carpma islemleri kullandigi icin bu ozellik kullanilir, ama bu komutlarin kullanilmadigi yerler de az degil ve kullanilmadigi anda hesap gucunun yarisini masada birakiyorsunuz demektir.. Bunun disinda bu mekanizmayi kullanmak icin komutlari uygun siralamada calistirmaniz lazim, yoksa yine tam performans alamiyorsunuz..
Eger bir Wave64 icine 64 elemanlik bir vektor paketlenemiyorsa is yine de kosturulur. Fakat bu durumda sistem, kullanilmayan elemanlari isaretleyerek o elemanlar icin islem yapmaz. Yani o elemanlara denk gelen ALU'lar bos oturur. Ozellikle fragment/pixel shading'de bu durum bolca oluyor..
Eger bir Wave64 icinde datanin durumuna gore bir kosullu islem yapilmasi gerekiyorsa, her iki kosulda o kosulu saglayan alt-kumeler uzerinde sirayla kosturulur. (2) numarada oldugu gibi bir kosul kosturuldugu noktada o kosulu saglamayan alt kume isaretlenir ve o elemanlara denk gelen ALU'lar yine bos oturur..
Eger bir scalar register uzerinde hesaplanmasi gereken bir komut gelirse, komutun sonucu tek cycle'da biterken, tum vektor ALU'lar 4 cycle boyunca yine bos bos otururlar..
Ozellikle islemler arasi bekleme gereksinimi oldugunda bu bekleme hep 4 cycle katinda olmaktadir.
Sistem uzerinde scalar, vektor ve trigonometri/x^y islemi yapabilen bloklar birbirinden ayri olmasina ragmen bunlar hic bir zaman paralel calistirilmazlar.

Gordugunuz gibi epey bir durumda aslinda bu yuksek hesap gucu olan uniteler tam kapasite kullanilmazlar, ama sorun sadece burada da bitmiyor.. En dramatigini en sona biraktim: Her CU unitesinde belli bir miktarda bir register dosyasi vardir. Bu GCN mimarisinde bir hesap unitesi icin 64 KB ile sinirlidir. Tum bekleyen 40 adet is icin ayrilmis tum register'lar bu 64 KB icinde tutulmasi gerekmektedir. Ayrica vektor registerlar her zaman 4 elemanli oldugu dusunuldugu icin (grafik girdisi olan pixel'ler icin "RGBA" yada vertexler icin "XYZW") ve her eleman da 4 byte'lik single-precision kayan-nokta rakami olarak tutuldugu icin, toplam register sayisi aslinda sadece 4096 tanedir. Simdi her wavefront ile gelen 64 eleman oldugunu dusunurseniz, ayni anda en fazla 64 tane degisik register tanimlayabilirsiniz, yani bu 64 registeri bekleyen tum islere bolmek zorundasiniz.. Simdi elinizde 40 tane is varsa, bu is basina 1.6 register eder. Bu demektir ki bir task cok daha fazla register kullaniyorsa (ki bu hemen her shader icin gecerli bir durumdur bu), o zaman atayabilecegiz is paketi sayisi epeyce sinirlandi demektir. Misal bir wavefront ortalama boyle 8 register kullaniyorsa o zaman atanabilcek is sayisi bir anda 40'dan 8'e duser. Simdi bir de bu isler hep grafik agirlikli ve texture okuma isteyen isler ise ve siz de hafizadan data bekleyen is yerine baska is atayamiyorsaniz, tum hesap unitesi bir anda bekleme durumunda kalabilir. Bu en fena durum aslinda..

AMD iste bu yuzden aslinda GCN'in en onemli ozelliginin "asynchronous compute" oldugunu one cikarmaya calisiyordu yillardir. Yani diyordu ki, misal bir hesap unitesine bir-iki grafik isi atiyorsaniz, yaninda da hafizaya az erisim yapan ve cok register kullanmayan epey fazla genel hesap isleri de atayin ki bu uniteler tam performans calissin (fizik motoru/AI gibi). Gercekten bunu yapan oyunlar ve cesitli hesap uygulamalari var. Bunlara baktiginiz zaman tum GCN mimariyi tasiyan kartlarin uctugunu goruyorsunuz..Vega 64 de, R580 de bir anda 1080 ve 1060'in fersah fersah onune gecmeye basliyor: Misal Vega 64'un RTX 2070 ile, R580'in de GTX 1070 ile kafa kafaya oldugu oyunlar var... Ama bunlar cok sinirli ve muhtemelen bu tip bir optimizasyon Nvidia icin cok bir avantaj getirmedigi icin de developerlar motorlarini o sekilde tasarlamiyorlar ve bu durum da hem AMD ve haliyle de mevcut konsollarin da elini kolunu yillardir baglamis durumda..

Peki karanlik bulutlari dagitalim artik...

Radeon-DNA Nam-i Diger RDNA...

Aslinda epey suredir AMD'nin yol haritasinda Navi serisi de 6. generasyon GCN mimarisi olarak gorunuyordu. Ama muhtemelen son 2-3 yil icerisinde bu yeni mimari uzerinde calismalari oldukca olgun hale geldi ki, son bir sene icinde Navi adi yeni mimari olan RDNA ile anilmaya baslandi. Aslinda bu mimari ile cikan ilk grafik kartlarina (Radeon 5700 serisi) baktigimiz zaman ozellik olarak Vega ile neredeyse birebir ayni oldugunu gorunuyoruz. Nvidia'nin Turing serisinde oldugu gibi "variable rate shading", "ray tracing" yada "neural network inference" islemlerini hizlandirma gibi hic bir yenilik yok. Ama su yukarida yazdigim problemleri gidermek cok daha onemli oldugu icin, ilk generasyon RDNA ile AMD ilk olarak grafikteki performans sorununu cozmeye saldirmis durumda. Peki degisiklikler ne, biz simdi ona bakalim. RDNA'nin aslinda GCN'e gore getirdigi sekiz tane onemli yenilik var:

Wavefront yapisi olarak Wave64'un yerini Wave32 almis durumda; yani artik bir is paketi 64 eleman yerine 32 elemanli vektorlerden olusuyor. Oyle olunca yukaridaki (2) ve (3)'den olusan kayip olasiligi yari yariya iniyor..
RDNA, GCN mimarisinin Wave64 paketleri dorde bolme ve SIMD16 uzerinde calistirma mekanizmasi tersine, Wave32 paketlerini 32 tane ALU iceren bir SIMD32 alt-unite uzerinde calisiyor. Yani artik 4 cycle'da 64 eleman uzerinde tamamlanan islem yerine, tek cycle'da 32 eleman uzerinde tamamlanan islemler geliyor. Islemler artik tek cycle'da tamamlandigi icin her alt-unite icin ayri bir decoder var. Yani bir CU uzerinde artik tek bir komut decoder degil, cift decoder calisiyor. Biraz silikon miktarini arttirdik ama komut gecikmesi 4 cycle'dan tek cycle'a indi..
Komutlar tek cycle'da calistigi icin scalar islemler de tam performans yapilabiliyor. Ozellikle birden cok pespese yapilan scalar islemler artik dortte bir zaman aliyor ve vektor ALU'lardaki bekleme kaybi da yine 4 cycle yerine sadece tek cycle'a inmis durumda. Tabii decoder gibi artik her alt-unitenin artik kendi scalar unitesi de var.
Artik is paketleri 32'lik elemanlara indigi icin bu register dosyasi uzerindeki baskiyi da epey azaltiyor. Bunun disinda alt unite icin olan maksimum is miktari 10 olarak korunuyor, ama bir CU uzerindeki alt unite sayisi ikiye indigi icin, toplam is sayisi tum CU icin 20'ye inmis durumda. O yuzden yukaridaki orneklerden gitmeye devam edersek, artik maksimum sayi olan 20 is icin 6.4 register varken, 8 register kullanan is paketleri icin de atanabilen is sayisi 8'den 16'ya cikmis durumda. Yani aslinda bir CU'u cok daha verimli kullanmak mumkun hale gelmis ve beklemelerde arayi dolduracak isleri bulmak daha kolaymis. Buradaki kayip da ciddi azalacak demektir.
Bu yeni mimari de iki hesap unitesi aslinda bir "Work Processing Group (WGP)" olan bir yapi altinda toplaniyor ve iki hesap unitesi icin register dosyasi, aslinda bazi sinirlamalar ile x2 genislikte bir register dosyasi olarak da kullanilabiliyor. Boyle olunca aslinda yukarida verdigim, is basina dusen register miktarini da, bazi durumlarda x2 olarak da arttirmayi mumkun hale getiriyor. Yani baski gerektiginde daha da azaltilabiliyor.
Wave64 artik iki tane cycle'da calisan Wave32'e indirgenmis durumda.. Ama bunun daha guzeli, ozellikle iki pespese komut arasindaki etkilesimden dolayi bir sonrakinin bekletilmesi gerektigi durumlarda wave64 aslinda o beklemeleri biraz daha efektif hale getirmis oluyor. O yuzden Wave64'ler bile hala GCN'deki haline gore daha avantajli.
Trigonometri/x^y tipi komutlar hala 4 cycle sure aliyor, ama kendinden sonra gelen komutlari etkilememesi durumunda, obur komutlarin calismasini bloke etmiyor. Bu sekilde en azindan bu komutlar ile scalar/vektor komutlari ile paralel calistirilabiliyorlar. Bu GPU'lara da "siralamadan bagimsiz calistirma" (out-of-order execution) ozelliginin yavas yavas geliyor olmasi demek..
Hafizadan okuma ve yazma islemleri icin bir yerine artik iki ayri unite var. Bunlar da birbirinden ayrildigi icin yazma/okuma gerekliligini dengeleyen shaderlar burada cok daha verimli calisabiliyorlar..

Iste tum bu degisiklikler aslinda RDNA hesap unitelerinin, GCN hesap unitelerine gore cok daha verimli ve efektif kullanilabilmesine olanak sagliyor. Bu acidan bakildiginda AMD'nin gosterdigi su asagidaki slayt'a bakarsaniz, bazi is paketleri icin iyilesme cok ama cok drastik... ve iyilesmeler sadece bununla da sinirli degil...

Hesap Unitelerini beslemek...

GCN'in yukarida yazdigim sorunlari disinda aslinda bir baska buyuk problemi daha var. O da hafiza erisim yetersizligi. Yukarida verdigim orneklerde hesap unitesi uzerindeki tum isler hafiza erisimi yaptigi zaman bekleme durumunda kaliyor gibi yazmistim. Ama durum tam olarak da oyle degil: Ana hafizadan once aslinda arada her CU'nun sahip oldugu bir L1 hafiza cache'si, onda olmayan datalar icin bir de tum CU'larin bagli oldugu oldukca buyuk (Vega icin 4 MB) bir L2 hafiza cache'si var. Ulasilmak istenen data her ikisinde de olmamasi durumunda aslinda ana hafizaya ulasilmasi ihtiyaci oluyor. Ama ona ragmen GCN mimarisi tasiyan grafik kartlarina baktiginizda genel olarak mevcut bandwidth'in yine de hep yetmedigi goruluyor. Bunun disinda aslinda ana hafizaya erisim yapildigi zaman sadece istenen data degil, o datanin cevresindeki hafiza alanlari da L2 cache'e tasinir.. Eger programcilar grafik motorunu bu datayi da kullanacak sekilde verimli yazmazlarsa o zaman problemler daha da buyur ve her hesap unitesine gerekli datalar gelene kadar ALU'lar epey bos oturabilirler.

Vega serisinde hafiza bandwidth acisindan daha zorlayici olan oyun benchmarklarina baktiginiz zaman Vega mimarisinin hafiza erisim bandwidth'i arttigi zaman GPU performansinin da arttigini gorebiliyorsunuz. Buna en guzel ornek aslinda Vega-64 ile Radeon-7 gosterilebilir. Ikisi de ayni mimariyi tasimasina ragmen ve ayni clock'da calistigi durumda bile Radeon 7, Vega64'e gore %15-25 arasinda daha yuksek performans gosterebiliyor [3]. Bu fark isin dogrusu iki kat memory bandwidth'e sahip Radeon 7'nin bu compute uniteleri cok daha efektif besleyebilmesinden geliyor diye dusunuyorum. Benzer sekilde Xbox One X'deki Scorpio silikonu da aslinda 40 hesap unitesi tasiyan GCN GPU'lar icinde ~320 GB/sn bandwidth ile en yuksek memory bandwidth'e sahip GPU. R580'e gore daha eski GCN mimarisine sahip olmasina ragmen ayni miktarda hesap kapasitesi ile (6 TFlops) ozellikle 4K'yi cok daha verimli olarak calistirabildigi gorulmektedir.

Nvidia bu soruna Maxwell serisinden beridir guzel bir cozum bulmus durumda. Nvidia cozumunde ilk once vertex/ucgenler uzerindeki islemler uygulanir ve sonra bu ucgenlerin ekranda nereye dustugu ve en ustte hangisi kaldigi belirlenir. Ikinci asamada bu gorunur olan ucgenlerin ihtiyac duydugu hafiza kaynaklari belirlenir. Ucuncu asamada ekran bu ucgenler ve ihtiyac duydugu kaynaklarin L2 cache'e sigacagi sekilde bolunur. En son asamada ise her bolunen kisim icin sirayla once kaynaklar ana hafizadan L2'e cache tasinir ve tasindiktan sonra da hesap uniteleri uzerinde islenmeye baslar. "Tile-based rasterization and binning" olarak da gecen bu mekanizmanin en buyuk avantaji, tum sistem bazinda hafiza erisimini cok efektif halde tutmakta ve hesap uniteleri ile hafiza erisimi arasindaki sureden dogan gecikmeyi ciddi sekilde azaltmaktadir. Nvidia Maxwell mimarisinden itibarek bunu cok iyi kullanmisti ve acikcasi hem mobil islemciler de, hem de desktop'da AMD'nin onune gecebilmesinde cok buyuk katkisi olmustur.. AMD de aslinda Vega serisinde benzer bir ozelligi GCN mimarisine de eklemisti. "Draw Stream Binning Rasterizer (DSBR)" olarak gecen bu metodun da benzer sekilde calisacagi aciklanmisti. Ama ya cesitli buglari oldugu icin bunu kullanima alamadilar, yada gercekten Wave64 ile buyuk bir avantaj getirmedi.

Simdi tekrar RDNA'ya donelim.. RDNA'da da, Vega ve Nvidia Maxwell sonrasinda olan GPU'lardaki bu tiled-based rendering mekanizmasi var ve cok muhtemelen AMD sonunda bunu calisir hale getirmis durumda. Ama AMD burada durmamis, daha once her CU icin ayrilmis olan L1 cache, RDNA'de x2 boyutta L0 cache olarak geliyor. Bunun yaninda her CU icin ayrilan instruction ve data cache'lerin boyutu da iki katina cikmis durumda. Bunun yaninda her 10 CU tasiyan "shader array" icin ayrilmis 128 KB boyutunda bir L1 cache var. Bu ozellikle birden fazla hesap unitesi bir arada benzer isler uzerinde calistigi zaman buyuk avantaj getiriyor. L2 cache burada artik ucuncu seviyede. Tile-based rendering disinda bir de kopyalama icin yapilan islemler icin de L2 cache kullanilabilir hale gelmis. AMD'nin dedigine gore artik L2 cache'i komple bosaltma durumlari tum GCN mimarisine sahip GPUlar ile karsilastirildiginda cok cok azalmis durumda..

RDNA'nin hafiza erisim avantajlari sadece bunlarla da sinirli degil: GCN mimarisinde renk ve derinlik bilgisi bir sikistirma islemi uygulandiktan sonra ana hafizaya yazilir ve ana hafizadan tekrar okunmasi durumunda da sikismis dataya acma islemi uygulanir. Tum chip icinde ise data bu gercek hali ile transfer edilir. RDNA'da ise chip icindeki neredeyse her blokun (hesap uniteleri de dahil) bu datalari sikistirma ve acma yetisi var. Boyle olunca chip icindeki data transferleri de sikistirilmis data uzerinden yapildigi icin mevcut bandwidth daha da verimli kullanilabilir hale gelmis. Bunun yaninda tabii sikistma algoritmalarini da onceki mimarilere gore gelistirdikleri icin, o acidan da ektra bir avantaji var. Bu ikisi bir araya geldiginde tile-based rendering cok daha verimli hale geliyor, cunku L2 cache'de tutulan bilgiler sikistirilmis hali ile tutulacagi icin ekrani daha az bolume ayirmasi da yetecek demektir.

Performans kismina girmeden once eger mimariler ve gelismeler hakkinda detayli bir sunum ve yazi okumak isterseniz su iki web linki mutlaka okumanizi oneriririm [4, 5].

Peki ya Performans...

Yukarida anlattigim gibi AMD bu yeni mimari ile iki problemi ayni anda cozmus: Hem uniteleri ozellikle tek isi cok daha verimli yapacak, beklemeleri azaltacak ve daha cok is atayabilecek hale getirmis, hem de ozellikle grafik islemlerinde bu unitelerin ihtiyac duyacagi datayi da unitelere verimli besleyecek mekanizmalari yerine koymuslar..

Genel olarak PC oyun benchmarklarina bakildiginda 7.5 TFlops/448 GB/sn hafiza bandwidth'e sahip Radeon 5700 grafik karti, 12.5 TFlops/484 GB/sn'e sahip Vega 64 ile ya esit peformans yada %20'e kadar bir performans artisi sunmus gorunuyor [6, 7]. Yani AMD yaklasik ayni hafiza bandwidth ile neredeyse 7.5 Tflops'luk bir RDNA GPU ile 12.5 TFlops'luk bir GPU'yu gecer hale gelmis, en azindan mevcut oyun motorlari icin. Bu da GCN ile karsilastirildiginda, ayni speclerdeki GPU icin RDNA ile %80'lik bir performans artisini alinabildigini gosteriyor. Ustelik de bu GCN mimarisinin en iyi ve en gelismis olani ile karsilastirildiginda.. Unutmayin PS4 ve XB1 o mimariye gore uc generasyon daha eski...

Bir diger faktor ise hafiza bandwidth gereksinimi. Bir baska benchmark'a [8] bakildiginda neredeyse hic bir oyun icin 5700XT'nin saat frekansi iyice artmadan bir hafiza bandwidth erisimi sinirlamasi gozukmuyor. Hafiza erisim miktari ayni olmasina ragmen GPU saat frekansi arttirilmasi durumunda %12-%18 arasinda bir ek hizlanma da goze carpiyor ve sanki sinirlamanin pixel fillrate'den oldugu gorunuyor. Yani pixel fillrate sinirladiktan sonra, extra hesap gucu de daha fazla bir hizlanma getirmiyor. Buradan ters tarafa gidersek, aslinda 5700'un sahip oldugu memory bandwidth gereksiz yuksek oldugunu gosteriyor ve 5700'un yaklasik ~380 GB/sn ile de benzer performans alinabilecegini gosteriyor. O acidan da dusunuldugunde aslinda hafiza kullanimi da %20-25 daha efektif olmus durumda GCN'in en iyi mimarisine gore.

AMD bu sefer becermis sanki....

Next-Gen Konsollar..

Uzun surdu ama beni en cok heyecanlandiran kisma geldik. Burada aslinda mevcut konsollardaki GPU'lar ile birebir bir karsilastirma yapmak maalesef mumkun degil. Ama isin ozu PS4 ve XB1'de bulunan 2. generasyon GCN'den, muhtemelen 1. ile 2. generasyon arasinda bir yerdeki RDNA'a atliyor olacagiz. Vega ile karsilastirmaya bakildiginda %20 daha az hafiza bandwidth ile neredeyse %80 iyilestirme getiren bir mimari, ondan cok daha eski bir mimariye sahip GPU'lar ile karsilastirildiginda daha da fazla bir iyilestirme getirecegi kesin gibi. O yuzden misal 6 Tflops ve ~320 GB/sn sahip bir RDNA GPU ile muhtmelen X1X'e gore rahat x2 performans alinmasi gayet mumkun duruyor.

Peki yeni konsollarin RDNA spesificasyonu ne olabilir: Isin dogrusu burasi biraz destekli kestirim. Ama gecmise bakarak ve su anki yari-iletken performans/fiyatlandirmaya bakarak bir tahmin yapabiliriz. Bugun RDNA/Navi ve Zen2'nin temel aldigi process teknolojisi 7nm. Su an Sony ve MS'un konsollarinda kullanilan islemci yongalari ise 14/16 nm teknolojiyi kullaniyor. Su anda okudugumuz kadari ile 7nm uretim, 14/16nm uretime gore %30-50 arasinda daha pahali [9]. Bu da Sony ve MS mevcut konsollarin maliyetini sadece makul miktarda arttirmayi hedefliyorsa istiyorsa, o zaman chip boyutunu %25-%35 azaltmasi demek oluyor. Bu da Sony icin chip boyutunu 220-250mm2'ye, MS icinse 240-270 mm2 civarlarina koyuyor.

Su an piyasada olan Navi10'un chip boyutu 251 mm2, Zen2 islemcisinin de 80mm2 civarinda. Yani aslinda boyutlari kucultmuyor olsak, ikisinin toplami PS4Pro islemcisi ile ayni seviyeye geliyor. Ama boyut kucultuyorsak, bu her iki mimariyi de bir miktar kirpmak zorunda oldugumuz anlamina geliyor. Buradaki ilk hedef Zen2'nin 32 MB'lik cok buyuk L3 cache'si olacaktir. Simdilik sizan bilgiler de Zen2'de L3 cache'in next-gen konsollar icin 8 MB'a indigi yolunda. Eger bu dogru ise 80mm2 yaklasik 40mm2'e indi demektir. Ama hala en az bir 40 mm2 eksigimiz var. Benim tahminim bugun Navi10'larda olan 10 hesap unitesi tasiyan 4 shader array'in yeni generasyon konsollarda 12 hesap unitesi tasiyan 3 shader array'e inecegi yonunde. Su anda giris seviye olan Navi14 GPU icin de benzer bir yapi oldugu konusuluyor [10] ve ben next-gen konsollara da bu sekilde girecegini dusunuyorum. Bu sayede Navi10'da olan chip layout'u da cok degistirmeden ve performanstan da cok odun vermeyen bir konsol SoC'u AMD cikarabilecektir (Maalesef geometri isleme dortte bir azalacaktir ama).

Bir diger tahminim ise uretimden cikan chiplerin buyuk cogunlugunu kullanabilmek icin 36 hesap unitesinden sadece 32 tanesinin kullanilabilir durumda olmasi (Ps4Pro ve X1X'de de bu sekilde 4 tane hesap unitesi kapalidir). Yine sizintilara bakarsak GPU'nun hizinin 1.8 Ghz olacagi ongoruluyor ki bu 32 hesap unitesi ile ~7.37 Tflops islem yetenegi demek. Bu hesap gucunu destekleyecek render-operator sayisi da muhtemelen 60 olacak (64 yerine) ve cok muhtemelen memory bandwidth'de 384 GB/sn civarinda olacak. Boylece mevcut konsollardaki 14 Gb/sn moduller yerine Sony ve MS'in daha hesapli olan 12 Gb/sn GDDR6 modulleri kullanmasi da olanakli hale gelecektir. Ozetle 5700 serisi grafik karti performansina bakiyoruz aslinda..

Simdi az once 6 Tflops/320 GB/sn memory bandwidth'e sahip bir GPU'nun X1X'e gore x2 hizli olacagini soylemistik.. 7.4 TFlops, bunun uzerine extra bir %25 performans daha koyuyor. Yani X1X'e gore goreceli olarak x2.5 bir performans farki olacagi soylenebilir.

Bu yukarida yazdiklarimdan daha iyisi de olmasi olasi tabii.. Mesela 7nm EUV ile ayni alana %20'e yakin bir ek transistor paketlenebilecegi soyleniyor [11]. Buda 36 CU yerine 48 CU'ya cikma anlamina gelebilir.. Her iki sirkette bu sekilde hesap unitesi sayisini arttirma yoluna gidebilirler. Ama PC'deki benchmarkin gosterdigine gore bu tip artislar beraberinde memory bandwidth'in de pixel fill-rate'in de arttirilmasini gerektiriyor. Bu baglamda o zaman ya daha henuz piyasada yeni yeni gozukmeye baslayan 16 Gb/sn moduller kullanilmasi lazim, yada bus genisliginin 320/384 bit'e cikmasi.. Bu artisin getirecegi maliyet disinda, artacak sogutma gereksinimi de cabasi.. Tum bunlarin konsol fiyatlarini ciddi arttiracagi icin ben pek ihtimal vermiyorum, ama kimbilir belki bir supriz yaparlar..

x4 Pek Mumkun Degil Sanki.. Ama ya "Secret Sauce"'lar

Peki en basa donelim.. Hala x4'den uzagiz ama degil mi? Ama bizi ona yaklastiran baska extra iyilestirmeler de var.. Mesela yeni konsollarda olacagi soylenen "variable rate shading", ekranda insanlarin cok konsantre olmadiklari yada cok hizli degisen bolgeleri daha dusuk kalite ile render edilmesine olanak veren bir teknik [12]: Bu ozellik hem PS5, hem de Xbox Scarlett icin olacagi aciklanmis durumda. Bu ozelligi PC kartlarinda simdilik sadece Turing serisi Nvidia GPU'lar ve bu kis cikacagi aciklanan Intel'in Ice Lake serisi islemcilerinde olan integrated Gen11 grafik chipleri destekliyor. Bu ozelligi destekleyen ilk cikan oyunlarda bunun %6-17 arasinda bir performans artisi getirdigi gosterilmis [13].. Muhtemelen buradan x1.1-x1.2 arasi bir performans kazaniyor olacagiz..

Bir baska performans iyilestirici ozellik ise x2 hizda islem yapmaya olanak veren "rapid-packed" math. Bu metot su anda bu generasyon piyasada olan konsollardan sadece Ps4 Pro'da (ve tabii Switch de) var ve bu teknigi belli islemler icin bir kac oyun motorunun kullandigini da biliyoruz. Buradaki ozellik ise vektor islemlerde ayni clock icinde bir tane single-precision kayan-nokta aritmetik islemi yapmak yerine iki tane 16 bit half-precision kayan-nokta islemi yapilmasi. Bu ozelligin guzel tarafi ise hem extra bir hafiza erisimi, hem de extra bir register alani istememesi.. Yani bu islemi yapacak silikon alani disinda extra bir gereksinim yok. Bu ozellik, grafik motorlarinda screen-space post-process islemlerini cok hizlandirabilmesi yaninda derin ogrenme tabanli metodlari da yine iki kat hizlandirdigi biliniyor ve AMD bu rapid-packed math icin RDNA'e epey bir yeni ozellik eklemis durumda.. Bunun da developerlarin bahsettigi kadari ile yine ek bir %10-%15 arasinda bir ek hizlanma getirecegi soyleniyor. PC uzerinde hem Vega, hem RDNA grafik kartlari, Nvidia tarafinda ise Maxwell'den beri desteklendigi icin artik cok muhtemelen yeni konsollarda da standart ozellik olarak desteklenecektir. Buradan da bir x1.1-x1.15 arasi kazandik.

Daha "secret sauce"'lara bile gelmeden bu ikisinin getirecegi iyilestirmeler ile X1X'e gore performans artisi x3 ile x3.5 arasina cikardi bile.

Genelde hem Sony hem MS, aslinda islemleri bir miktar daha hizlandirmaya olanak verecek eklemeler de getiriyor konsollarda. Benim aklima ilk gelen Sony'nin PS4Pro'da getirdigi checkerboard islemlerini hizlandiracak eklemeler ve MS'un da Scorpio'ya getirdigi hafiza uzerindeki baskiyi azaltacak teknikler.. Her iki konsol ureticisi bu tip iyilestirmeler ile bu geride kalan %15-%30 extra iyilesmeyi getirebilir.. O zaman, evet, X1X'e gore x4 iyilesmeyi gormus oluruz.

Sonuc olarak x4 iyilesmeyi basaramasalar bile ona yaklasacaklari kesin.. Bu GPU'ya uygun bir CPU ile su an zaten cok guzel gorununen bir cok oyunun cok rahat 4K60 calismasi mumkun hale gelecek bence... Ama CPU tarafindaki iyilesmeler de aslinda yeni konsollarin bu noktada kalmayacagini, muhtemelen 1080p120 ve 1440p90'i da cok rahat yapabileceklerini gosteriyor.. Ustelilik de next-gen oyunlar icin de daha hala epey bir gelisme alani da kalacak sanki. Sony ve MS'un bahsettigi 8K'yi bilmem, ama hem 4K icin hem de VR sistemler icin cok ideal konsollar geliyor artik..

ve Son Olarak Ray-Tracing...

Aslinda su noktaya kadar hep bu yeni mimarinin hesap gucunden bahsettik. Ama bence en onemli olan bu yeni mimariye eklenecek olan donanim ray-tracing destek ozelligi. Bir cok developer hizdan cok bu ozelligin en buyuk kalite farki yaratacagindan bahsediyor. Neden derseniz, aslinda mevcut grafik motorlarinda bir cok hack ile cozumlenmis genel isiklandirma, kirinim, yansima, gecirgenlik, golgeleme gibi bir cok etkinin fiziksel olarak cok daha dogru bir sekilde modellenebilmesi artik bu sekilde mumkun olacak. 2019/GamesCom'da gosterilen ve bu kis cikacak pek cok oyunda donanim ray-tracing desteginin geldigi goruluyor ve kalite farki da hic de az degil. Ornek gomek isterseniz yazinin sonundaki Metro Exodus, Control ve klasik rasterizer yerine tum islemleri path tracing uzerinden yapan Minecraft videolarina bakabilirsiniz..

Konsol uretici tarafina gelirsek MS cok net olarak Xbox Scarlett'de donanim olarak ray-tracing hizlandirici olacagini soyledi. Bu zaten beklenen birseydi, cunku daha ortada hic bir donanim yokken Windows 10'a DXR altinda ray-tracing hizlandirici bir DX eklenti arayuzu aciklamislardi ve cok kisa bir sure sonra da Nvidia ile beraber Turing serisi tanitirken, DXR icin baska donanimlar da olacagini vurgulamislardi. O yuzden next-gen Xbox'da donanim ray-tracing olacagi kesin gibi.

Sony tarafina gelirsek donanim ray-tracing'in olup olmayacagi hala cok kesin degil.. Her ne kadar okudugumuz bir cok yazida Sony tarafinda da donanim ray-tracing destegi olacagi yazmasina ragmen, cikan sizintilar Sony'nin daha vanilla bir Navi10 tasidigi yonunde ve PS5 ana mimari Mark Cerny ile yapilan soyleside de Cerny grafik ray-tracing'e pek vurgu yapmadan, next-gen Playstation'da raytracing'in audio icin olacagini vurgulamisti. AMD'nin son cikardigi Navi whitepaper'da da ayni "raytracing audio" ozelligi hakkinda bilgi veriliyor, yani AMD tarafinda da aciklama Sony'nin acikladiklari ile paralel simdilik [4]. Tabii bu daha AMD'nin donanim raytracing ozelligini tanitmadigindan da olabilir.. O yuzden PS5'de donanim ray-tracing destegi hala tam net degil.

Ozetle..

Ps4 ve Xbox One ciktigi zaman cok buyuk hayal kirikligina ugramistim.. Her ikisi de daha aciklandigi gun o anda piyasada olan orta-ayar performansi veren grafik kartlari ayarinda oldugunu gormustuk (hele Xbox One orta-ayar ile giris-seviye arasinda idi). Su anda ise en azindan ilk aciklandiklarinda gunumuzde piyasadaki yuksek seviye GPU'lar ile basabas gorunuyorlar.. Ozellikle konsol spesifik optimizasyonlari da goz onunde bulundurursak, sanki 5700XT ile RTX 2070 SUPER civarinda bir performasi goruyor olacagiz.. O acidan bizi cok leziz gercek 4K konsollar bekliyor artik..

Bir sonraki yazida da CPU'ya geliyoruz.. Orada da mevcut konsollara gore saglam iyilesme var.. Orasi da heyecanli :)

[1] https://www.tomshardware.com/news/amd-arcturus-vega-gpu-support,39935.html
[2] https://en.wikipedia.org/wiki/Graphics_Core_Next
[3] https://www.anandtech.com/show/13923/the-amd-radeon-vii-review/18
[4] https://www.amd.com/system/files/documents/rdna-whitepaper.pdf
[5] https://gpuopen.com/wp-content/uploads/2019/08/RDNA_Architecture_public.pdf
[6] https://www.anandtech.com/show/14618/the-amd-radeon-rx-5700-xt-rx-5700-review
[7] https://www.eurogamer.net/articles/digitalfoundry-2019-amd-radeon-rx-5700-rx-5700-xt-review-head-to-head-with-nvidia-super
[8] https://www.guru3d.com/articles-pages/asus-radeon-rx-5700-xt-rog-strix-review,1.html
[9] https://www.icknowledge.com/news/Technology%20and%20Cost%20Trends%20at%20Advanced%20Nodes%20-%20Revised.pdf
[10] https://wccftech.com/amd-navi-14-gpu-radeon-rx-graphics-card-performance-leak/
[11] https://www.techspot.com/news/80237-tsmc-7nm-production-improves-performance-10.html
[12] https://developer.nvidia.com/vrworks/graphics/variablerateshading
[13] https://www.nvidia.com/en-us/geforce/news/nvidia-adaptive-shading-a-deep-dive/

Videolar

Metro Exodus

Control

Path-Tracer Minecraft

Star Wars Demo

19 Haziran 2019 Çarşamba

Next-gen Unleashed...

Bir E3'u daha geride biraktik.. Yazacak o kadar cok sey var ki.. Stavia, Navi, bir suru oyun... Onlardan once ama en cok heyecanlandiranla baslayalim..

Aslinda bu yaziyi "Scarlett Teased" diye yazacaktim.. Malum Sony'den sonra MS da kartlari cok acmamakla beraber next-gen icin ilk tanitimini yapti.. Ama sonra baktim ki Sony'nin aciklamalari ile cok fazla karsilastirma yapiyorum ve ikisi de o kadar cok paralel ki, yaziyi genel olarak next-gen makinalar icin degistirmek daha anlamli oldu.. O yuzden yazi hem Project Scarlett hem de Sony'nin adi cok buyuk ihtimalle PS5 olacak next-gen'ini de kapsiyor olacak.. Ikincisi ise yaziyi yazarken ozellikle CPU ve GPU icin oldukca detaya girdigimi ve genel bir giris yazisindan oldukca uzaklastigimi gordum. Oyle olunca bu iki basligi kendi yazi basliklarina tasimaya karar verdim. O yuzden bu yazida sadece kisa bir ozet olacak bu iki konuda..

Once bilinenlerle baslayalim: Her iki konsolda aciklandigi kadari ile AMD'nin en son model mimarileri olan CPU icin Zen 2 ve GPU icin Navi mimarisini kullaniyor.. Ikisi de AMD'nin E3 ve Computex esnasinda acikladigi benchmark sonuclarinda gozuktugu kadari ile kendi klasmanlarinda hem Intel hem de Nvidia'ya kafa tutabilecek gibi duruyor..O yuzden yedi senedir bizimle beraber olan eski teknoloji GPU mimarisinden ve tablet icin tasarlanmis olan oldukca dusuk spec'li CPU'dan kurtuluyoruz artik.. Phil Spence'in sunumunda X1X'e oranla x4 performans artisi getirecegi iddaasi disinda performans konusunda cok bir bilgimiz yok.. Ama her iki mimarinin de tanitilmasi ve bu urunleri kullanan CPU ve GPU'lar hakkinda benchmark bilgilerinin verildiginden dolayi bunun ne kadar dogru olabilecegini dedigim gibi iki yazida daha detaylica yazacagim..

GPU konusunda bir baska verilen bilgi ise her iki konsolunda 8K, 120 Hz ve variable refresh rate (VRR) destekleyecegi.. Bu ucu de aslinda HDMI 2.1 spec parcasi. Bugun piyasada bulacaginiz her hangi bir GPU'da HDMI uzerinden olmasa da teorik olarak bunlari buyuk oranda zaten destekliyor. O yuzden yeni konsollar HDMI 2.1 ile geliyorsa o zaman bunlarin da desteklenecegi otomatik zaten, yani cok onemli ve yeni bilgi degil. Onemli olan 120 Hz'i hangi cozunurlukte, 8K'yi kac frame/saniye'de destekliyor olmasi. VRR zaten X1X'de bugun bile var.

GPU konusunda aciklanan bir baska ozellik ise ray-tracing.. Sony buna deginmekle beraber aciklamasi cok muallakti ve daha sonra bunu audio ray-tracing'e bagladi. Asagida yazdigim gibi benim tahminim PS5 uzerinde ray-tracing icin bir donanim hizlanma olmayacak sanki. MS ise ozellikle donanim olarak ray-tracing hizlandirma olacagini acikladi. Bu da cok sasirtici degil cunku zaten ilk onlar herkesten once bir ray-tracing yazilim arayuzu olan DXR'i Windows 10'a getirdiler.. O yuzden olmamasi surpriz olurdu aslinda. Ozetle bu ongorum dogru ise Scarlett grafik ozellikleri acisindan PS5'e gore bir adim (hem de ciddi bir adim) onde olacak demektir.

Yine bir baska aciklanan ise yeni konsollardaki saklama alaninin artik solid-state disk (SSD) tabanli olmasi.. Sony aciklamayi yaptigi zamanda PS5 disk hizinin o zaman piyasadaki tum SSD disklerden daha hizli olacagini soylemisti. O zaman piyasadaki en hizli SSD, PCI-Express 3.0 x4/NVMe arayuzunu kullanan ve genelde hizi 2-2.5 GB/sn okuma/yazma hizi ile sinirli olan diskler idi. Bu aciklamadan sonra AMD hat basina iki kat fazla bandwidth veren PCI-Express 4.0 destekleyen urunlerini (Zen 2 ve X570) tanittiktan sonra bir kac SSD disk ureticisi de 4-5 GB/sn okuma/yazma hizina sahip SSD'leri tanitti. Bu da bize PS5 uzerinde olan disklerin de yaklasik hizi konusunda bir ipucu veriyor aslinda.. Benzer sekilde MS da Scarlett'in tanitiminda bir onceki konsol generasyonuna gore x40 hizlanma getirecek bir SSD uzerinde calistiklarindan bahsetmisti.. Eski konsollarindaki hard diskler anca ortalamada 100-110 MB/sn veri transferine izin verdigini dusunurseniz x40' da bunu aynen yaklasik 4 GB/sn'e koyuyor. Bunun disinda su anda bunun PC uzerindeki gercekleniminde bu flash memory, SATA/PCI-Express bus, NVMe ve tum bu arayuzleri destekleyerek kontrol eden bir controller-chip vasitasi ile olurken, kapali bir sistem ve standart uyumlulugu problemi olmayan bir konsolda bunun ana islemci icinde custom bir controller ve direk bagli oldugu flash memory ile olmasinda bir engel yok.. Bu da PCdeki en hizli disklere bile gore cok daha verimli, gecikme dusuk, cok yuksek okuma hizi olan ve dahasi bazi fonksiyonlari programcilar tarafindan yonlendirilebilecek bir disk demek.. Sony yaptigi bir demoda PS4 Pro uzerinde ~8.5 saniyede yuklenen bir Spiderman bolumunun bu yeni disk yapisi ile 0.8 sn'de yuklenebildigini gosterdi..Sadece bu da degil, bir de neredeyse jet hizi ile sehir icinde dolasirken yeni aletin streaming konusunda hic problemi olmadini da gosterdiler.. Bu ozellikle yeni nesil oyunlarda detay acisindan cok ciddi bir sicrama olacagini gosteriyor.. Son olarak da diskler custom olacaksa muhtemelen PS2/Xbox zamaninda kalan memory kart benzeri SSD modullere gidiyoruz demektir.. Yani muhtemelen Sony ve MS tekrar bir nevi disk ureticisi haline geliyorlar kendi platformlari icin :)

Sony'nin teaser da bir one cikardigi ozellik ise audio.. Yeni makinada 3D audio'nun cok daha hassas ve efektif olacagi ve ray-tracing'in burada da kullanilabilecegi ile ilgili bir aciklama yaptilar. Aslinda 3D audio cok uzun zamandir yapiliyor zaten ve bu konudaki kutuphaneler aslinda cesitli ortam akustik modellemeleri yapabiliyorlar. Ama tabii ortamdaki kullanilan materyaller ve mekanin seklini kullanarak seslerin ortam icindeki yayilimi daha gercekci olarak modellenebilir.. Burada nasil bir arti olacagini kestiremiyorum su anda, ama sanirim Sony bunu one cikardigina gore launch'da da bu konuda daha cok bilgi aliriz.. Bu arada PS bu konuda Xbox'in hep bir adim gerisinde idi bu generasyon. Muhtemelen bu ozelliklerle beraber Dolby Atmos ve daha onemlisi Dolby Atmos Headphone'u da Sony platformunda gorecegiz artik herhalde..

Yine bir baska aciklanan ise PS5'in PS4'e geriye dogru uyumlu olacagi idi.. MS bu konuda aslinda bir adim (yada uc adim) daha ileri giderek Scarlett'in kendinden onceki tum Xbox generasyonlari ile geriye dogru uyumlu olacagini acikladi.. Yani eldeki oyunlar yeni makinalarda da calisacak. Hatta bir suredir XBO ve PS4'e cikan oyunlarin hedef frame rate'i sabit tutacak sekilde dinamik cozunurluk/dinamik rendering ozellikleri gibi mekanizmalar kullandigini dusunurseniz, bu oyunlar cok daha guclu yeni konsollarda muhtemelen frame-rate'i hedeflenenden sekmeyen ve grafik olarak en tepe noktadaki hali ile calisacaklar.. Buna bir de kucuk patchlerle 60 hatta 90/120 fps modlari eklerlerse, bir cok eski oyunu tekrar ziyaret etmek sart olabilir.. Buna paralel olarak MS bir de Xbox One uzerine cikan tum aksesuarlarin Scarlett uzerinde de calisacagini acikladi.. Yani extra controller icin harcama yapmaya da gerek olmayacak MS tarafinda.. Ozellikle Elite controller icin yatirim yapanlar icin guzel haber..

Bir baska aciklanan ise bu yeni konsollar icin cikacak ilk seri oyunlarin eski konsollara da (PS4/XB1) cikacak olmasi... Phil Spence'in yine dedigi gibi artik onemli olan satilan konsol miktari degil, satilan oyun ve servisler.. Tabi bu ikisi uzun vadede birbirinden cok kopuk degil, ama anladigim kadari ile yeni konsollar cok ucuz olmayacagi icin her iki platformda eski kullanicilarini arkada birakmadan, onlara kendi istedikleri hizda, konsollar arasi bir gecim ortami sunacak gibi duruyorlar.. Bu kullanicilar icin iyi tabii; sonuc olarak eger oyunlar hem XBO/PS4 hem de Scarlett/PS5 platformlarina en az 2-3 sene daha gelir ve platformlar arasi cross-play de mumkun olursa, kullanicilar hic bir 1st/3rd party oyunu kacirmadan ve hala tum arkadaslari ile oynamaya devam ederek fiyatlari kendilerine uygun noktaya geldiginde yeni nesile gecebilirler.. Bu tabii bir acidan da kotu, cunku genelde oyunlar en kotu makinayi baz alarak tasarlanacagi icin yeni makinalarin ozelliklerine gore tasarlanan oyunlarin cikmasi da epey gec olacak demektir.. Yani Scarlett X1XX, PS5 de PS4 Ultra gibi kullanilacak demek oluyor bu bir sure...

Peki aciklanmayanlara gelirsek: Aslinda en onemlisi sanirim Ram miktari.. Her iki konsolunda 256-bit bus ile 384-512 GB/s bandwidth veren (12 - 16 Gbit/s ram chipleri ile) GDDR6 kullanilacagi aciklandi. Dedikodu yazan bir cok yazi ram miktarini 20-24 GB arasina koyuyor. Ben buna cok ihtimal vermiyorum.. Neden derseniz, aslinda gecen sene olsa herseyden once DRAM fiyatlandirmasi buna izin vermez derdim.. Gerci DRAM fiyatlari son bir sene icinde ozellike fazla uretimden dolayi oldukca dustu, ama bu DDR4 icin gecerli.. Su anda daha sinirli uretilen GDDR6 icin benzer sekilde bir fiyat dususu var mi cok emin degilim; ayrica AMD'nin yeni 5700 serisi ve Nvidia'nin RTX serisinin 350$'dan baslamasinin bir sebebi de bu muhtemelen.. Bir baska faktor ise guc tuketimi.. Aslinda bu yeni generasyon ram'da voltaj GDDR5'e gore 1.5V'dan 1.35V'a inmis durumda. Bu da aslinda %20'e yakin bir guc tuketim tasarrufu getiriyor, ama tabii ayni data transfer rate'inde.. Muhtemelen Sony de MS da 12 Gbit ile 14 Gbit arasinda bir transfer hizinda calisan chipleri kullanacaklar simdiki 6.5 Gbit yerine. Oyle olunca guc tuketimi %20 dusuyor ama transfer rate iki katina cikinca, toplam guc tuketimi de yaklasik 1.6 kat artmis olacak. Gerci MS, X1X'de kullandigi 384 bit bus'tan (12 hafiza chip) 256 bit bus'a inerse (8 hafiza chipi) bu da extra 1/3 dusus demek (yani MS icin aslinda yaklasik X1X ile ayni guc tuketimi demek). Ama bu secimin bir sinirlamasi daha var.. GDDR6 standardi modul basina en fazla 16 Gbit'lik chiplere izin veriyor yani 2 GB/module.. Oyle olunca zaten 256 bit bus ile kullanilabilecek en fazla ram da 16 GB ile sinirli. Bunun artmasi ancak bus'in 320 yada 384'e gitmesi ile mumkun. O da direk tekrar power tuketimini arttirmak ile kalmayip, memory bandwidth'i de cok ucuk miktarlara goturuyor ki yine cok ihtmial vermiyorum. Bunun disinda uzun bir suredir oyun tasarimi uzerine okudugum yazilarin hic birinde bir developerin mevcut konsollardaki ram miktarindan da sikayet ettigini gormedim.. Ustelik bir de bu yeni SSD'ler ile bu ram cok hizli bir sekilde guncellenebiliyorsa, o zaman 12 GB'dan daha fazlaya ihtiyac var mi gercekten? Mevcut 20-24GB miktarlari aslinda developer kitleri uzerinde olan x2 ram miktarindan geliyor cok buyuk ihtimalle. X1X'in de developer kiti uzerinde 24 GB ram var mesela, ama biliyorsunuz ki son kullaniciya satilan sistemler uzerinde sadece 12 GB ram geliyor.. O yuzden ram miktarini 12 - 16 GB arasinda gorurseniz sasirmayin ve benim de beklentim bu yonde.

Bir diger bilinmez ise aletlerin cikis fiyati.. Burada da artik 499$'dan daha azini pek beklememek lazim. MS zaten 499$/499E'in iyi bir gaming degeri verdiginde konsolcular tarafindan kabul edilebilir oldugunu gosterdi. Benzer sekilde Sony'de PS5 ile eski makinalarin gecersiz olmayacagini ve zaman icinde bir gecis beklediklerini acikladi. O yuzden onlar da fiyatlandirmada muhtemelen cok agresif olmayacaklar.. Bir de aslinda sistem uzerinde kullanilan parcalarin masrafi da 7-8 sene onceye gore bir miktar artmis gorunuyor. Misal 7nm'de bir chipin uretim maliyeti ayni boyuttaki 14nm'deki bir chipe gore %30 daha pahali. Benzer sekilde GDDR6 ramlar da GDDR5'e gore daha pahalidir muhtemelen. O yuzden ben artik 399$lik bir launch alete cok ihtimal vermiyorum ama tabii ilk basta zararina satmaya karar verirlerse o zaman baska.. Bir de umarim Trump'in gumruk vergisi de cok etki etmez.. O da bir baska faktor olacak cunku..

Bir de aciklanmayan aslinda bu aletleri tanimlayacak yazilim ve kullanim ozelliklerinin ne oldugu.. Ikisi de yeni getirecekleri kullanim ozelliklerini sir gibi sakliyorlar ve ancak platform launch da gorecegiz.. Gecen generasyonu tanimlayan social ozelliklerdi, bakalim bu generasyon ne cikacak..

Daha kisa yazacagim dedim ama cok aldi gitti yine.. Yaziyi bitirmeden once en sonda cikis tarihi ile ilgili spekulasyonumu yapayim, ama once bu spekulasyonu neye dayandirdigimdan bahsedeyim. Bundan yaklasik sekiz sene once daha PS4 adi bile ortada yokken AMD'nin ozellikleri saglam bir gaming islemcisi, o zamanki bir grafik benchmark testi sonuclarinda ortaya cikmisti.. Bir sene sonra PS4 aciklandiginda o testlerin sonucunda gorunen CPU/GPU specleri ile PS4'dunkiler birebir tutuyordu. Simdi burada diyebilirsiniz ki neden bir konsol islemcisi bir PC benchmarkinda calissin. Aslinda onun da cevabi AMD'nin ayni sene sonunda piyasaya cikardigi Jaguar CPU mimarisine ve GCN1 GPU mimarisine sahip bir tablet application-processing-unit (APU) da yatiyor. Bu APU'nun spec dokumanina bakildiginda tum system-on-a-chip (SoC) mimarisinin PS4 ile tamamen ayni oldugu (ayni CPU, ayni GPU, bunlari birbirine ve ana hafizaya baglayan ayni bus yapisi) goruluyor.. O kadar ki ucuz tablet islemci uzerinde kullanilmayan bir 256 bit GDDR5 controller bile var.. PS4'den farki ise 8 CPU core yerine 4, 18 GPU core yerine de 2 GPU core olmasi. Yani AMD aslinda zaten bu APU icin PC uzerinde kullandigi driverlarin ve yazilimlarin aynisini kullanarak PS4 APU'yu da PC islemcisi gibi calistirabilir hale gelmisti. O yuzden PS4'un islemcisinin PC uzerinde benchmark edilmis olmasi cok garip degil. Simdi bir baska gercege gelelim: AMD son bir kac senedir yeni nesil mimariyi tasiyan islemci ve grafik karti urunlerini once cikarip, bir sene sonra da bu iki mimariyi bir APU uzerinde birlesecek hale getiriyor. Misal bu sene Zen2 tabanli islemciler ve Navi mimarisine sahip grafik kartlari piyasaya cikiyor olmasina ragmen, Zen2 tabanli islemciler ile ayni numaralandirmayi tasiyan (Ryzen 3x00G serisi) APU islemciler hala gecen seneki Zen+ ve Vega grafik mimarisini tasiyor. O yuzden aslinda AMD'nin bu sene cikardigi Zen2 ve Navi grafik corelarini tasiyan APU da seneye cikacak. Yani PS5 ile ayni zamanda.. Gelelim son ipucuna: AMD'nin yine ilk olarak bundan 6-7 ay once, ikinci olarak da 1 ay once benzer bir grafik benchmark'a giren iki gaming APU'un test sonuclarini yayinladigi yakalandi. Ilk seferinde bu 1.6 Ghz islemci, 1.0 Ghz GPU hizina sahip "Engineering sample" olan bir chipinki idi.. Ikinci seferinde ise islemci hizi 1.6 ile 3.2 Ghz arasinda, GPU hizi da 1.0 ile 1.8 Ghz arasinda olan bir "qualification sample"'in benchmark sonuclari idi. Iste bu bizim muhtemelen PS5 chipi. "Engineering sample" buyuk oranda calisan ama hala icinde bug'lar olan bir islemci demek. Genelde bu buglarin bulunmasi, temizlenecek yollarin aranmasi ve ayni zamanda platform/yazilimi ayaga kaldirmak icin kullanilan bir surumdur bu.. Hizi da son hedeflenen hiza gore dusuktur bu buglardan dolayi.. "Qualification sample" ise bu problemlerin cok buyuk oranda cozuldugu ve artik uretim oncesi yapilacak islemlerin/testlerin yapildigi chiptir. Uretici bununla beraber artik platformu ve yazilimlari son haline getirir.. Uretim esnasinda olacak chip kaybi konusunda testler yapar, clock rateleri belirler ve dahasi artik developer kitleri yapabilecek hale gelir.. PS5 konusunda bir cok developerdan gelen dedikoduda bundan iste, cunku developer kitleri bir suredir developerlarin ellerinde muhtemelen.. Islemcilerin uretimi de cok uzak degildir ve muhtemelen 6-9 ay icinde islemciler bir urunun icinde konacak hale de gelir.. Tabii urunun cikmasi sadece bir tek islemciye bagli degil. Bir konsol icindeki komponent sayisi derya-deniz.. Ama bunun en kritik parcasi islemci ve o da artik oldukca hazir gorunuyor..Cok muhtemelen Sony isterse 2020'nin ikinci ceyreginde (Nisan-Haziran) bile PS5'i piyasaya cikarabilecek durumda gorunuyor o yuzden: Simdi Sony'nin neden bu sene E3'u pas gectigini de gorebiliyoruz.. Hem herkesin soracagi PS5 sorularindan kurtuldular, hem pek birsey aciklamayarak bu seneki PS4 satislarini cok etkilemediler, hem de oyun studyolarini hatasiz calismasi gereken bir demo icin aylarca bosuna calismaktan kurtarip, PS5 launch'a kitlenmelerine olanak verdiler.. Benim tahminime gelirsek muhtemelen Sony aleti Subat gibi tanitacak aynen PS4'de yaptigi gibi.. Sonra da eger ozellik yada performans olarak gerideler ise (yukarida yazdigim GPU ozellik olarak bir ay sonra piyasaya cikacak Navi grafik kartlari ile ayni ise o zaman hardware ray-tracing yok demektir) cok muhtemelen MS'un zaman olarak onunde olmak icin Mayis-Haziran gibi launch edecekler. Cyberpunk 2077'nin yada Watch Dogs Legion'in oynanabilecegi en iyi platform PS5 olursa sasirmayin o yuzden...

Peki ya Scarlett.. Bu konuda birsey bulmak gercekten zor.. MS ilk Xbox One icin de X1X icinde aslinda islemci ve GPU icin corelari AMD'den lisanslayip geri kalan herseyi kendi tasarlamisti.. Tamamen kendilerine has bus yapisi, baska bir sirketten alinan audio icin DSP core, hic bir AMD GPU'da olmayan HDMI'dan gelen goruntuyu bile kendi yarattigi ile birlestirebilen image composite engine Xbox One'i olusturan bloklardi. O yuzden gelistirmeler MS'un kendi labinda yapildigi icin disari da pek birsey sizmiyor. Simdiye kadar MS'un labinda test edildigi iddaa edilen bir chipin specleri ile ilgili bir screen shot sizdi.. Ama o da bogus gorunuyor cunku MS'da grafik corelarin Navi oldugunu aciklamasina ragmen, bu screen shot'daki GPU core bir sonraki AMD grafik mimarisini isaret ediyor (ama eger dogruysa PS5'e gore performansi daha da yuksek bir alet geliyor demektir, ama fiyati nasil 499$'da tutabilirler o zaman bilmiyorum).. MS'un Scarlett tanitim videosunda da "eger bogus" degilse bir labda muhendisler board gelistirme ile ugrasiyorlardi. O yuzden benim tahminim Scarlett'in temelini olusturan islemci var ve Engineering Sample olarak da MS'un labinda mevcut. Ama yine bir kac yoneticinin E3 esnasindaki konusmasindan da anlasilacagi gibi bu chip daha hic bir oyun studyosuna (kendilerinin ki dahil) gitmis olmadigi ortaya koyuyor. Yani MS bariz bu konuda Sony'nin 6-9 ay gerisinde.. Peki bu bir dezavantaj mi? Bence degil: AMD'nin roadmap'e bakilirsa ray tracing destegi Navi20 icinde gelecek sene geliyor ve cok buyuk ihtimalle bu destek Xbox Scarlett'e de geliyor. Yine roadmap'e bakarsaniz bu chip 7+nm node'uda olacak. Bu node ayni alanda icinde %20 daha fazla transistor miktarina ve %10 guc kazancina olanak veriyor. Iste bu ekstra kazanimlar sanirim MS'un donanim olarak ray-tracing destegi vermesine olanak verecek. Benzer sekilde CPU tarafi da 7nm+ olarak uretilecegi icin orada da ufak mimari degisiklikler ve akabinde PS5'e gore daha iyi bir performans mumkun olacaktir.. Benim tahminim qualification sample tasiyan chipler muhtemelen bu sene sonu ile gelecek sene Subat-Mart arasinda herhalde MS'in ana labina, oradan da launch oyunlarini tasarlayan studyolara ilk kez ulasacak. Aynen Scorpio (X1X)'de oldugu gibi 2020/E3'de kendi studyolarina ulasan developer kitler uzerinde guncellenmis ilk seri Scarlett oyunlari gorecegiz ve benzer zamanlarda son halini almis gercek developer kitler de 3rd party tasarimcilara da gidecek.. Sene sonunda da XB2 yine sinirli sayida kutu ile launch edecek ve tum developerlardan ilk seri oyunlari Scarlett uzerinde en verimsiz hali ile gorecegiz, ama muhtemelen o bile eminim bizi cok etkileyecek, ozellikle ray tracing destegi dedikleri gibi olursa.. Benim bu konuda en son merak ettigim sey ise gecen sene aciklanan "next-gen consoles"un (konsol cogul dikkat cekerim) gerceklesip gerceklesmeyecegi.. Bu sene E3'de bu tekile inmis gibi duruyor. Herkes MS'un cok daha modern bir mimari ile X1X'ile ayni performansa sahip ama 60 fps'i de cok rahat verebilecek bir CPU'ya sahip bir makina cikaracagini tahmin ediyordu. Bu makina X1X'i de iskartaya cikaracakti. Ama bu konudaki planlar degismis olabilir. Yukarida bahsettigim gibi 6-9 ay geride olduklari bir projeyi daha da karisik hale getirmekten vazgecmis olabilirler..

Next-gen yarisi tam olmasa da ucundan basladi artik.. Cok heyecanli zamanlara giriyoruz.. Hem ozellik hem de hiz acisindan mevcut en iyi konsolu bile saglam katlayacak aletler geliyor ve umarim makul fiyatlara.. Bundan sonraki yazida Phil Spence'in X1X'in 4 kati gucunde iddaasini irdeleyecegiz.. Umarim hem bu yazi, hem de o yazilarin sonunda siz de benim gibi heyecanlanirsiniz.. :)

Kaynaklar:

Xbox Scarlett Sunumu/Tariler: https://www.youtube.com/watch?v=XdVTofTE7wE
PS5 SSD Demo: https://www.youtube.com/watch?v=VGgGZxJLSog
PS5 Teaser Yazisi: https://www.theverge.com/2019/4/16/18401209/sony-playstation-5-details-8k-graphics-ray-tracing-ssds-ps4-backward-compatibility
Yeni generasyon PCI-E 4.0 SSD: https://www.tweaktown.com/articles/9031/phison-ps5016-e16-pcie-ssd-first-look-preview/index.html
GDDR5 vs. GDDR6 (Nvidia 2x00 tanitim yazisi): https://www.anandtech.com/show/13282/nvidia-turing-architecture-deep-dive/8
Beklenen PS5 islemcisi: https://www.eurogamer.net/articles/digitalfoundry-2019-is-amd-gonzalo-the-ps5-processor-in-theory
Scarlett sizintisi (muhtemelen bogus): https://imgur.com/a/1A6aoQ2
7+nm vs. 7nm: https://www.anandtech.com/show/14228/tsmc-reveals-6-nm-process-technology-7-nm-with-higher-transistor-density

4 Haziran 2019 Salı

Computex 2019

Gecen hafta senenin GDC'den sonra en onemli ikinci konferansi Taiwan'da yapildi. Bu sene bu konferansi onemli kilan aslinda ozellikle CPU tarafinda hem AMD'nin hem de Intel'in yeni CPU mimarilerini artik gorucuye cikarmasiydi.. Bir de ustune ARM'da ayni zamanlarda yeni mimarilerini tanitinca CPU acisindan bir cok haberin oldugu guzel bir hafta oldu.. Peki AMD ile baslayalim...

Desktop CPU krali oldu, yasasin yeni kral...

AMD malum iki sene oncesine kadar son bir kac yildir direkten donup durdu.. Dozer mimarili islemcilerin cok fena patlamasi CPU tarafini tamamen Intel'e hediye etmisti.. Ustune bir de GPU tarafinda da Nvidia Maxwell ile cok verimli bir mimari ile gelince, AMD her iki cephede de cok kan kaybetmisti (hatta bir ara stoklari 1.8$'a kadar inmis, millet sirket ayakta kalabilecek mi diye dusunmeye baslamisti).

AMD iki sene once cikardigi Zen tabanli Ryzen/Threadripper serisi ile talihini degistimeyi basardi. Her ne kadar islemci single-thread'de hala Intel'in instruction per clock (IPC) olarak %10-15 gerisinde olsa bile Intel'in hic beklemedigi bir anda 8 core/16 thread islemcileri cok makul bir fiyata getirdigi icin multi-thread is paketlerinde Intel'i bir anda ciddi sollamisti. Intel gecen sene ancak korkunc kar marjinlerini bir yana birakip 6 core/12 thread islemcileri piyasaya surerek yaklasmisti.

Bu sene icinse AMD yilbasinda yapilan CES'de Zen 2 mimarisini tanitmisti.. Her acidan chipi gelistirdiklerini soylemis, IPC olarak Zen 1'e gore %15-20'e yakin bir iyilesme sagladiklarindan bahsetmisleri ki bu Intel'in en azindan Skylake ile baslayan Lake serisinde de single-thread performansta da yakaladiklari anlamina geliyordu. Bunun disinda ozellikle yeni chipde dual AVX-256 olmasi da kayan nokta aritmegi isteyen islemleri x2 hizlandirmis olmasi demekti, ustelik de Intel'de oldugu gibi clock rate'i dusurme gibi bir sorunlari da yoktu. CES'te tek bilinmeyen tum bu performansi veren islemcinin tam olarak nasil bir hiza sahip olacagi idi.. Iste Computex'de bunu da ogrenmis olduk..

Ryzen 3000 serisini olusturan yeni islemci serisinin ilkini tanitirken AMD CEO'su Lisa Su cok gururluydu.. Nasil olmasin, 3.6 Ghz base/4.4 Ghz boost clock ile calisan 8 core/16 thread R3700X islemcisi, single-threaded performansta Intel'in kendi klasmanindaki en iyisini gectigini bir endustri standardi demoda on-stage gosterdiler. Ustelik daha da inanilmaz olani Intel'in islemcisi 105 W cekerken, kendi islemcileri sadece 65W cekiyor olmasiydi. Ustune fiyat olarak da daha ucuzdu.. Yani AMD artik sadece multi-threaded'da degil single-threaded islemlerde de artik competitive oldugunu gosterdi. Bu performansin HTPC icine bile girebilecek bir islemci de olmasi da en etkiliyi taraf bence..

Bunun disinda ikinci en etkiliyici ise 3.8 Ghz base/4.4 Ghz boost'da calisan 12 core/24 threadli R9 3900X islemcisi oldu.. Burada da multi-thread'de bir benchmark'da Intel'in ayni sayida core'a sahip islemcisinin yine on-stage demoda tozunu attiktan sonra hem guc tuketimi hem de fiyat farki aciklandi.. AMD 105W islemciyi 499$'a satarken, az once yendigi Intel'in islemcisi 160W cekiyordu ve 1200$'di.. Intel'in ozellikle o seri islemci icin cok pahali olan X299 serisi motherboard istedigini dusunurseniz AMD cok ciddi fiyat avantaji ile geldigini de gosterdi.

Bir diger ilginc noktada 2 sene once 499$'a 8 core/16 thread Zen 1 tabanli islemciler satarken, AMD sadece 2 sene icinde ayni fiyat icinde hem core sayisini 1.5 kata cikardi, hem de IPC'yi %20'ye yakin arttirmis oldu.. Unutmayalim Zen 1 cikmadan once Intel'in belirledigi standard 4 core/8 thread islemcilerdi.. AMD cok saglam ezber bozdu burada..

Tum bunlara ise Intel'in bu sene cevap verebilecegi pek birsey yok.. 10nm yeni generasyon mimarinin desktop'a anca 2020'de gelebilecegini acikladilar.. 14nm/Lake serisini zaten son 5 senedir suyunu sikiyorlardi, pek cikacak birsey kalmadi. Tek acikladiklari 8 core'a sahip her core'u 5 Ghz boost modda calisabilen bir islemci ama ne cekecegi power belli, ne fiyati.. O yuzden bu sene cok net, desktop ve workstation islemciler de kral AMD.... Be sene desktop toplayacagim diyenler icin adres direk belli..

Bu arada cok detaya girmedim ama Ryzen 3x00 serisi ve beraberinde cikardiklari x570 serisi chipsetler ilk PCI-Express 4.0 destekleyen sistemler oldular.. O acidan da aslinda Intel'in bir generasyon onune gecmis gorunuyorlar.. Bir de su anda en saglam islemci 12 core/24 thread gorunuyor ama bunu 16 core/32 thread yapmalarinda da bir sorun yok.. Anladigim kadari ile Intel biraz gelmeye baslayinca onu da cikaracaklar hemen... AMD icin genisleyebilecek alanlari olmasi da cok guzel aslinda.

Ek bilgi gormek isterseniz : https://www.theverge.com/circuitbreaker/2019/5/28/18642251/amd-ryzen-3000-cpus-3900x-3800x-3700x-3600x-3600-price-release-date-specs

https://www.anandtech.com/show/14407/amd-ryzen-3000-announced-five-cpus-12-cores-for-499-up-to-46-ghz-pcie-40-coming-77

Desktop Senin Olsun, ama Ultrabook Laptoplar Benim....

Intel tarafinda son 4-5 yildir 10nm teknolijisi artik yilan hikayesine donmustu.. Tick-tock (tick ile eski mimari islemciyi yeni process teknolojine geciriyorlar, tock'da ise process tekcnolojisini ayni tutup yeni mimari getiriyorlardi), 2016 14nm'de ticklemis Skylake'in 10 nm'e gececegi yil idi, ama 14nm, tick-tock yerine once tick-tock-tock oldu, sonra tock'da takilip kaldi.. Intel bir turlu 10nm'de verimli uretim yapacak bir hale gelemedi. Tum endustrinin acik ara 2-3 sene onunde iken, herkesin gerisine dustuler. Anca bu sene aritk 10nm'yi verimli uretilebilir hale getirdiklerini acikladilar. Ama orada da hala bir kac kusku var..

Oncelikle 10nm ilk olarak 9-25 W arasi calisak Ultrabook islemcilere ve Xeon serisi server islemcilere geliyor. Her iki market da Intel icin cok onemli ve desktop'u AMD'e biraksalar da en azinda bu iki marketi kaptirmak istemiyorlar..

Yeni 10nm chip aslinda iki yeniligi birden getiriyor.. Cok gec kaldiklari icin 10nm'e hem yeni CPU hem de yeni GPU mimarisi ile geciyorlar.. CPU mimarisi Ice Lake.. Aslinda yukarida AMD single-thread performasta yakaladi demistim ama Intel Ice Lake ile bir onceki mimariye gore %18'e yakin IPC'yi arttirdiklarini acikladi.. Benzer sekilde GPU'da da ozellike hafiza bandwidthi cok verimli calismasina olanak veren tiled-based rendering disinda bir de hesap unite sayisini 192 ALU'dan 512 ALUya (evet x2.6) arttirdiklarini acikladilar.. Oyle olunca aslinda cok canavar bir ultrabook islemcisi ortaya cikmis gibi duruyor..

Simdi "gibi duruyor dedim" cunku yine maalesef tutarsiz bir cok sey de gormeye basladik. Verdikleri specler hep "up-to"larla dolu. Yani performans arttirimi neye gore, nereye kadar belli degil. Misal single-threaded performansi gecen sene cikan chiplere gore %10 bile artmis degil kendi verdikleri sekillerde. GPU tarafinda da upto 1 Tflops diye geciyor, ama bir yerde okudugum kadari ile 15W ile 25W modlari arasinda ciddi performans farki gozlemlemisler. Yani 15W'da cok da dedikleri kadar hizlandirmamis olabilirler.. O yuzden asil farki sene sonunda cikacak laptoplar benchmark edildiginde gorecegiz sanirim..

Yine de Ice Lake bir cok yenilik getiriyor bunyesinden. Audio DSP/ HEVC HDR decoder/built-in thunderbolt ve Wifi 6 (802.11x) controller, aslinda ultrabooklarin daha da compact hale gelecegini gosteriyor. Bu arada LPDDR4/3733 memory controller destegi de hafiza performansinin gayet saglam olacagini gosteriyor.. O acilardan bile bakarsak Ice Lake oldukca iyi bir islemci aslinda..

Laptop alacaksaniz bu sene sonuna kadar beklemek mantikli.. Intel dedigi performansi verebilirse ultrabooklar da ucundan gaming icin makul platform haline geliyor demektir..

Ek bilgi icin: https://www.anandtech.com/show/14436/intel-10th-gen-10nm-ice-lake-cpus

Ben Sadece Cep Telefonu Kullaniyorum....

AMD ve Intel'in aciklamalari pespese gelirken ARM'da aradan kendi yeni nesil islemci mimarisi Cortex A77 serisini tanitti. Bir sekilde hala optimize edebilecekleri birseyler buluyorlar ve A76 serisi gibi 7nm'de kalmalarina ragmen A76'ya oranla yaklasik %26 integer, %35 floating-point performansi arttirmis gorunuyorlar.. Gerci Apple'in A11 serisini anca ucundan yakalamis gibi duruyorlar (ki Apple A12 serisi islemcileri cikarali neredeyse 6 ay oldu) ama yine de fena degil. Bilmiyorum bu hiz nerede gerekir cep telefonlarinda ama orada da her seferinde ciddi bir iyilesme yapabiliyorlar hala..

Ek bilgi icin: https://www.anandtech.com/show/14384/arm-announces-cortexa77-cpu-ip

Peki Ya GPU

GPU tarafinda ilk gelen haber AMD'nin Navi serisi icin yaptigi teaser tadinda tanitim oldu.. AMD en azindan grafik core'lari GCN'den RDNA serisine gecridigini acikladi. Bu yeni mimarinin %25'e yakin IPC arttirdigini ve 7nm'de Vega'ya gore ayni guc tuketiminde 1.5 kat performans arttirdiklari belirtiler. Guc tuketimi, toplam hespa gucu gibi konularda pek detay vermediler ama ynei nesil 5070 serisi en tepe GPU'nun Nvidia RTX 2070'e gore %10 daha hizli oldugunu gosterdiler.. Daha sonra yapilan bir analizde chipin 280 mm2 oldugu da soylendi (benzer hizdaki Nvidia'nin RTX 2070 480mm2 civarlarinda)...

Navi hakkindaki tum detaylari da E3 esnasinda gelecek hafta basinda olacak bir press-conferans'da aciklanacak. Bu kisimda heyecanli cunku next-gen konsollarin uzerine insa edilecegi GPU'yu taniyor olacagiz..

Ek bilgi icin: https://www.anandtech.com/show/14412/amd-teases-first-navi-gpu-products-rx-5700-series-in-july-25-improved-perf

Evet, bir sonraki durak Stavia tanitimi.. Ondan sonra MS'un E3 tanitimi geliyor.. Muhtemelen Xcloud hakkinda epey birsey ogrenecegiz artik.. Biraz sansli ise next-gen'i de ucundan gorecegiz sanki...

1 Haziran 2019 Cumartesi

I am back....

Teknoliji haberleri uzerine yazdigim emaillari tekrar blog postu haline getirmeye karar verdikten sonra bir blog sitesi ararken, kendime ait olan bu sayfayi buldum. En son post 2013.. Ben bile unutmusum.. Uzerinden o kadar cok zaman gecmis ki..

O zamanlar next-gen konsollar (PS4/XB1) cikmak uzereydi.. 360/PS3 generasyonun ciktigi tarih uzerinden neredeyse sekiz sene gecmis, hem tasarimcilar hem biz artik o generasyondan yorulmustuk.. Acaip heyecanliydik, yine o zaman piyasada olan herseyin otesinde bir aletler bekliyorduk hem Sony'den hem MS'dan.. Ama maalesef gele gele CPU'su tabletler icin olan, GPU'su da PS4 icin bile anca mid-range ayarinda olan aletlere kalmistik. Cok buyuk hayal kirikligi idi.. Herhalde kusturdu beni ki ondan sonra hic birsey yazmamisim..

Yine de bu generasyon o kadar kotu degildi.. En azindan Sony bir cok klasigi siraladi pes pese biz single playercilar icin. MS'un feci basladigi generasyon oyun acisindan toparlamasa da bize en kullanici dostu ozellikleri getirmeyi basardi. Play-anywhere, cross-play, game-pass ve "dogru duzgun" bir cloud play de onlarin sayesinde geliyor. Bunun disinda her ikisi de milleti ayni makinaya baglamayarak mid-cycle donanim guncellemelerini yaparak bir ilke daha imza attilar. Sony ne kadar en basta en iyi dengeli 1080p30 makinayi cikardiysa, MS da fiyata takilmayarak olmasi gereken 4K30/HDR makinayi cikardi.. O yuzden her ikisinin de hakkini yemeyelim,.

Simdi yeni bir cycle'a dogru yine gidiyoruz.. Sony de MS da yeni aletleri sanki 2020 icinde cikaracaklar (Sony kesin de MS ne yapacak onu daha gorecegiz).. Sony ilk teaseri verdi bile.. MS'da E3'de muhtemelen bahsetmeye baslayacak.. Bu sefer sadece ikisi yarista degil ustelik.. Google da kendi guclu oldugu yerden saglam giriyor.. O yuzden cok enteresan bir next-gen'e dogru gidiyoruz..

Bundan sonra ilk postu yazacagim.. Biz oyunculari ucundan ilgilendiren haberler ile.. Gecen hafta Computex 2019 vardi.. Oradan biz oyunculari da ilgilendiren taze CPU ve GPU haberleri var...