Vi tar oss längre in på det mörkare halvåret och därmed också närmare lanseringen av AMDs nästa generation av APU-kretsar med kodnamnet Kaveri. Nu har företaget visat upp mer information om kretsarna tillsammans med nya utvecklingsverktyg för att dra nytta av plattformen.
Vi har under årets gång kunnat rapportera allt fler stycken information om vad som kommer markera nästa generation av processorer med integrerad grafik från AMD, och som den här gången kommer markera ett något större steg än tidigare. I och med Kaveri kommer AMD anamma Heterogeneous System Architecture, eller HSA, i sina konsumentprocessorer vilket, enligt AMD, kommer markera en tröskel för hur framtidens program ser ur på X86-plattformen.
HSA för CPU och GPU ännu närmare varandra
HSA är tänkt att göra CPU och GPU i en krets betydligt mer jämlika, till skillnad från traditionella system som av historiska skäl använder CPU som en primär processor och GPU som ett tillbehör. Idag har dock grafikprocessorerna kommit oerhört långt och kan ge betydligt mer prestanda än en CPU inom vissa områden, exempelvis flyttalsberäkningar. I och med HSA ska GPU och CPU kunna programmeras med lika stor frihet, så att applikationer kan dra nytta av maximal prestanda hos båda typerna av processorer.
Två tekniker kommer bli särskilt viktiga för hur HSA fungerar och hur arbetet fördelas mellan CPU och GPU. Den första tekniken kallas Homogeneous Unified Memory Access, eller HUMA, som tillåter båda processorna att läsa och skriva till samma minnespool på upp till 32 gigabyte, samtidigt. Detta till skillnad från tidigare vanliga tekniker för delat minne mellan CPU och GPU, där tilldelas en viss del av minnet som sedan är skilt från den mängd CPU-delen har tillgång till.
Den andra tekniken heter Heterogeneous queuing, eller HQ. Den berör främst hur olika beräkningsarbeten och data delas och styrs mellan processorerna. Tidigare har beräkningar via grafikprocessorn varit beroende av centralprocessorn, som haft ensamrätt på att begära beräkningsarbeten. I och med HQ ska CPU och GPU på allvar vara parallella och ha samma prioritet i beräkningar samt kunna skicka arbeten och data mellan varandra.
Steamroller och 512 streamprocessorer
Vidare till specifikationerna hos Kaveri så hittar vi upp till fyra kärnor av Steamroller-typ, uppdelade i två moduler. Det rör sig om efterträdaren till Piledriver, tillverkad i 28 nanometer, som är tänkt ge mer prestanda inom både enkel- och flertrådade arbeten till en lägre strömförbrukning.
Dessa kärnor har parats samman med en grafikkrets med GCN-arkitektur, utrustad med åtta beräkningsenheter och därmed 512 streamprocessorer. Det är samma mängd som vi idag hittar i mellanklasskortet HD 7750. Dessutom är denna grafikkrets utrustad med hårdvara från Tensilica, och har således stöd för AMDs ljudteknik Trueaudio. I och med GCN-arkitekturen hittar vi även stöd för utvecklargränssnittet Mantle. Totalt utlovar AMD en flyttalsprestanda på 856 GFLOPS för Kaveri.
Nya utvecklarverktyg
För att dra nytta av HSA och den nya hårdvaran har AMD även presenterat en rad nya utvecklingsverktyg. Först ut är ett nytt utvecklarkit kallat Unified SDK som i sin tur innehåller flera verktyg för att ta fram applikationer optimerade för HSA. Ett av dessa är AMD App SDK 2.9, som bland annat ska ha mer fokus på användarvänlighet än tidigare versioner, samt bättre stöd för OpenCL och OpenCV.
Här finns även en betaversion av Media SDK 1.0, och som namnet antyder är det tänkt att underlätta vid optimering av multimedia och hårdvaruacceleration av exempelvis video. Unified SDK ska även uppmuntra till optimering för både CPU och GPU med hjälp av verktyg som kommer kunna användas i flera olika språk, däribland Fortran, C och C++.
I sidan om Unified SDK har AMD även visat upp version 1.3 av CodeXL, även det avsett för utveckling för HSA, och här ska en av de största nyheterna vara stöd för programmering i Java.
Första leveranserna 14 januari
Vi har nu fått ett spikat datum för de första leveranserna av Kaveri-processorer. Från och med den 14 januari nästa år kommer processorerna kunna införskaffas till den stationära plattformen och sockel FM2+, varpå de mobila och server-anpassade processorerna följer strax därefter. Däremot har vi fortfarande inte fått ta del av några priser eller exakta namn på processormodellerna, men även det bör dyka upp inom en inte allt för snar framtid.
Undrar lite på om BF4 kommer funka lika bra som BF:BC2 gjorde på dual graphics.
spännande.
Blir nyfiken på jämförelsen med HD 7750, sitter nämligen på ett sådant kort idag. Med lite nedskruvade inställningar går det mesta att spela i 1080 med det kortet.
Är det grafik i den nivån på den nya APU:n, eller är det endast i teorin?
[quote name=”Tripptrapptrull”]Blir nyfiken på jämförelsen med HD 7750, sitter nämligen på ett sådant kort idag. Med lite nedskruvade inställningar går det mesta att spela i 1080 med det kortet.
Är det grafik i den nivån på den nya APU:n, eller är det endast i teorin?[/quote]
I mängd beräkningskraft bör det vara jämförbart. Vad som däremot kan hålla APUn tillbaka i upplösningar som 1080p och uppåt är minnesbandbredden, då det diskreta HD 7750 använder GDDR5-minne medan grafikkretsen i APUn får klara sig med vanligt DDR3 som delas med CPUn.
[quote name=”Tripptrapptrull”]Blir nyfiken på jämförelsen med HD 7750, sitter nämligen på ett sådant kort idag. Med lite nedskruvade inställningar går det mesta att spela i 1080 med det kortet.
Är det grafik i den nivån på den nya APU:n, eller är det endast i teorin?[/quote]
Demo finns tillgänglig 1024P medium inställningar, BF4 28-50fps i jämförelse med en Core i7 4770k+Geforce 630
http://www.youtube.com/watch?v=HjAM2zYNqko
Så länkar inte möjliga att lägga upp?
Tydligen OK, men av någon anledning kom de inte med i första. Här är länk två
http://www.youtube.com/watch?v=O07YOk4nLyo
[quote name=”Carl Holmberg”][quote name=”Tripptrapptrull”]Blir nyfiken på jämförelsen med HD 7750, sitter nämligen på ett sådant kort idag. Med lite nedskruvade inställningar går det mesta att spela i 1080 med det kortet. Är det grafik i den nivån på den nya APU:n, eller är det endast i teorin?[/quote] I mängd beräkningskraft bör det vara jämförbart. Vad som däremot kan hålla APUn tillbaka i upplösningar som 1080p och uppåt är minnesbandbredden, då det diskreta HD 7750 använder GDDR5-minne medan grafikkretsen i APUn får klara sig med vanligt DDR3 som delas med CPUn.[/quote] Jag har sett någonstans att GDDR5 resulterar i ökad latency… Läs hela »