April 17, 2005
ClearSpeed har på senare tid gjort sig ett namn med sina co-processorer. Helt enkelt ett chip som arbetar sida vid sida om processorn och gör det möjligt för ytterliggare flyttalsberäkningar att utföras. Deras lilla chip, med totalt 96 kärnor (!) som spinner på vid 250MHz kan faktiskt utföra mer flyttalsberäkningar än vad en quad-core Opteron kan; 25 vs 20 gigaFLOPS och då endast vid en bråkdel av strömförbrukningen. ClearSpeed har lösningar färdiga som redan visats upp tillsammans med IBMs dual-Opteron-servrar, som då kom med två stycken dual-chip-lösningar vilket gav en flyttalsprestanda på 100 gigaFLOPS. Exakt vad AMD har i åtanke här vet vi inte, men vi räknar med att mer information dyker upp snart och vi måste säga att vi väntar ganska spänt.
Källa: TechReport
December 11, 2002
Det här är ett spännande område där det händer mycket. Förutom Clearspeeds processorer på Opteronkluster finns en del andra spännade lösningar på samma tema. Både SGI och Cray har nyligen kommit med lösningar där man stoppar in några FPGA:er (Field Programable Gate Array) i systemet. Intressanta produkterfinns också hos SRC och Starbridge. För samtliga lösningar krävs att koden är kraftigt optimerad för den aktuella processorn.
Universitetet i Tokyo använder redan Clearspeed på sitt nya Opteronkluster med över 10000 processorer (levererat av Sun). Utan Clearspeed borde den datorn hamna på plats tre eller fyra på nästa top500. Dock så baseras listan enbart på prestanda då man kör LAPACK och det är ett av de bibliotek som Clearspeed är optimerat för. Ska bli intressant att se hur stor skillnaden blir.
December 11, 2002
Mev wrote: Visst jättebra för kluster och stordatorer men detta måste väl vara riktigt svårt att implementera i vanliga persondatorer. Är det svårt att programera för cell med 8 hjälpkärnor måste det vara nära nog omöjligt att programera ut beräkningar på 384 enheter.
Tanken är inte att du ska programmera din Clearspeed processor själv. Istället finns det redan optimerad kod för vanliga programpaket (främst då vetenskapliga), t ex Matlab, BLAS och LAPACK. När du sedan använder en metod i ett av paketen, t ex en matrisuppdelning, så kommer den att utföras på Clearspeedprocessorn. Om det inte finns någon metod för det du vill göra, eller om du skrivit allt själv, så utförs det på den vanliga processorn. I spel är det vanligt att man behöver använda linjär algebra för olika beräkningar. Det är möjligt att stoppa in sådan kod i optimerade metoder, även om man inte gjort det.
January 12, 2004
Misstänkte ju att Matlab och dyl. skulle få nytta av det men om även andra program kan få det, läs spel, så är det bara bra. Men måste man inte skriva programet två gånger ändå, en för de datorer med hjälpprocessor en för de utan?
Säg att du har en AMD64; ~5GFLOPS, samt en AMD64+clearspeed; ~30GFLOPS.
Skriver du spelet så det använder 30GFLOPS kommer det bli ospelbart på alla datorer utan clearspeed och skriver du det för runt 5GFLOPS får du ingen större vinst av att ha clearspeed. Eller är det något jag missat?
December 11, 2002
Mev wrote: Misstänkte ju att Matlab och dyl. skulle få nytta av det men om även andra program kan få det, läs spel, så är det bara bra. Men måste man inte skriva programet två gånger ändå, en för de datorer med hjälpprocessor en för de utan?
Nej, för att kunna använda Clearspeed måste programmet använda ett verktyg som optimerats för det. Om du inte har har Clearspeed så kommer programmet att använda den vanliga versionen av verktyget.
Mev wrote: Skriver du spelet så det använder 30GFLOPS kommer det bli ospelbart på alla datorer utan clearspeed och skriver du det för runt 5GFLOPS får du ingen större vinst av att ha clearspeed. Eller är det något jag missat?
Nej, du har rätt. Det samma gäller nog också Aegias fysikprocessor. Ska bli intressant att se hur speltillverkarna löser det, har aldrig tänkt på det faktiskt.
January 23, 2001
October 26, 2004
Delph1 wrote: [quote=-Boris-][quote=WIRN]hur många gigaflops kan en vanlig hemdatorprocessor ligga på mån tro?
kul att veta för att kunna sätta sig in hur snabbt 25gigaflops (eller vad det nu gäller) är...
Dom sa just att en Opteron ligger på 20. 😉
En quad-core Opteron 😉
//Andreas
precis
vad kan en vanlig processor ligga på, typ en 3500+...?
2 Guest(s)