3D Xpoint - Mer än bara PCM
Nu när vi har en bild av hur PCM fungerar i praktiken så ska vi titta lite närmare på den första riktiga implementationen av PCM, Intel/Microns 3D Xpoint.
I NAND-flash så består varje cell av transistorer. Då data lagras i form av elektroner direkt i transistorn så kan man läsa av varje cells data genom att arrangera dessa i ett rutnät. Där varje cell är ihopkopplad med nästa cell via “Word lines” (rader) och “bit lines” (kolumner). Så för att läsa ut data så lägger man på en spänning på en word-line och sedan kan man läsa ut resultatet på varje bit-line. Eftersom alla dessa sitter ihop i en större enhet så gör det att man måste läsa och skriva i bulk. Ska ny data skrivas så kan man inte skriva en bit med data till en cell, utan man måste programmera en större mängd celler på samma gång.
Med 3D Xpoint så består inte cellerna av transistorer och det enda som behövs för att läsa/skriva en cell är en viss spänning genom materialet. Därför har man arrangerat dessa som som ett stort rutnät av wordlines och bitlines (precis som i flash). Skillnaden här är att cellen finns där de två korsar varandra och därav namnet 3D Xpoint (3D Crosspoint). Problemet med detta arrangemang är att ström har en förmåga att hitta olika vägar genom materialet för att ta sig fram till jord. Dvs inte bara genom just den cellen man vill läsa/skriva till (Selector). Detta löser man vanligtvis med hjälp av en transistor eller en diod eller något liknande. Problemet är att transistorer är förhållandevis komplexa och att använda transistorer skulle göra det svårare att skala ner och göra designen mindre. Därmed förlorar man mycket av fördelarna med PCM. Intel/Micron har löst detta på ett förhållandevis enkelt sätt.
Istället för att använda en transistor eller en diod så använder man sig av ett liknande material som man använder för att lagra informationen. Det behövs göras vissa förändringar av materialet och man dopar det med andra ämnen för att få det mer “stabilt”. Men i princip så använder man samma teknik. Upp till en viss spänning så leder inte selectorn någon ström, men om spänningen är tillräckligt hög så släpps den igenom till cellen som ska läsas/skrivas. Om man balanserar den här processen exakt rätt så är spänningen tillräckligt hög för att gå igenom, bara på den cellen som man vill jobba med. På de andra cellerna är spänningen för låg och då släpps ingenting igenom. Denna typ av switch kallas för Ovonic Threshold Switch eller OTS.
Som ni förstår så krävs det väldigt exakta beräkningar av spänningens nivåer för att tekniken ska fungera. Det är en av anledningarna till att man inte lyckats massproducera tekniken förens nu. Av den anledningen så finns Xpoint endast med SLC i dagsläget (dvs man lagrar bara en bit i varje cell). Men vartefter tekniken mognar och man finjusterera spänningarna ännu mer så ska det vara fullt möjligt att bygga MLC, TLC och även QLC i framtiden.
Skalning på höjden eller på bredden? Eller båda?
Skalning till mindre noder är något som gjort NAND-flash så framgångsrikt som det är idag. Ju mindre man kan göra varje cell, desto fler celler får man plats med på en given yta och det gör det generellt billigare att tillverka. Men med NAND-flash så kommer minskning av tillverkningstekniken med det problemet att livslängden blir avsevärt sämre. Det har gjort att man har behövt använda större felmarginaler och kraftigare ECC för att det ska fungera. Vilket i sin tur har gjort att vi får sämre prestanda.
Med Xpoint så får vi inte samma problem. Eftersom materialet i sig inte innehåller några transistorer finns möjligheten att minska tillverkningstekniken ytterligare utan att vare sig prestanda eller livslängd påverkas. Faktum är att det krävs att minnescellerna är tillräckligt små för att det ska fungera bra. Precis som 3D-NAND så går det även att stapla flera lager ovanpå varandra. Vilket gör att man, i alla fall teoretiskt, kan skala upp på flera olika sätt utan några större nackdelar. Första generationen 3D Xpoint som finns i de produkter som vi testar idag är på 128Gbit per kiselplatta. Dessa består av endast två lager och är tillverkad med 20nm teknik. Vi vet ännu inget om nästa generation och om man kommer gå på höjden eller gå ner till 16nm så det återstår att se.
Prestanda
Nu har vi pratat om alla de teoretiska bitarna och vad det krävts av Intel/Micron för att kunna lansera denna nya teknologi. Men hur ser det ut med de viktigaste sakerna? Hur är prestandan? Hur är det med livslängden? Och vad kostar det?
När 3D Xpoint presenterades så pratade man om 1000x bättre prestanda och 1000x bättre livslängd till ett pris som skulle hamna någonstans mellan DRAM och NAND. I ren troughput så kan vi komma ganska långt med NAND-flash. Det handlar bara om att sätta tillräckligt många NAND-enheter under en tillräckligt stor kontroller så kan man få skriva och läsa data i tusentals megabyte per sekund. Det är givetvis sant när det gäller Xpoint också, men det är inte det som är det intressanta. Det är istället teknikens latens som är intressant. Dvs hur lång tid tar det från att datorn har skickat ett kommando om att skriva en IO, tills det att den faktiskt har skrivits och bekräftats av enheten och rapporterat tillbaka det till systemet. Det är just det som gör att en SSD känns så pass mycket snabbare än en hårddisk.
Xpoint och PCM har potentialen att vara nästan 1000 gånger snabbare än NAND-flash. Oavsett kommer det att krävas omfattande förändringar i hur kontrollekretsar byggs och hur mjukvara hanterar det för att vi ska kunna utnyttja det fullt ut. Begränsningen sitter inte i lagringsmediet utan i hur mjukvaran är designad och hur kontrollern är designad och vi borde kunna se ännu snabbare enheter i framtiden. Trots det så visar Intels specifikationer upp en markant reducering i latens jämfört med NAND-baserade SSD-enheter.
Nu när vi lovat guld och gröna skogar så har det blivit dags att ta en titt på den enhet vi kommer testa idag Intel Optane 900p.
Tackar så mycket för detta bus-spännande test! Mycket trevlig läsning, måste tillstås. Har väntat på att en hårdvaru-väbbsida ska titta på U.2-versionen av 900P, då jag är väldigt intresserad av att ploppa i en sådan i min nya PC.
Med detta i åtanke hade det såklart också varit mycket intressant att fått se insidan av det där fina helgjutna 2.5″-chassit… Nå, mina Herrar, vad sägs om en liten centerfold-striptease? 😀
Hej Hans.
Det hade givetvis varit intressant att titta hur de ser ut innuti men Intel har inte gjort det enkelt att plocka isär dem. Inehållet ska dock vara identiskt med AIC-versionen. Om möjligt så kan 2,5″ modellen nå högre temperaturer, men det inget som visade sig i våra tester och vi pushar dem oftast betydligt hårdare än vad man brukar göra. Så du kan absolut köpa en 2,5″ modell utan att behöva känna att du missar något.