Il punto di vista di Macrium sulla recente controversia sugli hard disk SMR

Traduzione a cura di Naonis dell’articolo apparso nel sito del produttore al seguente link:

https://blog.macrium.com/macriums-view-on-the-recent-smr-disk-controversy-778ae03b19f8

Nelle ultime settimane ci sono state accese polemiche insorte dalle notizie secondo cui un certo numero di grandi produttori di hardware stiano silenziosamente distribuendo dischi SMR nelle linee dei propri prodotti per NAS (Network Attached Storage).

Le ragioni di ciò non sorprendono particolarmente. Utilizzando la tecnica SMR di registrazione delle tracce del disco, i produttori di hard disk possono ottenere una densità di archiviazione più elevata, accumulando una maggiore capacità di TB sullo stesso numero di piatti – o usando meno piatti, per la stessa quantità di TB, come spiega quest’interessante articolo di Ars Technica. Ciò a scapito però delle prestazioni, oltre a una serie di altri problemi di compatibilità.

Sebbene le aziende produttrici coinvolte abbiano risposto alle critiche sia degli utenti che di parte della stampa tecnologica, Macrium ha pensato che questa controversia sia una buona opportunità per analizzare più da vicino le tendenze del settore e gli attuali problemi del mercato dei dischi rigidi, inclusi SMR, TRIM e RAID.

Nella tecnologia SMR c’è senza dubbio in ballo una grande complessità tecnica. Ciò rende particolarmente difficile determinare fino a che punto le aziende produttrici, che si presume abbiano deciso di adottare la tecnica SMR, agissero con intenzioni dannose o semplicemente non fossero in grado di anticipare correttamente i problemi che si sono verificati nelle applicazioni degli stessi fatte dagli utenti. Tuttavia, poiché tale hardware può avere un impatto significativo sulle prestazioni e sulla robustezza di un sistema, è di primaria importanza comprendere le differenze tra le diverse tecniche di registrazione delle tracce nei dischi. Per questo motivo, Macrium ritene che i produttori di dischi rigidi avrebbero dovuto essere chiari fin dall’inizio su quali dispositivi è stata utilizzata la tecnica SMR.

Che cos’è la tecnologia SMR (Shingled Magnetic Recording)?

L’innovazione nella tecnologia dei dischi magnetici è sempre rivolta verso una maggiore densità di archiviazione dei dati e ad abbassare il costo per GB. La tecnica SMR insegue questa tendenza. Tuttavia, a differenza di altri recenti miglioramenti incrementali, ha anche un impatto significativo sulle prestazioni del dispositivo.

Un disco tradizionale con tracce standard non sovrapposte viene chiamato generalmente disco CMR, o anche PMR (Perpendicular Magnetic Recording, registrazione magnetica perpendicolare). Ogni traccia CMR (e un settore all’interno di una traccia) può essere scritta senza sovrascrivere le altre tracce adiacenti; il “costo” di un aggiornamento della traccia è legato al solo tempo per muovere la testina del disco e per ruotare il settore sotto la testina.

La tecnica SMR utilizza la capacità di una testina di leggere una traccia più stretta della larghezza della minima traccia scrivibile. Scrivendo tracce leggermente sovrapposte si può aumentatore in modo significativo la densità di dati memorizzati. Questo aumento di densità, in linea di principio, dovrebbe ridurre il costo per GB e una piccola riduzione della potenza dissipata per GB laddove è possibile ridurre il numero di piatti.

C’è tuttavia un prezzo per questo; per scrivere un aggiornamento, tutte le tracce dovranno essere riscritte. Per mitigare il problema le aree vengono divise in zone. Ciò limita la riscrittura nell’estensione della sola zona, anziché all’intera superficie del disco.

Per aggiornare un byte sul disco, l’intera zona dovrà essere letta, aggiornata in memoria e quindi riscritta sul disco. Questa problematica è nota con il nome di amplificazione in scrittura. Anche i supporti di memoria flash hanno una problematica del tutto simile. Infatti, a causa della struttura costruttiva delle memorie flash, la cancellazione deve sempre essere applicata a un’intera pagina di memoria.

Ulteriori mitigazioni

Esistono diversi altri modi per mitigare la necessità di riscrivere tutte le tracce.

  1. Un’area del disco è riservata alle tracce CMR. I nuovi dati arrivati vengono inizialmente scritti in quest’area, evitando l’overhead della riscrittura. Il firmware del disco sposta successivamente i dati nelle zone SMR quando il disco è inattivo. Però, se si verifica un utilizzo prolungato del disco, le tracce CMR si riempiranno troppo in fretta e si verificherà un improvviso calo delle prestazioni quando il firmware avrà la necessità di spostare i dati nelle zone SMR.
  2. Questo è un comando SATA/NVMe aggiuntivo (Unmap per SCSI) generalmente utilizzato dai file system per indicare al sistema di archiviazione sottostante che una zona non è più in uso. Alla successiva richiesta di scrittura, il firmware del disco eviterà di scrivere immediatamente in questa zona per non generare latenze dovute all’amplificazione di scrittura che necessita della sequenza lettura/copia/scrittura necessaria per scrivere in quella zona. Questa tecnica, originariamente nata per ampliare la capacità delle EEPROM che ha dato vita alle attuali memorie FLASH, è utilizzata adesso anche per i dischi a tecnologia SMR.

Implementazioni SMR

La tecnologia SMR è gestita in due modi molto diversi tra loro.

SMR gestito dal dispositivo: la gestione della riscrittura delle zone SMR è trasparente per il sistema operativo ed è gestita dal firmware del disco. Questi dispositivi possono essere posti in sostituzione di un dispositivo CMR. (È questo il tipo di dispositivo che è stato venduto dalle case produttrici come disco standard).

SMR gestito dall’host: la gestione in questo caso è delegata al computer collegato. Esiste un set aggiuntivo di comandi di gestione per abilitare questa modalità di funzionamento. Questi comandi sono chiamati Zoned Access commands, o Zoned Block Commands se si usa SCSI, e consentono di eseguire query e ottenere l’accesso a una zona. Tutte le scritture devono essere sequenziali dall’inizio della zona. Questi dischi sono destinati esclusivamente alle applicazioni di tipo enterprise.

I dischi SMR gestiti dall’host sono dispositivi specialistici che potenzialmente offrono le altissime prestazioni, ma non sono dispositivi d’uso comune e non possono essere utilizzati in sostituzione di dischi CMR standard.

SMR sensibile all’host: un ibrido delle due modalità di gestione sopra scritte.

Abbina la compatibilità del dispositivo pur consentendo ottimizzazioni particolari per il file system e applicazioni compatibili con SMR.

Caratteristiche prestazionali dei dischi SMR

Le prestazioni dei dischi SMR gestiti dal dispositivo sono generalmente accettabili negli scenari in cui ci sono carichi leggeri di operazioni di scrittura o in cui le operazioni di scrittura hanno natura sequenziale. Sono adatti, ad esempio, per il backup o l’archiviazione di file per cui il costo per GB è un fattore importante o, in alcuni casi, per limitare il consumo di energia.

Quando evitare i dischi SMR?

I dischi SMR devono essere evitati se non è possibile tollerare latenze nei casi di accesso in scrittura casuale sostenuti (come accade ad esempio nei database).

In particolare, non dovrebbero mai essere utilizzati negli array di dischi in RAID. Questo perché la tecnologia SMR moltiplicherà il tempo di ricostruzione, a volte al punto da farne fallire la ricostruzione.

I dischi SMR gestiti dall’host sono invece una proposta diversa. Quando si ha il controllo dell’intero protocollo di I/O, per molte applicazioni sarà possibile progettare la propria logica di scrittura I/O in modo che corrispondano a quelli in cui un disco SMR funziona meglio. Ciò consentirà di evitare qualsiasi penalizzazione delle prestazioni dovuto a SMR e realizzare risparmi significativi in ​​termini di costi e di energia.

Questa case study di Dropbox lo dimostra davvero bene.

Esistono opzioni di ottimizzazione del file system per i dispositivi SMR?

Per i file system convenzionali, la risposta è no. A differenza degli SSD in cui la dimensione della pagina è in genere 4K, le zone SMR sono molto più grandi, in genere 256 KB. Impostando semplicemente la dimensione atomica del file system (per NTFS questa è la dimensione del cluster) su 256K si otterrà uno spazio di archiviazione inefficiente. Al contrario, la dimensione della pagina degli SSD si associa perfettamente alla dimensione del cluster predefinita di NTFS.

Alcuni file system sperimentali e speciali non disponibili sulla piattaforma Windows (ad esempio F2FS ed ext4-lazy) sono in fase di sviluppo per adattarsi a SMR. Microsoft potrebbe introdurre delle estensioni ai propri file system se diventa più convincente il vantaggio in termini di dimensioni o costi dei dischi SMR.

Esistono alcuni indizi secondo cui ReFS v2 supporta i dispositivi SMR gestiti dall’host. Stranamente però la documentazione è inesistente [5,6]. ReFS su Device Managed SMR non trarrà quindi vantaggio da questo supporto.

I dischi SMR devono essere sempre evitati?

Ad esclusione dei Data Center e di altre applicazioni altamente specialistiche, Macrium suggerisce di evitare i dischi SMR in assenza di significative motivazioni di prezzo, di spazio di archiviazione disponibile o energia consumata. Se il differenziale di prezzo inizierà ad allargarsi, l’archiviazione dei backup è un’applicazione perfetta per i dischi SMR, in quanto i backup di Macrium sono scritti quasi interamente in sequenza.

Macrium ritiene che i produttori di dischi rigidi non siano corretti nel collocare i dischi SMR gestiti dal dispositivo nella loro gamma di prodotti standard. Sebbene abbiano una possibile collocazione nella tabella di marcia delle applicazioni di archiviazione e il firmware possa renderli immediatamente utilizzabili in alcuni casi, per molte applicazioni i dischi SMR non funzioneranno bene. Fortunatamente, i produttori ora sono stati costretti a essere più chiari nel dichiarare le specifiche dei loro dischi rigidi. Nonostante ciò, Macrium consiglia di prestare particolare attenzione all’acquisto di dischi specialmente per RAID o applicazioni con carichi elevati di accessi casuali al disco.

Riferimenti

[1] https://blocksandfiles.com/2020/04/23/western-digital-blog-wd-red-nas-smr-drives-overuse/

[2] https://news.ycombinator.com/item?id=22939319

[3] https://www.usenix.org/system/files/login/articles/login_summer17_03_aghayev.pdf

[4] https://dropbox.tech/infrastructure/smr-what-we-learned-in-our-first-year

[5] https://www.snia.org/sites/default/files/SDC/2017/presentations/smr/Das_Rajsekhar_ReFS_Support_For_Shingled_Magnetic_Recording_Drives.pdf

Altri articoli interessanti sull’argomento

[6] https://www.pcprofessionale.it/news/hardware/storage/storage-hard-disk-smr/

[7] https://www.ilsoftware.it/articoli.asp?tag=Scandalo-hard-disk-SMR-che-non-funzionano-piu-in-RAID-Western-Digital-risponde_21097

[8] https://edge9.hwupgrade.it/news/device/hard-disk-smr-a-sorpresa-le-risposte-di-seagate-e-western-digital_88819.html

[9] https://www.blizzarddr.com/wd-smr-translation-new-road-blocks/

[10] https://arstechnica.com/gadgets/2020/06/western-digitals-smr-disks-arent-great-but-theyre-not-garbage/