La nuova generazione Intel di dischi a stato solido (SSD) ultraveloci abbandona il SATA per il PCIe

Oracle Advanced Replication e replica database con SymmetricDS

La nuova specifica NVMExpress apre la strada ai dischi a stato solido con interfaccia PCI express che consentirà di raggiungere le loro massime prestazioni.

Intel sta portando al massimo le prestazioni dei propri dischi a stato solido (SSD) destinati al mercato dei datacenter, sbarazzandosi di quegli strati dell’interfaccia di emulazione hardware che hanno sinora soffocato le performance degli SSD.

Il 3 Giugno Intel ha annunciato una nuova linea di SSD per datacenter, che utilizza le connessioni fisiche dell’interfaccia PCI express in combinazione con un protocollo di trasmissione dati piuttosto recente e progettato per consentire agli SSD di sfruttare al massimo le potenzialità offerte dalle connessioni PCIe, permettendo una velocità di trasmissione superiore a quella tipicamente consentita dai dischi rigidi.

Poiché i dati vengono memorizzati su di un circuito microelettronico e non su un supporto magnetico – accessibile solo attraverso un braccio meccanico, gli SSD sono in grado di leggere e scrivere dati ad una velocità otto o dieci volte superiore a quella dei dischi rigidi.

Ciò potrebbe dare un’enorme spinta alle prestazioni dei computer portatili, fissi o ai server dei datacenter, se non fosse che i veloci SSD devono connettersi al resto del sistema tramite un’interfaccia SATA, pensata originariamente per la connessione con i dischi rigidi, e perciò molto più lenta.

Da un lato, la compatibilità con l’interfaccia SATA ha permesso la crescita del mercato degli SSD, passato da un valore pressoché nullo nel 2008 (anno in cui vennero introdotti per la prima volta da Intel) ad un valore di 2 miliardi di dollari nel 2013, secondo le stime di Jim Handy, analista alla Objective Analysis.

Dall’altro lato però, ciò ha impedito di sfruttare appieno il potenziale degli SSD – persino degli SSD classe Enterpries con interfaccia PCIe, introdotti nel 2007. I livelli delle prestazioni erano tenuti basi dalla necessità di emulare la connessione SATA per mantenere l’interoperabilità.

All’epoca, era possibile portare la velocità degli SSD vicino ai suoi massimi solo se il produttore era capace di progettare un apposito controller in grado di connettere l’interfaccia degli SSD con la memoria primaria tramite una connessione usata per periferiche quali schede audio o video.

Micron e pochi altri hanno tentato quest’approccio con risultati altalenanti dovuti alla complessità dei controller e all’esigenza di modificare costantemente il controller per ogni nuova generazione di PCIe SSD messa in commercio.

Ad ogni modo, anche con tale soluzione gli SSD erano in grado di raggiungere una velocità di lettura/scrittura sequenziale tra i 2 GB/s e i 3 GB/s che – benché di gran lunga migliore di quella raggiunta dai precedenti SSD, non era pressoché comparabile a quella massima raggiungibile tramite PCIe.

Il nuovo trio della famiglia di SSD Intel per datacenter con interfaccia PCIe rimuove il collo di bottiglia costituito dall’interfaccia SATA e la necessità di un controller aggiuntivo, adottando la specifica NVMExpress (NVMe) – progettata sin da principio per le memorie a stato solido, con una gestione più efficiente dei comandi di esecuzione. Inoltre, vi è anche la possibilità di multitasking virtuale tramite l’invio di dati ai differenti core del processore o alle periferiche, passando dall’uno all’altro con poco ritardo.

La nuova specifica supporta inoltre funzionalità specifiche per i datacenter, quali la crittografia end-to-end per la protezione dei dati, il supporto per la virtualizzazione degli I/O e il multipath I/O che aiuta al mantenimento di una distribuzione efficiente dei dati e riduce la latenza nelle applicazioni che ne fanno uso.

La famiglia Intel SSD Data Center per PCIe utilizza le specifiche della PCIe 3.0, che sono già iniziate ad apparire in prodotti commercializzati quest’anno, con banda di 8 Gbit/s, il doppio di quella specificata per la PCIe 2.0.

Il risultato, secondo Intel, saranno prestazioni fino a 6 volte la velocità massima di 6Gbit/s dei SATA SSD.

Intel afferma orgogliosamente che il capostipite della sua nuova famiglia – la serie di SSD per Datacenter P3700 – può eseguire fino a 460K IOPS (I/O Operations Per Second) pari alle prestazioni di ben sette SATA SSD capaci di raggiungere circa 500K IOPS attraverso una scheda di espansione (host bus adapter, HBA).

I processi Intel Xeon, usando la nuova specifica NVMe, sono altresì in grado di trasferire i dati molto più velocemente che non tramite lo standard AHCI. Questo consente di eliminare del tutto le schede HBA, tagliando ulteriormente i costi dell’hardware.

Le unità sono progettate per far fronte ad un carico di lavoro che potrebbe riempire e svuotare tutta la capacità di archiviazione di ciascuna unità 10 volte al giorno garantendo cinque anni di vita.

La più esclusiva delle tre unità – la serie P3700, è progettata per applicazioni che richiedono una massiccia scrittura di dati. L’unità è disponibile in versioni da 400 GB, 800 GB, 1.6 TB e 2TB, con prestazioni nominali fino a 2,800 MB/s per operazioni di scrittura sequenziali e 1,900 MB/s per operazioni di lettura sequenziali. I prezzi per la serie P3700 partono da 1,207$ per il modello da 400 GB.

L’unità di fascia intermedia, la P3600, offre 2,600 MB/s per lettura sequenziale, 1,500 MB/s in scrittura sequenziale e capacità di 400GB, 800GB, 1.2TB, 1.6TB e 2TB con prezzi che partono da 783 $ per la versione da 400GB.

La serie P3500 è valutata a 2,500 MB/sec in lettura sequenziale e 1,500 MB/s in scrittura. Il costo è di $ 500 per il modello da 400GB, con prezzi crescenti per le versioni con capacità da 1,2 TB e 2 TB.

La latenza media di lettura/scrittura per ciascuna delle tre unità è di 20 microsecondi.

Secondo il quotidiano britannico The Register, simili prestazioni sono seconde solo a quelle offerte dal PCIe SSD della Micron (controller-driven) e dal Samsung XS1715, il PCIe SSD basato su NVMe commercializzato dalla Samsung all’inizio dell’anno, ma fanno terra bruciata del restante mercato.

Il risultato è una performance impressionante, con latenza molto bassa, alta efficienza della CPU e prestazioni costanti che rendono il P3700 “una scelta eccellente” come unità aziendale, secondo Anand Lal Shimpi della AnandTech.

Il P3700 dovrebbe essere in grado di sostituire da quattro a sei unità SATA ad alte prestazioni, stando alle stime di Shimpi, il che, ha aggiunto, non solo potrebbe far risparmiare ai datacenter un po’ di soldi, ma potrebbe anche essere un grande passo verso SSD con prestazioni abbastanza buone e stabili da poter davvero rimpiazzare l’interfaccia SATA sulle memorie a stato solido, una volta per tutte.

E non passerà molto tempo prima che i nuovi SSD colpiscano il mercato vero e proprio. Il 3 giugno, alla stessa fiera Computex di Taiwan dove Intel ha annunciato la sua NVMe SSD, Super Micro Computer ha annunciato di aver ricevuto la prima fornitura di SSD PCIe Intel per la sua linea di FatTwin SuperServer ad elevata efficienza, progettati per infrastrutture con elaborazione intensiva di dati per la virtualizzazione desktop e per applicazioni di calcolo iperscalabile.

Oracle Advanced Replication e replica database con SymmetricDS

Oracle Advanced Replication e replica database con SymmetricDS

Stonebit – sviluppo software – consulenze informatiche

Abbiamo ultimato per un nostro importante cliente un progetto software per rispondere all’esigenza di una replica e sincronizzazione di database su multi-nodo in tempo quasi reale

(ritardi tipici inferiori a 5 secondi).

Le difficoltà erano soprattutto connesse alla bassa affidabilità della connettività, essendo alcuni nodi posti dietro ai firewall di un paese orientale molto noto.

Vogliamo condividere le nostre buone impressioni e gli ottimi risultati raggiunti utilizzando SymmetricDS con una adeguata configurazione.

Sia Oracle Advanced Replication sia SymmetricDS forniscono un sistema di replicazione dei database, uno strumento prezioso per migliorare l’accesso ai dati critici che guidano l’attività dell’azienda. Nonostante alcuni comuni concetti di replicazione siano utilizzati in entrambi i prodotti, ci sono alcune differenze nella terminologia e configurazione. Diamo uno sguardo ad alcuni degli scenari per la replicazione dei database e come ciò venga realizzato da entrambi i prodotti.

Perché usare la replicazione

La replicazione dei database consente un accesso rapido e locale ai dati condivisi, e può migliorare l’aspetto relativo alla rapidità e alla frequenza in base alla quale i dati sono disponibili. Alcune comuni motivazione per l’utilizzo della replicazione sono:

  • Elevata disponibilità – L’utente può accedere ai dati dal database funzionante e dalla posizione a lui geograficamente più prossima.
  • Performance – Bilanciando le richieste di accesso attraverso server multipli o facendo funzionare operazioni molto pesanti come il reporting su un database separato.
  • Operazioni in modalità disconnessa – Gli utenti possono lavorare sui dati mentre sono disconnessi dal database centrale, e successivamente inviare e ricevere le modifiche una volta ristabilita la connessione.

Oggetto della replicazione

Oracle Advanced Replication può copiare qualsiasi tipo di oggetti contenuti nel database tra un sito e l’altro quando venga effettuato qualsiasi aggiornamento all’oggetto. Essendo originato da Oracle, conosce gli oggetti specifici della piattaforma, come le procedure memorizzate, le viste ed i sinonimi. SymmetricDS può replicare tra un sito e l’altro solo i dati contenuti nelle tabelle e lo schema delle tabelle. Poiché è una piattaforma incrociata, supporta oggetti delle tabelle che siano sono comuni a qualsiasi database. Tuttavia, è possibile inviare script SQL personalizzati ai siti attraverso la sincronizzazione, al fine di creare oggetti specifici per la piattaforma.

Gruppi di replicazione

Oracle Advanced Replication utilizza i gruppi di replicazione come un insieme di tabelle logicamente correlate. L’organizzazione in gruppi facilita la gestione dei dati ed il supporto di una particolare applicazione. In SymmetricDS, le tabelle sono assegnati ad un canale, che le raggruppa per la sincronizzazione. Ai canali sono assegnate delle priorità e sincronizzazioni indipendenti, ciò aiuta a controllare il flusso di dati importanti.

Siti di replicazione

I siti in Oracle Advanced Replication sono un database che partecipa alla replica, sia come sito principale o un sito con vista materializzata. Un sito master contiene una copia completa di tutti i dati all’interno del gruppo di replica. Essi comunicano direttamente tra loro per propagare continuamente modifiche. Un sito con vista materializzata può contenere una copia completa o parziale dei dati, e può essere sia di sola lettura o aggiornabile. Una vista materializzata contiene dei dati a partire da un punto nel tempo, e viene periodicamente eseguito un aggiornamento contattando un sito principale per un aggiornamento completo o incrementale. Mettendo una vista materializzata sull’altra, l’aggiornamento dei dati può ricadere a cascata su un organizzazione di siti multistrato.

I nodi in SymmetricDS sono dei database che partecipano alla replicazione. I nodi vengono assegnati ai gruppi di nodi e configurati per replicare le tabelle con altri gruppi di nodi. Viene creato un collegamento tra un gruppo di nodi di origine e di destinazione per ogni direzione necessaria, che stabilisce la comunicazione per propagare continuamente le modifiche. Le modifiche dei dati passano attraverso i router che determinano quali nodi riceveranno le modifiche. Configurando i router per l’invio od il filtro dei dati, un gruppo di nodi può replicare sia una copia completa che una parziale dei dati. Collegare i gruppi di nodi per la replicazione e configurare quali dati delle tabelle indirizzare ed in quale direzione consente di realizzare un network con una flessibilità che include una disposizione multistrato.

Tipi di Replicazione

Oracle Advanced Replication supporta la replicazione multimaster, quella a vista materializzata e le configurazioni ibride usando entrambe. La replicazione Multimaster sta a significare che tutti i siti hanno la stessa copia dei dati, consente gli aggiornamenti e propaga i cambiamenti uno all’altro come dei peer. La vista materializzata sta a significare che il sito ha una copia dei dati a partire da un punto determinate nel tempo, e contatta il sito principale sulla base di un programma per effettuare gli aggiornamenti e condurre i cambiamenti.Una vista materializzata è configurata di base in sola lettura, le modifiche sono consentite solo dal sito principale, ma la configurazione avanzata consente di aggiornare le viste materializzate.

SymmetricDS supporta la replicazione multimaster, la sincronizzazione filtrata, e la trasformazione. I dati vengono replicati a tutti i nodi con il multimaster, permettendo gli aggiornamenti in qualsiasi nodo, e le modifiche vengono propagate lungo la rete seguendo dei collegamenti a gruppi di nodi configurati. La comunicazione può essere configurata come push, con il nodo sorgente che apre la connessione per inviare le modifiche, o come pull, con il nodo di destinazione che apre la connessione per ricevere le modifiche. Il metodo Push è più efficiente dal momento che si creano dei collegamenti solo quando le modifiche sono in attesa, ma la modalità pull può facilmente attraversare i firewall. La frequenza di invio delle modifiche è controllata da parametri che possono esse indirizzati a tutti i nodi, a gruppi di nodi specifici o a singoli nodi. La sincronizzazione filtrata consente di selezionare le tabelle e colonne per sottoinsiemi verticali, così come di selezionare le linee per sottoinsiemi orizzontali. La trasformazione consente la manipolazione dei dati modificati in valori tradotti, righe unite o divise, e migliorare i dati.

Sincrona, Asincrona, e Procedurale

Con Oracle Advanced Replication, la replicazione multimaster può essere effettuata come replicazione asincrona, sincrona, o procedurale. Asincrona significa che le modifiche vengono acquisite in un registro mentre le transazioni avvengono a livello locale, e le modifiche vengono successivamente propagate ad altri siti per essere applicate. Dal momento che i dati possono essere aggiornati contemporaneamente in siti diversi, viene usata la risoluzione dei conflitti per riunire e risolvere le modifiche dei dati simultanee. Sincrona significa che tutti i siti partecipano ad una transazione, quindi i dati vengono impegnati o ripristinati simultaneamente. Evitando i conflitti, la replicazione sincrona richiede un ambiente stabile per il suo funzionamento continuo. La Replicazione procedurale permette di modificare grandi quantità di dati replicando i richiami a procedure memorizzate al fine di modificare i dati, ma non replica le modifiche ai dati stesse.

SymmetricDS acquisisce le modifiche in un registro mentre le transazioni sono impegnate localmente, quindi propaga i cambiamenti in background in modo asincrono. I conflitti vengono rilevati e gestiti attraverso un resolver che li riunisce e risolve automaticamente, e l’utente può configurare o scrivere degli script per avere dei resolver personalizzati. Si può inviare una chiamata di procedura remota e degli script SQL personalizzati ai nodi attraverso un evento di replicazione invece di inviare dei singoli cambiamenti di riga. Un evento di ricarica può essere usato come modo efficiente per inviare una grande quantità di dati con una espressione SQL invece di acquisire singole righe. Vi è anche una sessione speciale variabile che può essere utilizzata anche per impedire temporaneamente l’acquisizione dei dati durante le operazioni di batch.

Strumenti di amministrazione

Oracle Advanced Replication include degli strumenti server per l’amministrazione, tra cui una applicazione web, un’interfaccia PL / SQL, e un catalogo di replicazione. Oracle Enterprise Manager fornisce una applicazione web per la programmazione della replicazione ed il controllo dell’operazione, inclusa la documentazione in linea. Le stesse capacità amministrative sono disponibili da SQL interattivo con funzione PL / SQL e chiamate di procedura remota. Nel database, il catalogo di replicazione è un insieme di tabelle e viste che contiene informazioni amministrative sugli oggetti di replicazione e gruppi dal sito.

SymmetricDS include strumenti server per l’amministrazione, tra cui una applicazione web, molteplici interfacce di programmazione, e un modello di database. La console web include la programmazione della replicazione, il monitoraggio, gli strumenti di risoluzione dei problemi, e la documentazione in linea. L’amministrazione può essere effettuata anche da diverse interfacce, tra cui gli strumenti da riga di comando, chiamate REST, Java Management Extensions (JMX), e SQL interattivo. Nel database, le tabelle di configurazione controllano come il sistema si comporta mentre le tabelle di runtime contengono il registro di acquisizione, batch, e lo stato di replicazione.

Conclusioni

Mentre Oracle Advanced Replication e SymmetricDS usano termini e concetti differenti per la configurazione, entrambi forniscono la replicazione del database per migliorare l’accesso ai dati. Garantire che le applicazioni possano funzionare con dati a cui si può accedere velocemente e che siano sempre a disposizione è importante per il funzionamento continuo delle attività delle imprese, ed è qualcosa che i clienti si aspettano. La replicazione dei database è utilizzata in scenari di operazioni ad alta disponibilità, con distribuzione del carico, e disconnesse, e può essere la pietra angolare di una strategia di integrazione dati in tempo reale per l’impresa.

Il nuovissimo chip 3D XPoint surclassa sia la velocità della DRAM sia la capacità dei SSD

Le prestazioni elevate dei chip 3D XPoint incrementa di 10 volte la velocità della DRAM, con una capacità di archiviazione 1.000 volte superiore a quella dei chip NAND (SSD).

Intel e Micron hanno sviluppato un nuovo chip di memoria che può lavorare 1.000 volte più velocemente dei chip NAND in un flash drive e conservare 10 volte più dati degli usuali chip RAM.

Il nuovo chip, chiamato 3D Xpoint (pronunciato “crosspoint”) potrebbe fornire una incremento diretto al settore HPC e alle applicazioni ad altro parallelismo aiutando a ridurre o eliminare i colli di bottiglia che impediscono i dati di raggiungere i processori di alta fascia alla velocità a cui sarebbero in grado di elabolarli.

Parte della limitazione deriva dalla larghezza di banda limitata dei bus di dati o dall’interconnessione di dati ad alto volume che alimentano i processori tanto più velocemente quanto più sono in grado di spostare grandi volumi di dati dai dischi rigidi dei server a cluster di elaborazione di big-data, o alle unità flash dei server HPC.

3D XPoint potrebbe aumentare la velocità, memorizzando una quantità 10 volte maggiore di dati vicini al processore come chip NAND ordinari, convogliandoli ad una velocità limitata solo da chip di RAM comparativamente più lenti- velocità che renderebbe molto più facile per le applicazioni sfruttare l’architettura a collo di bottiglia dei chip multi-core di fascia alta di Intel.

3D XPoint è il principale nuovo sviluppo tra i chip di memoria da quando la memoria flash NAND è stata introdotta nel 1989, secondo una dichiarazione del 28 di luglio di Intel e Micron nella quale si annunciava l’avvento dei nuovi chip.

“Per decenni, l’industria ha cercato un modo per ridurre il ritardo di tempo tra il processore ed i dati per consentire un’analisi molto più veloce”, secondo una dichiarazione dell’annuncio di Rob Crooke, vice presidente senior e direttore generale del Non-Volatile Memory Solutions Group di Intel. “Questa nuova classe di memoria non volatile raggiunge questo obiettivo e offre una performance che cambia lo scenario delle soluzioni di memorizzazione ed archiviazione.”

I chip di memoria ad e ad alto volume potrebbero migliorare le prestazioni delle applicazioni ad uso intensivo di risorse quali il rilevamento delle frodi in tempo reale, l’analisi statistica dei dati genomici umani e di altre questioni che richiedono l’elaborazione di grandi quantità di dati in tempo reale.

Ma potrebbe anche aumentare le prestazioni e la durata della batteria dei PC e dei computer portatili con chip di memoria che memorizzano tanti dati quanto quelli dell’hard disk – e continuano ad archiviarli anche con l’alimentazione spenta – e prolungano la durata della batteria utilizzando solo tanta energia quanto quella dei chip di memoria DRAM.

La chiave della capacità di 3D XPoint sta nell’architettura alta densità, creata utilizzando conduttori perpendicolari che collegano 128 miliardi di celle di memoria densamente impacchettate per ciascun chip. Ogni cella contiene un bit di dati ed è cablata per una risposta rapida.

Quegli strati di celle di memoria densamente impacchettate sono anche impilabili, il che raddoppia solamente la capacità di 128GB nelle versioni iniziali a due strati di 3D XPoint.

Le edizioni successive avranno un maggior numero di strati di memoria e utilizzeranno il tradizionale pitch scaling litografico per ridurre la scala dei singoli circuiti e impacchettarne di più nello stesso spazio, secondo l’annuncio.

L’annuncio sottolinea che i dati contenuti in ogni cella vengono richiamati variando la quantità di tensione inviata al selettore, il che elimina la necessità di avere dei transistor, lasciando più spazio per l’archiviazione dei dati riducendo contemporaneamente i costi.

Secondo Marc Adams, presidente di Micron, nel suo annuncio riguardante l’annuncio del nuovo chip di memoria, grazie alla sua capacità e velocità, 3D XPoint potrebbe sostituire sia la memoria flash – che ha sostituito i dischi rigidi in applicazioni ad alte prestazioni – sia i chip di memoria DRAM,

Secondo un articolo apparso su Wired il 28 di Luglio che cita Moor Insights e l’analista strategico Patrick Moorhead, potrebbe anche cambiare il modo in cui funzionano le architetture dei sistemi informatici ad alta intensità di risorse, consentendo l’uso di “analisi edge” – sistemi di elaborazione ad alte prestazioni o di Big-Data situati in prossimità dei dati, non isolate in cloud HPC o aggregazioni di Big-Data collegati ai data center aziendali.

“Vedo tutto ciò entrare all’interno dell’azienda, in particolare in ambienti che utilizzano i database in-memory”, secondo una storia apparsa su eWEEK del 28 luglio, che cita anche Moorhead, il quale ha previsto che i nuovi mega-chip di memoria dovrebbero presentarsi in ambienti HPC innanzitutto per soddisfare il forte desiderio di potere, filtrando solo successivamente verso il basso all’interno delle imprese o applicazioni per data center che si avvantaggerebbero del loro potenziale per ridurre pure i costi.

“SAP, SAP HANA, Oracle, ovunque ci sia una motivazione per diminuire il costo contro la DRAM, o se si sta cercando di ottenere le massime prestazioni, si utilizza questo tipo di memoria invece della classica memoria flash NAND, che si userebbe negli SSD (dischi a stato solido) “, ha detto Moorhead. Come citato in eWEEK, secondo Bill Leszinske, vicepresidente Intel incaricato della pianificazione strategica e dello sviluppo aziendale per il Non Volatile Solutions Group, unitamente alle innovazioni di Intel, come il linguaggio di programmazione Non-Volatile Memory Express (NVMe) – che funziona su PCIe – potrebbe essere possibile collegare i dispositivi direttamente a dei chip 3D XPoint piuttosto che fare affidamento sulle delle connessioni SATA relativamente più lente, che restano il connettore primario dei dispositivi di archiviazione da addirittura due decenni dopo l’invenzione della SATA.

Un vantaggio fondamentale è che i chip XPoint utilizzano gli stessi set di istruzioni e interfacce come i chip esistenti e i prodotti di archiviazione- il che significa che non sarà necessario riscrivere il sistema operativo o le applicazioni per trarre vantaggio della spinta nelle prestazioni. La stessa tecnologia probabilmente filtrerà verso il basso fino ai PC ad alte prestazioni, ma ci vorrà ancora più tempo.

Intel e Micron non hanno annunciato dei prezzi piani di produzione, ma hanno detto che dei campioni dei chip 3D XPoint saranno disponibili per i partner OEM entro la fine dell’anno. Secondo le aziende, i primi sistemi costruiti con i nuovi chip dovrebbero essere spediti da un momento all’altro durante il 2016.