Quale mezzo deve essere utilizzato per il lungo periodo, il volume elevato, l'archiviazione dei dati (archiviazione)?

Questa domanda è stata ispirata da https://superuser.com/questions/374386/how-to-store-and-preserve-lots-of-data . Ci sono state altre domande simili, ma nessuno con gli stessi criteri.

Ciò è due domande in uno.

  1. Come memorizzare i record finanziari / critici che dovrebbero sopravvivere a qualsiasi cosa, bensì di un incendio e dovrebbero essere disponibili per decenni?
  2. Diciamo che voglio memorizzare foto / video di famiglia e desidero che le persone siano in grado di trovarle in memory a 100 anni da oggi e ancora poterli usarle. Come sarebbe stato fatto?

criteri

  1. A lungo termine significa 30+ anni garantiti . Media di 100 anni. [Se questo non è pratico, utilizzare la soluzione più vicina]
  2. Un alto volume significa un paio di terabyte.
  3. Le risposte possono essere soluzioni "no-compromise / industrial" o soluzioni pratiche per l'ufficio domestico / utenti di piccole imprese.
  4. I supporti non saranno attivi durante il periodo. (ad esempio, se si suggerisce dischi rigidi, non verranno spinning).
  5. Inoltre, non c'è alcuna aspettativa di aver bisogno di leggere questi archivi. Essi sono lì per l'emergenza o "per le generazioni future".
  6. Non dovrebbe richiedere la manutenzione (se del tutto ansible).

I miei pensieri:

  1. I CD-R / DVD-R mi hanno dimostrato, anche a breve termine, di essere un mezzo terribile per i backup. Essi sembrano essere molto fragili e sembrano perdere i loro dati molto brevi anche quando sono in condizioni incontaminate.
  2. Non posso fare a less di pensare che memorizzare i dati su un paio di hdd da 1 TB e poi aspettare loro di correre correttamente una decina o due dopo per essere un'idea terribile. Ho sbagliato?
  3. Le unità a nastro industriali sembrano un'opzione valida?

Carta

Oltre all'inchiostro di archiviazione su carta di archiviazione in deposito sigillato, non è provato che un mezzo corrente sia durato circa 100 anni senza alcun tipo di manutenzione.

Carta d'archivio

I fogli più vecchi sono stati fatti da materiali come la lino e la canapa, e così sono naturalmente alcalini. o acido libero, pertanto durano centinaia di anni. La carta del 20 ° secolo e la carta più moderna è di solito realizzata in polpa di legno, spesso acida e non mantenuta per lunghi periodi.

Inchiostri archivistici

Questi inchiostri permanenti e non sbiaditi sono resistenti alla luce, al calore e all'acqua e non contengono impurità che possano influenzare la permanenza di carta o materiali fotografici. Gli inchiostri Black Actinic sono chimicamente stabili e presentano un pigmento inorganico che non ha tendenza ad assorbire le impurità come altri pigmenti inchiostrati possono.

Memorizzazione ridondante

Torvalds una volta disse

Solo i wimps usano il backup del nastro: gli uomini _real_ caricano solo le loro cose importnti su ftp e lasciano che il resto del mondo lo specchi

Ciò suggerisce che non si dovrebbe fare affidamento su una singola copia su un singolo supporto.

Media non magnetiche?

http://www.zdnet.com/blog/perlow/the-bell-tolls-for-your-magnetic-media/9364?tag=content;siu-container

  • Tipico esempio di degrado irreversibile dei supporti magnetici.
  • Problemi di hardware e software (e formati di dati)

Non sisthemes specializzati

Nel 2002, c'erano grandi timori che i dischi diventassero illeggibili, poiché i computer in grado di leggere il formato erano diventati rari e le unità capaci di accedere ai dischi ancora più rari. Oltre alla difficoltà di emulare il codice originale, un problema importnte era che le immagini fissi erano state memorizzate sul laserdisc come video analogico a singolo frame,

http://en.wikipedia.org/wiki/BBC_Domesday_Project#Preservation

Memoria personale a lungo termine

http://www.zdnet.com/blog/storage/long-term-personal-data-storage/376

  • sia il supporto che il formato possono diventare illeggibili.
  • printingre su carta acido-free con inchiostri pigmentati e conservare in luogo fresco, asciutto e scuro.
  • Il primo problema è scegliere i formati di dati per la massima durata.
  • Evitare di utilizzare i formati proprietari
  • USCSF trasferisce tutti i propri nastri originali – molti in formati ormai obsoleti come BetaSP e VHS – al formato motionJPEG2000 di 75Mbit

Risposta breve

È imansible garantire un lungo periodo di tempo a causa dell'entropia (anche chiamata morte!). I dati digitali decadono e muoiono, proprio come each altra cosa nell'universo. Ma può essere rallentato.

Attualmente non esiste un modo di prova a prova di fallimento e scientificamente provato per garantire 30 anni di archiviazione dati freddi. Alcuni progetti mirano a farlo, come il progetto Rosetta Disks del museo Long Now , anche se sono ancora molto costosi e con una bassa densità di dati (circa 50 MB).

Nel frattempo, è ansible utilizzare mezzi ottici resilienti scientificamente testati per l'immagazzinamento a freddo come il tipo di tipo Blu-ray Dischi HTL come Panasonic o DVD + R di archiviazione come Verbatim Gold Archive e conservarli in scatole strette in aria in un punto debole (evitare alta temperatura) e fuori dalla luce.

Inoltre essere REDUNDANT : effettuare più copie dei tuoi dati (alless 4) e calcolare hash per controllare regolarmente che tutto va bene, e each pochi anni dovresti riscrivere i tuoi dati su nuovi dischi. Inoltre, utilizza un sacco di codici di correzione degli errori , consentono di riparare i tuoi dati danneggiati!

Lunga risposta

Perché i dati sono danneggiati nel tempo? La risposta risiede in una sola parola: l' entropia . Questa è una delle forze primarie e inevitabili dell'universo, che rende i sisthemes sempre less ordinati nel tempo. La corruzione dei dati è esattamente quella: un disturbo in ordine di bit. In altre parole, l'universo odia i tuoi dati .

Lotta contro l'entropia è esattamente come combattere la morte: non è probabile che sia successo, mai. Ma puoi trovare modi per rallentare la morte, proprio come puoi rallentare l'entropia. È anche ansible ingannare l'entropia riparando le corruzioni (in altre parole: non puoi fermare le corruzioni, ma puoi riparare dopo che avvengono se hai preso misure in anticipo!). Proprio come tutto ciò che riguarda la vita e la morte, non c'è nessun proiettile magico, né una soluzione per tutti, e le soluzioni migliori richiedono di impegnarsi direttamente nella digitalizzazione dei tuoi dati. E anche se fai tutto bene, non sei garantito per mantenere i tuoi dati in modo sicuro, puoi solo massimizzare le tue possibilità.

Ora per la buona notizia: ora esistono modi abbastanza efficienti per mantenere i tuoi dati, se si combinano supporti di memorizzazione di buona qualità e buone strategie di archiviazione / curatura : si dovrebbe progettare per il fallimento .

Quali sono le buone strategie di cura? Facciamo una cosa dritto: la maggior parte delle informazioni che trovenetworking sarà di backup, non di archiviazione. Il problema è che la maggior parte delle persone trasferirà le proprie conoscenze sulle strategie di backup per l'archiviazione, e quindi molti miti sono ora comunemente ascoltati. Infatti, l'archiviazione dei dati per alcuni anni (backup) e l'archiviazione dei dati per il più lungo tempo ansible, per alless dieci anni (archiviazione), sono obiettivi totalmente diversi e richiedono quindi strumenti e strategie differenti.

Fortunatamente, ci sono abbastanza ricerche e risultati scientifici, quindi consiglio di fare riferimento a tali documenti scientifici piuttosto che su forum o riviste. Qui raccolgo alcune delle mie letture.

Inoltre, fate attenzione ai reclami e agli studi scientifici indipendenti , sostenendo che tale o tale mezzo di archiviazione è perfetto. Ricorda il famoso progetto BBC Domesday: «Digital Domesday Book dura 15 anni e non 1000» . Sempre doppio controllo degli studi con carte veramente indipendenti e, se non ce n'è, sempre supporre che il supporto di archiviazione non sia utile per l'archiviazione.

Cerchiamo di chiarire ciò che stai cercando (dalla tua domanda):

  • Archiviazione a lungo termine : si desidera conservare copie dei tuoi dati "personali" sensibili e irreparabili. L'archiviazione è fondamentalmente diversa da un backup , come spiegato qui : i backup sono per i dati tecnici dinamici che vengono regolarmente aggiornati e quindi devono essere aggiornati in backup (ossia OS, layout di cartelle di lavoro, ecc.), Mentre gli archivi sono dati statici che probabilmente scrivere solo una volta e leggere di volta in volta . Gli archivi sono per dati intemazionali , di solito personali.

  • Memorizzazione a freddo : si desidera evitare la massima manutenzione dei dati archiviati. Questo è un vincolo BIG, in quanto significa che il mezzo deve utilizzare componenti e una metodologia di scrittura che rimane stabile per molto tempo, senza alcuna manipolazione da parte tua e senza bisogno di connessione a un computer o alla fornitura elettrica.

Per facilitare la nostra analisi, studiamo prima le soluzioni di stoccaggio a freddo e poi le strategie di archiviazione a lungo termine.

Mezzi di stoccaggio a freddo

Abbiamo definito innanzitutto che cosa dovrebbe essere un buon medium di stoccaggio freddo: dovrebbe conservare i dati per un lungo periodo senza necessità di manipolazione (ecco perché è chiamato "freddo": è ansible memorizzarlo in un armadio e non è necessario collegarlo un computer per mantenere i dati).

La carta può sembrare il mezzo di memorizzazione più resiliente sulla terra, perché spesso troviamo un manoscritto molto antico di epoca antica. Tuttavia, la carta soffre di gravi inconvenienti: in primo luogo, la densità dei dati è molto bassa (non può memorizzare più di ~ 100 KB su una carta, anche con piccoli caratteri e strumenti informatici) e si degrada nel tempo senza alcuna possibilità di monitoraggio: carta , proprio come i dischi rigidi, soffrono di una corruzione silenziosa. Ma mentre è ansible monitorare i corrotti silenziati sui dati digitali, non è ansible su carta. Ad esempio, non è ansible garantire che un'image mantenga gli stessi colors in un solo decennio: i colors si degradano e non hai modo di trovare i colors originali. Naturalmente, puoi curare le tue immagini se sei un pro del restauro delle immagini, ma questo richiede molto tempo, mentre con i dati digitali puoi automatizzare questo process di curazione e di ripristino.

Le unità disco rigido (HDD) sono note per avere una durata media di 3 a 8 anni: non solo si degradano nel tempo, sono garantite alla fine di morire (cioè: inaccessibili). Le seguenti curve mostrano questa tendenza per tutti i HDD a morire ad una velocità sconcertante:

Curva di vasca che mostra l'evoluzione del tasso di guasto dell'HDD in base al tipo di errore (applicabile anche a qualsiasi dispositivo progettato):

curva-HDD1

Curva che mostra la frequenza di guasto dell'HDD, tutti i tipi di errore si sono uniti: curva HDD2

Fonte: Backblaze

È ansible vedere che sono presenti 3 tipi di HDD relativamente al loro guasto: quelli in rapida perdita (ad esempio: errori di fabbricazione, HDD di qualità difettosa, guasto alle testate, ecc.), Il tasso di morte costante (buona produzione, muoiono per vari " normalmente ", questo è il caso per la maggior parte degli HDD) e, infine, quelli robusti che vivono un po 'più a lungo della maggior parte degli HDD e alla fine muoiono presto dopo quelli" normali "(ad esempio: HDDs fortunati, non troppo usati, condizioni ambientali ideali, ecc.). Quindi, è garantito che il tuo HDD morirà.

Perché gli HDD muoiono così spesso? Voglio dire, i dati sono scritti su un disco magnetico e il field magnetico può durare decenni prima di svanire. Il motivo per cui muoiono è perché il mezzo di memorizzazione (disco magnetico) e l' hardware di lettura (scheda elettronica + testa di filatura) sono accoppiati : non possono essere dissociati, non è ansible estrarre il disco magnetico e leggerlo con un'altra testa perché prima la scheda elettronica (che converte i dati fisici in digitale) è diversa per quasi each HDD (anche dello stesso marchio e riferimento, dipende dalla fabbrica originaria) e il meccanismo interno con la testa di filatura è così complicato che oggi è imansible per un umano mettere perfettamente una testa di filatura su dischi magnetici senza ucciderli.

Inoltre, i dischi rigidi sono noti per demagnetizzare nel tempo se non utilizzati (incluso SSD). Così, non è ansible memorizzare i dati su un disco rigido, memorizzarli in un armadio e pensare che conserverà i dati senza alcuna connessione elettrica: è necessario colbind il disco fisso ad una fonte elettrica alless una volta all'anno o per coppie di anni . Quindi, i dischi rigidi non sono chiaramente una buona misura per l'immagazzinamento a freddo.

Nastri magnetici : sono spesso descritti come il go-to per le necessità di backup e per estensione per l'archiviazione. Il problema con i nastri magnetici è che sono molto sensibili: le particelle di ossido magnetico possono essere facilmente deteriorate da sole, acqua, aria, graffi, demagnetizzati dal tempo o da qualsiasi dispositivo elettromagnetico o semplicemente cadere con il tempo o con la printing . Questo è il motivo per cui sono solitamente utilizzati solo in data center da professionisti. Inoltre, non è mai stato dimostrato di poter conservare i dati per più di un decennio. Quindi, perché vengono spesso consigliati per i backup? Perché sono stati a buon mercato: nei tempi passati, è costato da 10x a 100x più conveniente per utilizzare nastri magnetici di HDD e gli HDD tendevano a essere molto less stabili di adesso. Quindi, i nastri magnetici sono principalmente consigliati per i backup a causa dell'efficienza dei costi , non a causa della resilienza, che è ciò che ci interessa più quando si tratta di archiviare i dati.

Le tabs CompactFlash e Secure Digital (SD) sono noti per essere abbastanza robuste e robuste, in grado di sopravvivere a condizioni catastrofiche .

Le tabs di memory nella maggior parte delle telecamere sono praticamente indistruttibili, trovate la rivista Digital Camera Shopper. Cinque formati di tabs di memory sopravvissuto a essere bolliti, calpestati, lavati e dunked in caffè o cola.

Tuttavia, come qualsiasi altro mezzo a base magnetica, si basa su un field elettrico per conservare i dati, e quindi se la carta esaurisce il succo, i dati possono essere completamente persi. Quindi non è perfettamente adatta per l'immagazzinamento a freddo (come è necessario riscrivere periodicamente tutti i dati sulla scheda per aggiornare il field elettrico), ma può essere un buon mezzo per i backup e l'archiviazione a breve o medio termine.

Mezzi ottici: i supporti ottici sono una class di supporti di memorizzazione basati sul laser per leggere i dati, come CD, DVD o Blu-ray (BD). Ciò può essere visto come un'evoluzione della carta, ma scriviamo i dati in una dimensione così piccola, che abbiamo bisogno di un materiale più preciso e resiliente della carta, e i dischi ottici sono proprio questo. I due maggiori vantaggi dei media ottici sono che il supporto di memorizzazione è disaccoppiato dall'hardware di lettura (ad esempio, se il lettore DVD non riesce, è sempre ansible acquistare un altro per leggere il disco) e che è basato sul laser, che lo rende universale e prova futura (cioè, finché sai come fare un laser, puoi sempre modificarlo per leggere i bit di un disco ottico per emulazione, proprio come ha fatto CAMILEON per il progetto Domesday BBC ).

Come tutte le tecnologie, nuove iterazioni non solo offrono una maggiore densità (spazio di stoccaggio), ma anche una migliore correzione degli errori e una migliore resistenza al decadimento ambientale (non sempre, ma generalmente vero). Il primo dibattito sull'affidabilità del DVD era tra DVD-R e DVD + R, e anche se i DVD-R sono ancora oggi comuni, i DVD + R sono riconosciuti più affidabili e precisi . Ci sono ora dischi DVD di tipo archivio, appositamente realizzati per l'immagazzinamento a freddo, sostenendo che possono resistere a un minimo di ~ 20 anni senza alcuna manutenzione:

L'archivio DVD di Verbatim Gold […] è stato classificato come il DVD-R più affidabile in un approfondito test di stress a lungo termine da parte della rivista c't tedesca considerata (c't 16/2008, pp. 116-123 ) […] raggiungendo una durata minima di 18 anni e una durata media di 32 a 127 anni (a 25 ° C, umidità del 50%). Nessun altro disco è venuto vicino a questi valori, il secondo DVD-R ha una durata minima di soli 5 anni.

Da LinuxTech.net .

Inoltre, alcune aziende specializzate in un'archiviazione a lungo termine di DVD e commercializzano in modo estensivo, come il M-Disc di Millenniata o il DataTresorDisc, sostenendo di poter conservare i dati per oltre 1000 anni e verificati da alcuni studi (non indipendenti) 2009) tra gli altri less scientifici .

Tutto questo sembra molto promettente! Sfortunatamente, non ci sono abbastanza studi scientifici indipendenti per confermare queste affermazioni e quelli poco disponibili non sono così entusiasti:

L'umidità (80% RH) e la temperatura (80 ° C) hanno accelerato l'invecchiamento su più DVD di oltre 2000 ore (circa 83 giorni) di prova con controllo regolare della leggibilità dei dati: L'umidità e la temperatura accelerano l'invecchiamento su più marchi DVD

Traduzione dall'istituto francese per l'archiviazione di dati digitali (Archives de France), studio dal 2012.

Il primo grafico mostra un DVD con una lenta evoluzione della degradazione. Il secondo DVD con curve di degradazione rapide. E la terza è per DVD speciali "molto a lungo termine" come M-Disc e DataTresorDisc. Come possiamo vedere, la loro prestazione non si adatta perfettamente alle rivendicazioni, essendo inferiori o uguali a DVD standard e non archivistici!

Tuttavia, i dischi ottici inorganici come M-Disc e DataTresorDisc hanno un vantaggio: sono abbastanza insensibili alla degradazione luminosa:

L'invecchiamento accelerato con luce (750 W / m²) durante 240 ore: L'invecchiamento accelerato luce su più marche di DVD

Questi sono ottimi risultati, ma un DVD di archiviazione, come l'archivio di Verbatim Gold, raggiunge anche le stesse performance, e inoltre la luce è il parametro più controllabile per un object: è abbastanza facile mettere il DVD in una scatola chiusa o in un armadio rimuovendo each ansible impatto della luce. Sarebbe molto più utile get un DVD che sia molto resistente alla temperatura e all'umidità rispetto alla luce.

Questo stesso team di ricerca ha anche studiato il mercato Blu-ray per vedere se ci sarebbe un marchio con un buon mezzo per l'immagazzinamento a freddo a lungo termine. Ecco il loro riscontro:

L'umidità e la temperatura accelerano l'invecchiamento su più marche Blu-ray, con gli stessi parametri che per i DVD: temp-bd

L'invecchiamento accelerato luce su diversi marchi di BluRays, gli stessi parametri: light-bd

Tradotto da questo studio di Archives de France, 2012.

Due sumri di tutti i risultati (in francese) qui e qui .

In fin dei conti, il miglior disco Blu-ray (da Panasonic) ha eseguito in modo simile al miglior DVD di archiviazione in umidità + temperatura, pur essendo praticamente insensibile alla luce! E questo disco Blu-ray non è nemless un grado di archiviazione. Inoltre, i dischi Blu-ray utilizzano un codice di correzione degli errori avanzato rispetto ai DVD (stessi utilizzando una versione migliorata relativamente ai CD), che riduce ulteriormente i rischi di perdere i dati. Pertanto, sembra che alcuni dischi BluRay possano essere una buona scelta per l'immagazzinamento a freddo.

Infatti, alcune aziende stanno iniziando a lavorare su dischi Blu-ray di tipo archivistico e ad alta densità come Panasonic e Sony, annunciando che saranno in grado di offrire da 300 GB a 1 TB di archiviazione con una durata media di 50 anni. Inoltre, le grandi aziende si stanno orientando verso supporti ottici per l'immagazzinamento a freddo (perché consumano molto less risorse in quanto possono essere immagazzinate a freddo senza alimentazione elettrica), ad esempio Facebook che ha sviluppato un sistema robotizzato per utilizzare dischi Blu-ray come "freddo storage " per i dati che il loro sistema raramente accede.

Lungo l'iniziativa d'archivio: altri progetti interessanti, come il progetto Rosetta Disc del museo Long Now , che è un progetto per scrivere pagine scalate microscopicamente della Genesi in tutte le lingue della terra, al quale è stata tradotta la Genesi. Questo è un grande progetto che è il primo a offrire un supporto che consente di memorizzare 50 MB per l'archiviazione a freddo veramente a lungo termine (dato che è scritto in carbonio) e con accesso in futuro, in quanto è necessario solo un ingranditore per accedere a dati (senza particolari specifiche di formato né difficoltà tecnologiche da gestire come il bundle viola del Blu-ray, basta bisogno di un magnifier!). Tuttavia, questi sono ancora manualmente fatti e quindi stimati a costare circa $ 20K, che è un po 'troppo per uno schema di archiviazione personale immagino.

Soluzioni basate su Internet : Ancora un altro archivio medio a freddo i tuoi dati è sopra la networking. Tuttavia, le soluzioni di backup cloud non sono una buona condizione, perché la preoccupazione primaria che le società hosting di cloud non possono vivere finché si desidera mantenere i tuoi dati. Altri motivi includono il fatto che è orribilmente lento al backup (in quanto trasferisce via Internet) e la maggior parte dei provider richiede che i file esistano anche sul sistema per mantenerli online. Ad esempio, sia CrashPlan che Backblaze elimineranno definitivamente i file che non sono stati alless visti una volta nel tuo computer negli ultimi 30 giorni, quindi se si desidera caricare i dati di backup memorizzati solo su dischi rigidi esterni, è necessario colbind USB HDD alless una volta al mese e sincronizza con la tua cloud per ripristinare il conto alla rovescia. Tuttavia, alcuni servizi cloud offrono di mantenere i tuoi file a tempo indefinito (purché paghi ovviamente) senza un conto alla rovescia, come SpiderOak. Quindi, prestate molta attenzione alle condizioni e all'uso della soluzione di backup basata su cloud che scegli.

Un'alternativa ai provider di backup cloud è affittare online il proprio server privato e, se ansible, scegliere uno con mirroring automatico / backup dei dati in caso di guasti hardware da parte loro (alcuni anche ti garantiscono contro i dati persi nei loro contratti , ma naturalmente è più costoso). Questa è una grande soluzione, innanzitutto perché hai ancora i tuoi dati e in secondo luogo perché non dovrai gestire i guasti hardware, questa è la responsabilità del tuo host. E se un giorno il tuo host esce dall'attività commerciale, puoi ancora get i tuoi dati (scegli un host serio in modo che non si chiuda la notte, ma ti informa in anticipo, forse puoi chiederti di metterlo sul contratto), e rehost altrove.

Se non si desidera avere problemi di impostare il proprio server privato privato, e se lo puoi permettere, Amazon offre un nuovo servizio di archiviazione dati, chiamato Glacier . Lo scopo è esattamente quello di archiviare i dati a lungo termine: pertanto, è molto necessario memorizzare i dati su un ghiacciaio, ma costa ancora di più per get questi dati, poiché questo servizio è fatto per memorizzare i dati fuori dalla portta , per non mantenere i dati che si desidera accedere spesso. Ciò significa che questo servizio elenca i prezzi per la scrittura dei dati, ma anche per leggerli. Questo servizio ha un costo enorme, ma può essere un ottimo affare per alcuni dei tuoi dati più sensibili (ad esempio: se hai qualche file di text o immagini molto sensibili, dato che questo tipo di dati di solito è di size ridotte, non ti costerà molto da immagazzinare in un ghiacciaio).

Mancanza di immagazzinamento a freddo : Tuttavia, c'è un grosso difetto in qualsiasi mezzo di memorizzazione fredda: non esiste alcun controllo di integrità, perché i mezzi di memorizzazione fredda NON controlla automaticamente l'integrità dei dati (possono semplicemente implementare schemi di correzione degli errori per "guarire" un po ' il danno dopo la corruzione è avvenuto, ma non può essere impedito né gestito automaticamente!) perché, contrariamente a un computer, non esiste un'unità di elaborazione per calcolare / journalizzare / controllare e correggere il filesystem. Mentre con un computer e più unità di archiviazione, è ansible verificare automaticamente l'integrità degli archivi e riflettere automaticamente su un'altra unità, se necessario, in caso di danneggiamenti in un archivio dati (a patto che disponga di più copie dello stesso archivio).

Archiviazione a lungo termine

Anche con le migliori tecnologie attualmente disponibili, i dati digitali possono essere freddi solo per alcuni decenni (circa 20 anni). Quindi, a lungo andare, non puoi fare affidamento solo sull'archiviazione a freddo: è necessario impostare una metodologia per il process di archiviazione dei dati per assicurare che i tuoi dati siano recuperati in futuro (anche con le modifiche tecnologiche) e minimizzare i rischi di perdere i tuoi dati. In altre parole, devi diventare il curatore digitale dei tuoi dati, riparare le corruzioni quando si verificano e ricreare nuove copie quando necessario.

Non ci sono regole sbagliate, ma qui sono alcune strategie di cura curative , in particolare uno strumento magico che renderà più facile il tuo lavoro:

  • Principio di ridondanza / replica : La ridondanza è l'unico strumento che può ripristinare gli effetti dell'entropia , un principio basato sulla teoria dell'informazione. Per mantenere i dati, è necessario duplicare questi dati. I codici di errore sono esattamente un'applicazione automatica del principio di ridondanza. Tuttavia, inoltre , è necessario assicurarsi che i dati siano ridondanti : copie multiple degli stessi dati su dischi diversi, copie multiple su diversi tipi di supporto (in modo che se un mezzo non riesce a causa di problemi intrinseci, c'è poca probabilità che gli altri su supporti diversi in particolare, dovresti avere sempre alless 3 copie dei tuoi dati, chiamati anche ridondanza 3 modulare nell'ingegneria, in modo che se le copie diventano danneggiate, puoi dare un voto semplice a riparare i tuoi file dalle tue 3 copie. Ricordate sempre la consulenza della bussola del marinaio:

E 'inutile portre due bussole, perché se uno va male, non si può mai sapere quale sia corretta, o se entrambi sono sbagliati. Prendi sempre una bussola, o più di tre.

  • Codici di correzione degli errori : questo è lo strumento magico che renderà la tua vita più facile ei tuoi dati più sicuri. I codici di correzione degli errori (ECCs) sono un task matematico che genera dati che possono essere utilizzati per la riparazione dei dati. Questo è più efficace, poiché le ECC possono riparare molto più i tuoi dati usando molto less spazio di archiviazione di una semplice replica (cioè facendo più copie dei tuoi file) e possono anche essere utilizzati per verificare se il file è corruzione, e anche individuare where sono quelle corruzioni . Infatti, questa è esattamente un'applicazione del principio della ridondanza, ma in modo più intelligente della replica. Questa tecnica è ampiamente utilizzata in qualsiasi comunicazione a lungo termine, ad esempio 4G, WiMax e persino le comunicazioni spaziali della NASA. Sfortunatamente, anche se ECC sono onnipresenti nelle telecomunicazioni, non sono in riparazione di file, forse perché è un po 'complesso. Tuttavia, sono disponibili alcuni software, come il famoso (ma ora vecchio) PAR2, DVD Disaster (che offre aggiunte di codici di correzione degli errori sui dischi ottici) e pyFileFixity (che sviluppo in parte per superare i limiti e le emissioni PAR2). Ci sono anche file system che implementano opzionalmente Reed-Solomon come ZFS, che è tecnicamente una generalizzazione di RAID5 (ma molto meglio).

  • Controllare regolarmente l'integrità dei file: cancella i tuoi file e controlla di tanto in tanto (ad esempio, una volta all'anno, ma dipende dalle condizioni di memorizzazione e dalle condizioni ambientali). Quando vedi che i tuoi file hanno subito una corruzione, è giunto il momento di riparare utilizzando le ECC generate da te, se ne avete fatto, e / o di creare una nuova copia fresca dei tuoi dati su un nuovo supporto di archiviazione. Il controllo dei dati, la riparazione della corruzione e la creazione di nuove copie fresche è un ottimo ciclo di curazione che assicurerà che i tuoi dati siano al sicuro. Controllare in particolare è molto importnte perché le copie dei file possono essere danneggiate in silenzio e se copiate le copie manomesse, fininetworking con file completamente danneggiati. Ciò è ancora più importnte con i mezzi di memorizzazione a freddo, come i dischi ottici, che NON controlla automaticamente l'integrità dei dati (già implementano ECC per guarire un po ', ma non possono controllare né creare nuove copie fresche automaticamente, è il tuo lavoro!) . Per monitorare le modifiche dei file, è ansible utilizzare lo script rfigc.py di pyFileFixity o altri strumenti UNIX come md5deep . È inoltre ansible controllare lo stato di salute di alcuni supporti di memorizzazione come i dischi rigidi utilizzando strumenti come Hard Drive Sentinel o smartmontools open source.

  • Conserva i tuoi archivi medi in luoghi diversi (con alless una copia al di fuori della tua casa!) Per evitare events vittime di events catastrofici come inondazioni o incendi. Ad esempio, un disco ottico al tuo lavoro o un backup basato su clouds può essere una buona idea per soddisfare questo requisito (anche se i fornitori di cloud possono essere arrestati in qualsiasi momento, a patto che tu abbia altre copie, sarai sicura , i fornitori di cloud serviranno solo come archivi offsite in caso di emergenza).

  • Conservare in contenitori specifici con parametri ambientali controllati : per i supporti ottici, conservare lontano dalla luce e in una scatola impermeabile per evitare l'umidità. Per gli azionamenti duri e le tabs SD, conservare in maniche antimagnetiche per evitare che l'elettricità residua per manomettere l'azionamento. È inoltre ansible memorizzare in sacco / scatola in aria e tenuta in acqua e conservare in un congelatore: le temperature lente rallentano l'entropia e si può estendere molto la durata di vita di qualsiasi mezzo di memorizzazione come tale (basta assicurarsi che l'acqua ha vinto non entri dentro, altrimenti il ​​tuo medium muore rapidamente).

  • Utilizzare hardware di buona qualità e controllarli in anticipo (ad esempio, quando si acquista una scheda SD, provare tutta la scheda con un software come la scansione HDD per verificare che tutto va bene prima di scrivere i dati). Ciò è particolarmente importnte per gli azionamenti ottici, perché la loro qualità può modificare in modo drastico la qualità dei dischi bruciati, come dimostra lo studio Archives de France (un masterizzatore DVD male produrrà DVD che dureranno molto less).

  • Scegli attentamente i tuoi formati di file: non tutti i formati di file sono resilienti contro la corruzione, alcuni sono anche chiaramente deboli. Ad esempio, le immagini .jpg possono essere completamente rotte e illeggibili manomettendo solo uno o due byte. Stesso per gli archivi 7zip. Questo è ridicolo, quindi fai attenzione al formato di file dei file archiviati. Come regola generale, il text semplice e chiaro è il migliore, ma se è necessario comprimere, utilizzare la zip non solid e per le immagini, utilizzare JPEG2 (non open-source ancora …). Maggiori informazioni e recensioni di curatori digitali digitali qui , qui e qui .

  • Conservare insieme agli archivi dati each software e le specifiche necessarie per leggere i dati. Ricorda che le specifiche cambiano rapidamente e quindi in futuro i tuoi dati potrebbero non essere più leggibili, anche se è ansible accedere al file. Pertanto, si dovrebbe preferire formati e software open source e memorizzare il codice sorgente del programma lungo i dati in modo da poter sempre adattare il programma dal codice sorgente per lanciare da un nuovo sistema operativo o un computer.

  • Molti altri methods e approcci sono disponibili qui , qui e in varie parti di Internet.

Conclusione

Raccommand di usare ciò che puoi avere, ma rispettare sempre il principio della ridondanza (fare 4 copie!) E controllare regolarmente l'integrità (pertanto devi pre-generare in precedenza un database di hashs MD5 / SHA1) e creare nuovi copie in caso di corruzione. Se lo fai, puoi mantenere tecnicamente i tuoi dati per tutto il tempo che desideri, qualunque sia il tuo supporto di archiviazione. Il tempo tra each controllo dipende dall'affidabilità dei tuoi supporti di memorizzazione: se si tratta di un disco floppy, controllare each due mesi, se è un Blu-ray HTL, controllare each 2/3 anni.

Adesso, nella migliore delle ipotesi, consigliamo di utilizzare i dischi Blu-ray HTL oi dischi DVD di archiviazione memorizzati in contenitori opachi a tenuta stagna e conservati in un luogo fresco. Inoltre, è ansible utilizzare tabs SD e fornitori basati su cloud come SpiderOak per memorizzare le copie ridondanti dei tuoi dati o anche unità rigide se è più accessibile.

Utilizza un sacco di codici di correzione degli errori , risparmieranno la tua giornata. Inoltre è ansible eseguire più copie di questi file ECC (ma più copie dei tuoi dati sono più importnti delle copie multiple di ECC perché i file ECC possono ripararsi!).

Queste strategie possono essere implementate usando l'insieme di strumenti che sto sviluppando (open source): pyFileFixity . Questo strumento è stato in realtà avviato da questa discussione, dopo aver trovato che non ci sono strumenti gratuiti per gestire completamente la fissazione dei file. Inoltre, fare riferimento al readme e wiki del progetto per ulteriori informazioni sulla fissazione dei file e la curazione digitale.

Su una nota finale, spero davvero che più R & S sarà posta su questo problema. Questo è un problema importnte per la nostra società attuale, sempre più dati digitalizzati, ma senza alcuna garanzia che questa massa di informazioni sopravviverà più di qualche anno. E 'abbastanza deprimente, e penso davvero che questo problema dovrebbe essere messo molto di più sul fronte, in modo che questo diventi un punto di marketing per i costruttori e le aziende a realizzare dispositivi di archiviazione che possono durare per le generazioni future.

/ EDIT: leggete qui sotto per una pratica routine di curazione .

Non esiste una soluzione facile. La manutenzione dell'archivio è un process , non un lavoro. Tutti e tre i tipi di supporti archiviati attualmente disponibili hanno i propri vantaggi e minus, tuttavia questi argomenti si applicano a tutti i tipi di supporti:

  1. Nessuno ha memorizzato DVD o dischi rigidi per 30 o 100 anni, per ovvie ragioni. Quindi non c'è nessuna traccia e nessuno sa come i media staranno. I test di invecchiamento artificiale non si dimostrano molto, e si contano sui test del fornitore (non imparziale).

  2. È necessario memorizzare i supporti nell'ambiente controllato per get i migliori risultati (temperatura / umidità costante, luce bassa, ecc.). In caso contrario la durata media è accorciata in modo significativo.

  3. È necessario mantenere l'hardware e il software che leggono i supporti (ad esempio le interfacce SATA potrebbero non essere prontamente disponibili in 30 anni).

Quindi, a mio parere, la sola soluzione vitale per gli utenti domestici o le piccole imprese è questa:

  1. Mantieni copie multiple di tutti i dati su diversi tipi di supporti (sia su dischi rigidi che su DVD)
  2. Conservare più copie di tutti i dati in più posizioni (in casa e nella cassetta di sicurezza della banca).
  3. Copia tutti i dati in nuovi media each tanto (ad es. Copia su un nuovo disco rigido e nuovi dischi DVD each 2 anni. A mano a mano che la densità dei dati aumenta, probabilmente hai bisogno anche di less dischi.
  4. Mantieni copie cartacee per tutti i dati critici, se ansible (per es. Stamparli i principali libri annuali per la tua azienda, printingre le fotografie di famiglia più preziose, ecc.)

Il follow-up rapido della mia precedente risposta in precedenza sarà resa più concisa e estesa con informazioni aggiuntive (ma non di primaria importnza) e riferimenti che non posso aggiungere nella prima risposta a causa dei vincoli di lunghezza 30K.

Poiché l'archiviazione a lungo termine è un process di curazione, qui ci sono altre cose che si potrebbe desiderare di prestare attenzione per rendere il process più efficiente e consumare less tempo (e risorse):

  • Deduplicazione : poiché l'unico modo per garantire l'archiviazione a lungo termine è attraverso la ridondanza deliberatamente progettata, si desidera evitare i dati ridondanti inutili (ad esempio, copie di file scaricati dal tuo chiavetta USB al disco rigido di archiviazione, ma hai già una copia dal computer principale!). I dati ridondanti indesiderati, che di solito sono chiamati duplicati, sono cattivi, sia nel costo di archiviazione (che richiedono più risorse di archiviazione, ma è difficile trovarle quando necessario), per il tuo process (cosa succede se avete diverse versioni dello stesso file? Come puoi sapere quale copia è corretta?) E per il tuo tempo (aggiunge i tempi di trasferimento quando sincronizzerai il backup con tutti gli archivi). Questo è il motivo per cui i servizi archivistici professionali offrono solitamente la deduplicazione automatica: i file che sono esattamente simili avranno lo stesso inodo e non prenderanno alcun spazio aggiuntivo. Questo è ciò che SpiderOak fa per esempio. Ci sono strumenti automatici che puoi utilizzare, aggiungerò alcuni refs in un secondo momento, ma il filesystem IIRC ZFS può farlo automaticamente per te.

  • Priorità / categorizzazione : come si può vedere, l'archiviazione a lungo termine è un process che richiede tempo che deve essere eseguito regolarmente (per controllare la sanità, sincronizzare archivi tra i media, creare nuovi archivi su nuovi mezzi per sostituire i destinatari, riparare i file utilizzando codici di correzione degli errori , eccetera.). Per ridurre al minimo il tempo che costa, cercare di definire diversi schemi di protezione a seconda della priorità dei tuoi dati in base alle categorie . L'idea è che quando si spostano i dati del computer su un disco rigido esterno utilizzato per l'archiviazione a lungo termine, le inserisci direttamente in una cartella che definisce la priorità di backup: "import", "personale", "importnte", "critico" ". Quindi puoi definire diverse strategie di backup per each cartella: riserva la protezione completa (ad esempio, backup su 3 hard disk + cloud + codici di correzione degli errori + BluRays) solo per i dati più critici che si desidera mantenere tutta la tua vita (la cartella critica) , quindi una protezione media per i dati "importnti" (ad esempio, backup su 3 hard disk + nuvola) e poi "personali" vengono semplicemente copiati su alless due dischi rigidi esterni e "import" non ottiene alcuna copia (o forse su un hard se la sincronizzazione non è troppo lunga …). Di solito, vednetworking che "non importnte" conterrà più dati, quindi "less", poi "importnte" molto less e "critico" sarà piuttosto minuscolo (less di 50 GB per me). Ad esempio, in "critico" metterai il tuo contratto di casa e le tue foto di nozze e nozze. Quindi in "importnti" saranno documenti che non si desidera perdere come documenti legali, alcune foto e video importnti di events memorabili, ecc. In "personale" metterai tutte le tue foto personali, video dalla tua vacanza e documenti di lavoro , sono documenti e media che ti piacerebbe mantenere, ma non ti perderai di dispiacere se li perdi (e questo è buono perché di solito questa cartella è ENORME, per cui probabilmente perdenetworking alcuni file a lungo termine … ). "Non importnte" è tutta la roba da scaricare da Internet o da vari file e media che hai a cui non ti interessa (come software e giochi e film). La linea di fondo è che: più file che si desidera archiviare a lungo termine, sarà più difficile (e richiede tempo) , quindi cerchi di mantenere i file che ottengono questo trattamento speciale al minimo.

  • I metadati sono un punto critico : anche con buone strategie di cura, di solito c'è una cosa che non è protetta: i meta-dati. Meta-data include le informazioni sui file, ad esempio: l'tree directory (yep, questo è solo pochi byte, se si perde questo, si ottiene i file in totale disordine!), Il nome del file e l'estensione, il timestamp (questo potrebbe essere importnte per te), ecc. Questo potrebbe non sembrare un grosso problema, ma immagina quanto segue: cosa succede se domani tutti i tuoi file (inclusi i file spediti con software e roba) vengono messi tutti all'interno di una cartella piatta, senza il loro nome di file né estensione. Sarai in grado di recuperare i file necessari dai miliardi di file sul tuo computer, mediante ispezione manuale? Non pensare che questo sia uno scenario insolito, può accadere facilmente come se si ottiene un potere di output o un crash nel mezzo di una copia: la partizione che viene scritta può diventare completamente distrutta (il tipo infame di RAW). Per ovviare a questo problema, dovresti essere preparato e preparato i tuoi dati per il ripristino dei dati: per assicurarti di mantenere i metadati, puoi agglomerare i file con i loro metadati utilizzando archivi non solidi quali ZIP DEFLATE o DAR (ma non tar ). Alcuni filesystem offrono ridondanza automatica dei metadati, come DVDisaster (per i dischi ottici) e ZFS (per hard disk). Quindi, in caso di arresto di un meta-dati, è ansible tentare di recuperare le partizioni utilizzando TestDisk o GetDataBack (consentono un recupero di directory parziale) o ISOBuster (per i dischi ottici) per recuperare la struttura di directory e altri meta-dati. Nel caso in cui tutto questo non riesce, è ansible fare ricorso a filecraping utilizzando PhotoRec: questo estrarre tutti i file riconosciuti, ma in totale disturbo e senza il nome del file o il timestamp, solo i dati verranno recuperati. Se hai richiamato i file importnti, potrai recuperare i metadati all'interno della zip (anche se la zip stessa non contiene più meta-dati, alless all'interno dei file avrà ancora i metadati corretti). Tuttavia, è necessario controllare manualmente tutti i file caricati manualmente, il che richiede tempo. Per salvaguardare questa possibilità, è ansible generare in precedenza un file di checksum di integrità usando pyFileFixity o PAR2 e quindi utilizzare questo file di checksum di integrità dopo il filecraping per riconoscere automaticamente e rinominare i file in base al loro contenuto (questo è l'unico modo per automatizzare i metacaratteri meta- il ripristino dei dati, in quanto il filecraping può tecnicamente recuperare solo i contenuti, non i metadati).

  • Prova i tuoi formati di file e le strategie di curazione per te : invece di fidarsi delle parole degli articoli su quale tipo di formato è migliore dell'altro, puoi provare da sola con piFileFixity filetamper.py o solo da solo sostituendo alcuni caratteri esadecimali in alcuni file: vednetworking che la maggior parte dei formati di file può rompersi con appena tre byte diversi. Quindi devi veramente scegliere con attenzione i tuoi formati di file: preferisci file di text semplici per le note e utilizza formati di file resilienti per i media (vengono ancora elaborati come il codice di correzione errori MPEG-4, ffmpeg lo implementa, il ref verrà aggiunto ) o generare i propri codici di correzione degli errori.

  • Leggete gli studi statistici, non credete alle rivendicazioni : Come ho detto nella risposta precedente, sono state fatte sempre stravaganti la longevità dei supporti di memorizzazione senza alcun fatto scientifico e dovresti essere particolarmente cauti in proposito. In effetti, non c'è nulla nella legge che impedisca al produttore di vantarsi di falsi, e non verificabili, affermazioni sulla longevità. Preferisco fare riferimento a studi statistici, come il rapporto annuale di BackBlaze sui tassi di guasti dei dischi rigidi .

  • Prendete un supporto di memorizzazione a lungo garantito . Una garanzia non può riportre i tuoi dati, ma ti spiega come il produttore valuta il tasso di fallimento del suo prodotto (perché altrimenti sarebbe troppo costoso se il tasso è troppo alto durante il periodo di garanzia).


Un aggiornamento sullo schema che utilizzo: applico la strategia di priorità descritta in precedenza e ho aggiunto il servizio di backup nube SpiderOak al mio schema, perché dispone di un piano con archiviazione infinita e totalmente crittografato, quindi conservo la sola properties; dei miei dati. NON uso come mio unico supporto di backup per uno dei miei dati, è solo un livello aggiuntivo.

Ecco il mio schema attuale:

  • 3 copie di disco rigido controllate regolarmente e sincronizzate e memorizzate in due diversi luoghi e 1 che è sempre su di me (lo uso per memorizzare i rifiuti e per fare backup rapidi).
  • SpiderOak con un piano di stoccaggio infinito
  • Dischi BluRay per dati veramente sensibili ma non troppo grandi (limito a 50 GB i dati che posso memorizzare su questi dischi)
  • piFileFixity e DVDisaster per le cartelle che voglio veramente assicurare per mantenere nel lungo periodo.

La mia routine quotidiana è così: ho sempre un 2.5 HDD porttile USB che posso usare per hide roba inutile (spostare file dal mio computer sul disco rigido) o per eseguire backup di robe importnti (copiare i file su HDD, ma tenere una copia sul mio computer). Per roba molto critica, ho inoltre triggersto il backup in linea a SpiderOak (ho una cartella sul mio computer con roba critica, quindi ho solo bisogno di spostare i file critici e viene sincronizzato automaticamente da SpiderOak). Per i file REALLY critici, calcolo anche un file di correzione degli errori utilizzando pyFileFixity.

Così a sintesi, per roba critica, li archivierò: la HDD porttile, la nube SpiderOak e il mio computer, quindi ho 3 copie in qualsiasi momento con due semplici azioni veloci (copia su HDD porttile e spostato nella cartella SpiderOak). Se una copia viene danneggiata, posso fare una votazione di maggioranza per risolverli usando pyFileFixity. E 'uno schema a costi molto bassi (sia nel prezzo che nel tempo) ma molto efficiente e implementa tutti i principi fondamentali della curazione digitale (triple redundancy, copie diverse in posizioni diverse, media differenti, controllo di integrità e ecc da SpiderOak).

Quindi, each 3 o 6 mesi, sincronizzo il mio HDD porttile con il mio secondo disco fisso a casa, e poi each 6-12 mesi sincronizzo il mio HDD porttile con il mio terzo HDD che è in un'altra casa. Questo fornisce il vantaggio aggiuntivo della rotazione (se entro 6 mesi mi rendo conto che qualcosa è andato storto nel mio ultimo backup e ho cancellato i file critici, posso farli da uno dei due HDD di casa).

Infine, ho scritto alcuni file molto critici sui dischi BluRay utilizzando DVDisaster (e altri file ecc con piFileFixity ma non sono sicuro che fosse necessario). Li immagazzino in una scatola d'aria in un armadio. Li controlla solo each pochi anni.

Così vedi, il mio schema non è veramente un grosso carico: each giorno occorre qualche minuto per copiare i file su un disco rigido porttile e nella mia cartella SpiderOak e poi sincronizzerò each 6 mesi con uno o l'altro disco rigido domestico . Ciò può richiedere fino a un giorno a seconda di come i dati devono essere sincronizzati, ma è automatizzato da software, quindi devi solo lasciare che un computer esegua il software e fai qualcos'altro (uso un netbook da 100 $ acquistato solo farlo, quindi posso lavorare sul mio computer principale contemporaneamente senza preoccuparsi di schiantare il computer in mezzo a una copia che può essere terribile e distruggere il disco rigido che viene scritto ). I codici di correzione degli errori e gli schemi BluRay vengono utilizzati solo raramente per dati veramente critici, quindi è un po 'più a lungo, ma è raro.

Questo schema può essere migliorato (come sempre), ad esempio utilizzando ZFS sui dischi rigidi : ciò avrebbe implementato un controllo automatico di codice di correzione degli errori Reed-Solomon e un controllo di integrità (e dittoblocks !) Senza alcuna interazione manuale da parte mia (contrariamente a pyFileFixity). Tuttavia non posso perché ho bisogno di eseguire Windows OSe … Ma se puoi eseguire solo Linux, prova a provare ZFS sui tuoi HDD esterni! Un HDD porttile che esegue ZFS con correzione e deduplicazione di errori RS automatizzati dovrebbe essere impressionante! (e ZFS sembra essere abbastanza veloce in modo che la copia dovrebbe essere veloce!)

Andavo microfilm. Non so se sia ancora fabbricato, ma sarei sorpreso se non lo fosse. Negozi a base di argento ultime centinaia di anni se conservati correttamente. Ovviamente questo è un enorme investimento, e occuperà un'intera stanza per la fotografia e la visualizzazione, e questo non conta il deposito. Quindi questo è solo se veramente MEAN 100 anni + senza manutenzione.

Se no – e probabilmente non sei a less che non si desideri creare una capsula di tempo – utilizza solo i backup HDD e copia tutta la voce su nuovi media each 10-15 anni. Davvero, non c'è una migliore assicurazione contro l'invecchiamento del mezzo rispetto a copiare tutta la cosa each 10 anni o giù di lì. Meglio di microfilm, meglio di tavolette di argilla, meglio di obelischi di pietra sepolti nella sabbia del deserto.

Fino a 5 TB (o più?) È ansible memorizzare saldamente fino a 30 anni su un nastro magnetico aka nastro. Questa volta è dimostrato. I registri a raggi blu memorizzano in modo sicuro la vostra roba fino a 30 anni anche, ma la sua capacità è di circa 100GB.

Se hai più soldi, lo metteresti in film nero / bianco 35 mm. Si presume che i dati possono essere ripristinati (a seconda della densità) per i prossimi 700 anni. ( Collegamento tedesco a wikipedia )

Raccommand un disco di nickel di diametro di tre pollici con informazioni microscopicamente incisi sulla sua superficie.

http://rosettaproject.org/blog/02008/aug/20/very-long-term-backup/

Per quel tipo di tempo, tutto ciò che è già su carta (o può essere facilmente printingto senza perdere informazioni) sarebbe meglio memorizzare in quella forma. Basta ricordare la carta e il toner che utilizzi per la carta.

Come per gli altri, non so di un mezzo digitale attualmente utilizzato che sarebbe durato per quegli anni. Se spendi tempo (e quindi denaro) per aggiornare la tua collezione, allora un nastro magnetico potrebbe essere un'opzione valida – ma anche allora avresti bisogno di ridondanza, come potresti scoprire solo che un singolo nastro è andato male (o potrebbe essere che l'unità a nastro succede solo a bloccare il nastro sulla lettura).

E anche quando è ansible get i media attuali per stare alla prova del tempo, si sarebbe ancora di fronte alla questione se un programma potrebbe leggere i media a 30 anni da adesso, per non parlare di più di 100 anni.

È vero che i comuni CD-R e DVD-R non sono abbastanza affidabili per l'archiviazione di dati importnti. Ma è ansible get DVD che non sono così rapidi per decadere:

https://www.google.com/search?q=archival+dvd-r

Ho letto che 'M-Disc' ha creato un DVD che necessita di uno scrittore speciale, ma è leggibile sui lettori DVD generici. Essi affermano una durata stimabile di 1000 anni, affermando che non può essere esaminato con precisione. Lunga esposizione al sole, graffi, uso multiplo ecc e il disco è 100% utilizzabile. Mi interesserebbe qualsiasi risposte da chiunque abbia incontrato questo sistema.

Ecco un estratto di Dell che potrebbe installare l'unità M-Disc nei nuovi computer porttili / PC

L'unità M-DISC Ready aziona i dati laser a un materiale inorganico a roccia per prevenire la perdita di dati, assicurando che i file siano al sicuro e possono essere conservati fino a 1000 anni, afferma la società.

A differenza di tutti gli altri DVD registrabili che utilizzano i coloranti organici per tenere i dati, i dischi M non svaniranno o degradano nel tempo.

Devi combinare diverse tecnologie, posizioni e mezzi per get backup di lunga durata:

  • Masterizza su DVD – Bluray a bassa velocità. Tenerli a bassa luminosità, bassa temperatura, bassa umidità, senza graffi.
  • Tenere una copia in un'unità RAID 1, Raid5, Raid6 o Raid10.
  • Mantenere un'altra copia in un disco rigido esterno
  • Mantenere una copia nella nube (carbonite, crashplan)
  • Mantenere una copia sulla tecnologia M-Disc (bruciatori Mdiscs e Mdisc) non sono disponibili presso Amazon.com a prezzi molto buoni. Gli stati produttori possono tenere dati per 1000 anni.

Come qualcuno già menzionato c'è una nuova tecnologia denominata M-Disc. Sono molto affidabili: http://www.zdnet.com/torture-testing-the-1000-year-dvd-7000023203/ Abbiamo iniziato ad usarli per garantire immagini di dischi di macchine di produzione. Ci sono già Blu-Rays sul mercato. Soltanto lo svantaggio è che sono più lenti dei classici B-RD.

Se si desidera disporre di un metodo per risolvere questo problema, è necessario studiare il field Digital Presevation.

http://en.wikipedia.org/wiki/Digital_preservation

La conservazione digitale è il metodo per mantenere vivo il materiale digitale in modo che rimangano utilizzabili in quanto i progressi tecnologici rendono obsoleto l'hardware originale e la specifica del software (wikipedia)

C'è anche un model di riferimento: OAIS http://en.wikipedia.org/wiki/Open_Archival_Information_System

Ci sono alcune soluzioni open source e commerciali che lo accompagnano. Biblioteche e archivi utilizzano queste tecnologie per preservare i libri digitalizzati per lunghi periodi di tempo.

La tua risposta è semplice:

https://wiki.openstack.org/wiki/Cinder

Openstack è un sistema di memorizzazione quasi immortale, in quanto è ansible aggiornare o sostituire i nodes di guasto con quelli nuovi anche con le tecnologie future sconosciute adesso. I tuoi dati vivono alless 2, fino a 5 posti contemporaneamente in questo sistema, quindi le note di archiviazione complete possono fallire e i dati sono ancora presenti. Scala fino a 50 PB (verificato) – 110 PB. Fondamentalmente aggiunge un livello SW sul tuo hardware e questo rende la tua archiviazione infinita viva. Superizza la nostra attuale barriera sonora di Raid Sets con i suoi limiti di ricostruzione di set di raid molto grandi. I costi sono circa il 50% dei tradizionali sisthemes di storage Raid. Conosco un sistema di FUJITSU che rappresenta questa architettura di riferimento: CD10000

Pratico utilizzo di dati a lungo termine utilizzando la tecnologia attuale dell'anno 2014:

… e questo è quello che sto facendo.

Ottieni due dei drive multi-terabyte, ad esempio due drive di 3 terabyte ciascuno. Chiamate un TB-1 e l'altro TB-2. Assicurati tutto al TB-1. Dopo un anno di backup su TB-1, riformatta il TB-2 e copia TB-1 in TB-2. Poi per l'anno successivo, riprendi tutto a TB-2. Dopo quell'anno, riformatta il TB-1 e copia la TB-2 a TB-1, quindi riprende il ciclo biennale.

La riformattazione ripristina la forza magnetica dei marcatori del settore. E la copia ripristina la forza magnetica dei dati.

Lo stesso principio può essere applicato al backup del nastro e al backup del CD, o più qualsiasi altro backup. Ma i CD sono così scomodi, perché potrebbero andare male in less di un anno, e avete bisogno di tanti di loro per eseguire il backup di tutto. Quindi, bruciare copie di tutti i CD di backup each 5 mesi è solo troppo lavoro. Finora posso memorizzare tutta la mia vita su un disco multi-terabyte.