Taloussanomat
Lue uutinen mobiilisivustolla

Kuinka säilyttää digitieto vuosisatojen päähän?

Digitaalisesti säilytettävää aineistoa on alussa 700 teratavua.
Kuva: Soile Kallio / Lehtikuva

5.10.2010 16:15 Suomessa rakennetaan ennenkuulumatonta järjestelmää digitaalisen tiedon säilyttämiseksi satojen vuosien päähän. Haasteista ei ole pulaa.

Kirjastojen, arkistojen ja museoiden yhteinen digitaalisen tiedon pitkäaikaissäilytys hahmottuu uudessa hankkeessa, jota vetää Tieteen tietotekniikan keskus CSC.

Johtaja Pirjo-Leena Forsström CSC:stä korostaa, että vastaavaa järjestelmää ei ole Suomessa aikaisemmin yritetty rakentaa.

– Tässä on tarkoitus ylevästi sanottuna taata "ikuisesti" ainakin lakisääteisesti säilytettäviksi määrättyjen kulttuuriperintöaineistojen säilyvyys, Forsström hahmottaa. Käytännössä uskalletaan varovasti puhua satojen vuosien säilytyksestä.

Ensimmäinen maailmalta löydetty opetus on, että järjestelmää ei saa rakentaa yhden toimittajan varaan. Saksassa ja Hollannissa vastaavien hankkeiden ongelmana on ollut liika nojailu yhteen laitevalmistajaan.

– Järjestelmätoimittajasidonnaisten ratkaisujen uhkana on, että jos vaikka jonkun ohjelmiston ylläpito loppuu, ei aineistoja saadakaan enää ulos järjestelmästä, Forsström huomauttaa. On myös mahdollista, että valmistajia ei ole enää edes olemassa vuosikymmenten päästä.

Australiassa ja Uudessa-Seelannissa näyttäisi menevän paremmin.

– Uuden-Seelannin ratkaisu on toivottavasti sellainen, että siitä voidaan sanoa kaiken toimivan, Forsström toteaa.

Avointa koodia
aina kun mahdollista

Pitkäaikaissäilytyksen jatkohanke aloittaa siitä, mihin Kansallinen digitaalinen kirjasto (KDK) -hankkeen pitkäaikaissäilytysjaosto lopetti. Esitetylle toimintamallille keskeistä on luotettavuus, kustannustehokkuus ja asiakaslähtöisyys.

KDK-hanke on opetus- ja kulttuuriministeriön alainen. Jaoston loppuraportin liitteessä kuvaillaan suunniteltavan järjestelmän edellytyksiä.

Pitkäaikaistallennuksen ongelman ydin on, miten saada digitaalinen aineisto säilymään tallennusvälineeltä toiselle, tiedostojärjestelmästä toiseen, palvelinympäristöstä toiseen noin sata vuotta tai pidempäänkin.

Samalla tallennusvälineet, laitteet ja ohjelmistot eivät saa koskaan kohdata mitään kohtalokasta virhettä. Ei, vaikka järjestelmän oletetaan varmasti joutuvan hyökkäysten kohteeksi.

Siksi järjestelmässä ei loppuraportin liitteen mukaan saa olla yksittäistä kohtaa, jonka pettäessä koko järjestelmä pettää. Järjestelmän täytyy myös toimia, vaikka tallennusvälineet, ohjelmistot ja laitteistot vaihtuvat tasaisena virtana.

Liitteen mukaan "avoimen lähdekoodin ratkaisuja kannattaa hyödyntää ja suosia kun mahdollista, koska se takaa pitkällä aikavälillä mahdollisuudet ohjelmistojen ylläpitoon ja muokkaukseen yksittäisten toimijoiden mahdollisesta toiminnan loppumisesta huolimatta".

700 teratavua
tallennetta

Digitaalisesti säilytettävä aineisto käsittää eri arkistojen, museoiden ja kirjastojen kokoelmia. Mukana on muun muassa ministeriöiden asiakirjoja, mediataidetta, digitoituja sanomalehtiä ja museoesineiden kuvauksia.

Vuoden 2011 lopussa säilytettävää aineistoa on arviolta kymmenen miljoonaa asiakirjaa, miljoona valokuvaa, 100 000 äänitallennetta, 10 000 elokuvaa, 70 miljoonaa viitetietoa tai kirjastoluettelon nimekettä sekä 400 miljoonaa verkkoarkiston objektia.

Kaikkien tallenteiden koko on yhteensä noin 700 teratavua. Aineiston määrän ennakoidaan kasvavan kovaa tahtia tulevaisuudessa.

Yhteisen pitkäaikaissäilytysjärjestelmän kokonaiskustannukset olisivat 12 ensimmäisen toimintavuoden aikana 42 miljoonaa euroa.

Kustannusarvio perustuu kahteen maantieteellisesti hajautettuun säilytyspisteeseen, joista molemmat sisältävät valmiudet aineistojen vastaanottoon, säilytykseen, käyttöön ja hyödyntämiseen.

Prosessien hiominen
vie vuosia

CSC:n johtama jatkohanke kestää vuoden 2011 loppupuolelle. Pirjo-Leena Forsström toivoo, että järjestelmä olisi toiminnassa parin kolmen vuoden päästä.

– Teknisesti järjestelmää ei ole sinänsä hankala rakentaa levyineen ja kahdennuksineen. Mutta vie aikansa saada toimiviksi kaikki ne prosessit, jotka tuottavat ja varmistavat aineistojen sisällön ymmärrettävyyden säilyvyyden ja eheyden aineistoja tuottavissa organisaatioissa.

VerkossaOpetus- ja kulttuuriministeriön tiedote
VerkossaKDK-hankkeen pitkäaikaissäilytysjaoston loppuraportti
Jutun kirjoitti: Tuomas Linnake

Teksti on lisensoitu Creative Commons Nimeä-Ei muutoksia-Epäkaupallinen -lisenssillä.

Kommentit (25)

Huono 0
42 miljoonaa, aika halpaa.
40 miljoonaa konsulteille
"On myös mahdollista, että valmistajia ei ole enää edes olemassa vuosikymmenten päästä."

Enemmän kuin todennäköistä
The X
Aineistot yleiseen jakeluun nettiin. Säilymistodennäköisyys kasvaa, kun materiaali löytyy miljoonilta yksityishenkilöiltä.
Ubiquitous library
Aineistot yleiseen jakeluun nettiin. Säilymistodennäköisyys kasvaa, kun materiaali löytyy miljoonilta yksityishenkilöiltä.

Hippien juna on juuri lähdössä Venäjälle! Vielä ehtii mukaan.
Aineistot yleiseen jakeluun nettiin. Säilymistodennäköisyys kasvaa, kun materiaali löytyy miljoonilta yksityishenkilöiltä.

Ehdotus jossa on todellakin järkeä. Tosin suuri osa aineistoista on sellaista joka ei suurta yleisöä kiinnosta mutta mielestäni kansalaiset kannattaisi valjastaa talkoisiin. Eipä tuo itseäni kauheasti haittaisi jos koneella olisi vaihtuva kokoelma suomalaisen elokuvan klassikoita huippulaatuisina digitallenteina.

Ihan kuka tahansa perusarkeologi voi kertoa miksi nuolenpäitä löytyy enemmän kuin sarkofageja. (Ihan vaan siitä syystä että ensimmäisiä on useampia kappaleita - tyhmemmille tiedoksi).
Käyttäkää kansalaisia!
mul o koneessa 700 teratavun kiintolevy.
pena666
Huono 4
Parasta olisi vielä ottaa varmuuden vuoksi mikrofilmi- ja paperikopiot koko aineistosta. Leffoja olisikin mukava katsella pläräämällä pinoa aanelosia
Sarko Fagi
Huono 4
Suuri ongelmahan on se, että vaika saataisiin aikaan tallennusmedia, joka säilyy caikka vuosituhansia, niin ei välttämättä ole enää tekniikkaa jolla sitäö mediaa lukisi. Periaatteessahan voisi ajatella, että esim muovi on lähes ikyuista. Jos ihmiskunta tuhoaisi itsensä vaikak ydinsiodassa, niin todennäkösesti pisimpään säilyvät todisteet kadonneesta elämänmuodosta olisi erilaiset muoviesineet. Jos keksittäisiin tapa tehdä suurikapasiteettisia muovitallenteita, jotka ei sisällä mitään hapettuvia aineita tai vastaavaa niin tallenteet kyllä säilyisi pitkään.

Muta ongelma on siinä, että miten ne tallenteet luetaan tuöevaisuudessa kun tarvittava tekniikka on kadonnut tai aikaa sitten vanhentunut ja jäöänyt pois käytöstä. Vaikak ei kävisikään niin äärimääisesti kuin edellä sanoin ja ihmiskunta säuilyisi ilmastonmuutoksesta ja sodista huolimatta elossa, niin tekniikka kehittyy kokoajan ja kokoajan keksitään uusia ja parempia tallennusmuotoja. Samalla vanhat tekniikat jää pois käytöstä ja vähitellen vanhoja medioita lukevat laitteet muuttuu pelkäksi elektroniikkaromuksi. Vaikka tallenteet säiltyisi, niin niitä ei siis pystyttäisi lukemaan.

Tuossa on siis melkonen ongelma.
miksuh
Huono 3
Taas sekoitetaan avoin lähdekoodi ja se, että toimittajalta saadaan lähdekoodi (järjevästi dokumentoituna jne). Jälkimmäinen on se, mitä vaaditaan että järjestelmä on järkevä. Ensimmäinen on toissijaista. Nyt kun useampi valtion virastokin tajuaisi vaatia lähdekoodien omistuksen itselleen niin hommat toimisivat hieman paremmin. Mutta ei...
Symbiatch
Nokian seuraava iPhone killeri hoitaa tämänkin homman kevyesti. Laitteessahan on kaksi FMS-yksikköä (forever memory storage) ja Symbian^5.
Basisti
Sivut: 1 2 3 Edellinen Seuraava
Kirjoita vastaus
Ohjeet: Pysy aiheessa ja kirjoita napakasti. Muista, että haastateltavilla, kanssakeskustelijoilla ja toimittajilla on oikeus omaan, eriävään mielipiteeseen. Ole kohtelias ja ystävällinen, äläkä tarkoituksella provosoi tai hauku muita keskustelijoita. Taloussanomat varaa oikeuden poistaa asiattomat viestit. Varauduthan siihen, että linkkejä sisältävät viestit tarkistetaan yksitellen roskapostin suodattamiseksi. Arvostamme mielipidettäsi!
> Lue koko keskusteluetiketti

Uusimmat uutiset

Digiyesterday

Viisi vuotta sitten

Yliopiston it-väki sohelsi - krakkeri pääsi järjestelmiin

26.05.2007 Krakkeri murtautui kaksi viikkoa sitten University of Coloradon palvelimelle ja sai ulottuvilleen muun muassa 45 000 opiskelijan henkilötiedot. Yliopiston it-väen mukaan hyökkääjä pääsi järjestelmään ujuttamalla sisään madon Symantecin virustorjunnan aukosta.


Kolme vuotta sitten

F-Secure tarjoaa Mac-tietoturvaa testiin

26.05.2009 Tietoturvayhtiö F-Secure uusii tietoturvapakettiaan. Applen koneiden suosion kasvaessa F-Secure aikoo tarjota Maceille virustorjuntaohjelmaa. Ensimmäinen versio on nyt ladattavissa ilmaiseen testiin.

.