Taloussanomat
Lue uutinen mobiilisivustolla
Kaikki .fi- ja .ax-päätteiset sivut talteen

Vanha netti löytyy Kansalliskirjastosta

Kansalliskirjastosta löytyy vanhojen kirjojen lisäksi myös vanhoja nettisivuja.
Kuva: Kimmo Mäntylä / Lehtikuva

2.4.2009 12:50 Kansalliskirjastossa avattiin tänään suomalainen verkkoarkisto, jonne tallennetaan ja jossa säilytetään Suomessa yleisön saataville asetettuja verkkoaineistoja.

Verkkoarkisto on Kansalliskirjaston lakisääteisesti ylläpitämän kansalliskokoelman uusin laajennus. Tuleville sukupolville ja erityisesti tutkijoille verkkoarkisto muodostaa suomalaista verkkomaailmaa sen kaikkine ilmiöineen kuvaavan ja jatkuvasti karttuvan lähdeaineiston.

Verkkoarkistoon pyritään tallentamaan kaikki .fi- ja .ax (Ahvenanmaa) -päätteiset sivut sekä muut kotimaiset sivustot. Otos sisältää sekä yhteisöjen että yksityisten kansalaisten tuottamaa aineistoa.

Tähän mennessä Kansalliskirjasto on tallentanut verkosta kaikkiaan 131 miljoonaa tiedostoa, joihin kuuluu muun muassa miljoonia www-sivuja sekä kymmeniä tuhansia ääni- ja kuvatiedostoja.

Uutta kansallista arkistoa kartutetaan kerran vuodessa tehtävällä peruskeräyksellä. Peruskeräystä vuorostaan täydennetään pitkin vuotta teemakeräyksin, joissa keskitytään tiettyyn aiheeseen tai ajankohtaiseen tapahtumaan. Esimerkkejä jo tehtyjen teemakeräysten kohteista ovat muun muassa Euroviisut, erilaiset vaalisivustot sekä maahanmuuttajuuteen ja ulkosuomalaisuuteen liittyvä materiaali.


Pääsy arkistoituun nettiin
vain Unioninkadun koneilta

Kansalliskirjaston asiakkaat voivat käyttää verkkoarkistoa Unioninkadulla sijaitsevan päärakennuksen tiloissa tarkoitukseen erikseen varatuilla työasemilla. Aluksi asiakaskäytössä on vain yksi työasema, mutta seuraavat kaksi avataan jo alkukesästä. Palvelu laajenee myöhemmin myös maan muiden vapaakappalekirjastojen, Kansallisen audiovisuaalisen arkiston ja Eduskunnan kirjaston asiakaskäyttöön.

Kansalliskirjastossa on tallennettu avoimissa tietoverkoissa julkaistuja aineistoja tekijänoikeuslain nojalla vuodesta 2006 alkaen. Verkkoarkiston asiakaskäyttöön saattamisen teki kuitenkin mahdolliseksi vasta uusi laki kulttuuriaineistojen tallentamisesta ja säilyttämisestä, joka astui voimaan vuoden 2008 alussa.

Tähän mennessä verkkoarkistoon on tallennettu 77,2 miljoonaa html-, 41,3 miljoonaa kuva-, 2,2 miljoonaa pdf-, 270 000 ääni- ja  90 000 videotiedostoa.

Kansalliskirjasto on Suomen suurin ja vanhin tieteellinen kirjasto sekä Helsingin yliopiston suurin erillislaitos. Se vastaa kansallisen julkaisuperintömme ja ainutlaatuisten kokoelmiensa kartuttamisesta, kuvailusta, säilyttämisestä ja käyttöön asettamisesta.

Kansalliskirjasto toimii myös koko kirjastokentän valtakunnallisena palvelu- ja kehittämislaitoksena sekä edistää alansa kotimaista ja kansainvälistä yhteistyötä. Laitoksen vuosibudjetti on noin 25 miljoonaa euroa ja henkilöstömäärä 280.

Vuoteen 2006 saakka Kansalliskirjasto toimi nimellä Helsingin yliopiston kirjasto, ja laitoksen juuret ulottuvat aina Turun Akatemian perustamiseen vuonna 1640.

Jutun kirjoitti: Jarmo Lahti

Jarmo Lahti

Teksti on lisensoitu Creative Commons Nimeä-Ei muutoksia-Epäkaupallinen -lisenssillä.

Mainitut yritykset

Kommentit (10)

Huono 0
Toivottavasti tulevat nopeasti jakoon torretteina tai google pääsisi indeksisoimaan kirjaton sisällön.
Turhat rajoitukset pois, veronmaksajille palveluita
Mitä uutta tässä on? Pyörää keksitään uudelleen?

www PISTE archive PISTE org.
abcdefgh
Onhan tekijänoikeudet kunnossa? Kuvia ja videoita on suht runsaasti.
TO
Nythän artistit menettävät myyntituloja. Eikö kansalliskirjasto yhtään ajattele nälkä vyön alla kituvaa artistia ja luovan työn tekijää????

Verkkosivujen tekijöiltäkin jää nyt mainostuloja saamatta. Miksi laki ei ole kaikille sama????
Kysyypi
Mitähän on tarkoitus tallentaa - moni WWW palvelu sisältää kymmeniä ellei satoja alitasoja ja parhaassa tapauksessa sivut sisältävät dynaamista ainesta joka on muuttuvaa!
Miten tallennetaa esim. www-sivu jolla oleva kuva tai muu objekti onkin itse asiassa haettuna linkkinä jostain toisesta WWW-palvelusta? Entä ne WWW-sivut joille pitää rekisteröityä saadakseen sisällön täysimääräisenä esille (esim. irc galleria)?
Ari
Tärkeintä on luultavasti projektissa ajatella pitkällä tähtäimellä. Jos ajatellaan, että halutaan saada jonkinlainen kuva IRC-gallerian palvelusta 50 vuoden kuluttua, ei sen sisällön tarvitse olla millään muotoa kokonainen tai ajan tasalla oleva, "hetken kuva palvelusta" riittää kokonaiskäsityksen saamiseksi.

Sanoohan sen järkikin, että keskusteluja yms. ei millään kyetä tallentamaan siten, että ne olisivat ajantasaisia.

Kansalliskirjaston luonne on myös säilyttää tietoa. Yleensä aineisto on annettu tutkimuskäyttöön, tärkeintä on, että kansallinen aineisto on jossakin määrin tallennettuna tallessa.

Archive.orgin tapauksessa suomalaisen aineiston tallentaminen ei ole projektin pääpaino, toisin kuin Kansalliskirjaston hankkeessa.
TR

Sanoohan sen järkikin, että keskusteluja yms. ei millään kyetä tallentamaan siten, että ne olisivat ajantasaisia.

WEB sivuilla on flash, java, video yms. kikkareita joten edelleen ihmettelen mitä ja miten tuo arkistointi tehdään niin että siitä saa jotain tolkkua vuosien päästä?

http://www.arlaingman.fi/fi/ammulator.html
Ari
www PISTE archive PISTE org.

Archive kunnioittaa robots.txt-tiedostoa. Yritin katsella edesmenneen firman sivuja, mutta archive vain ilmoitti, että sivuja ei ole, koska robots.txt oli estänyt tiedon keruun. Firman kakkossivuston sain näkyviin, kun siellä ei tuota robotsia ollut.

Mites Kansalliskirjaston järjestelmä tekee? Voinko estää sitä hakemasta sivujani kokoelmiinsa?
Yks-suoja
Muistakaan tallentaa Kansalliskirjastoon 4chanin /B/:tä. Siinä on tuleville sukupolville ihmettelemistä, millä tasolla ihmisten älykkyys on hienolla Interwebs-ajallamme ollut.
not a /b/tard
4chan tuskin on suomalainen sivusto.
Hömppä
Sivut: 1 Edellinen Seuraava
Kirjoita vastaus
Ohjeet: Pysy aiheessa ja kirjoita napakasti. Muista, että haastateltavilla, kanssakeskustelijoilla ja toimittajilla on oikeus omaan, eriävään mielipiteeseen. Ole kohtelias ja ystävällinen, äläkä tarkoituksella provosoi tai hauku muita keskustelijoita. Taloussanomat varaa oikeuden poistaa asiattomat viestit. Varauduthan siihen, että linkkejä sisältävät viestit tarkistetaan yksitellen roskapostin suodattamiseksi. Arvostamme mielipidettäsi!
> Lue koko keskusteluetiketti

Uusimmat uutiset

Digiyesterday

Viisi vuotta sitten

Kuriiri kadotti 80 000:n potilastiedot

11.02.2007 Amerikkalaisen Johns Hopkins -organisaation 52 000 työntekijän ja 83 000 potilaan tiedot sisältäneet nauhat ovat kadonneet matkalla alihankkijalle, joka tekee nauhoista varmuuskopioita.


Kolme vuotta sitten

Kodintekniikan myynti väheni 4 prosenttia viime vuonna

11.02.2009 Kotekin juuri julkaiseman tilaston mukaan viime vuoden myynti oli hieman yli 2,06 miljardia euroa. Kappalemääräinen myynti oli vuoden 2007 tasolla, mutta keskihintojen laskun myötä myynnin arvossa oli laskua 4 prosenttia.

.