Vanha netti löytyy Kansalliskirjastosta

Kansalliskirjastosta löytyy vanhojen kirjojen lisäksi myös vanhoja nettisivuja.
Kuva: Kimmo Mäntylä / Lehtikuva
2.4.2009 12:50 Kansalliskirjastossa avattiin tänään suomalainen verkkoarkisto, jonne tallennetaan ja jossa säilytetään Suomessa yleisön saataville asetettuja verkkoaineistoja.
Verkkoarkisto on Kansalliskirjaston lakisääteisesti ylläpitämän kansalliskokoelman uusin laajennus. Tuleville sukupolville ja erityisesti tutkijoille verkkoarkisto muodostaa suomalaista verkkomaailmaa sen kaikkine ilmiöineen kuvaavan ja jatkuvasti karttuvan lähdeaineiston.
Verkkoarkistoon pyritään tallentamaan kaikki .fi- ja .ax (Ahvenanmaa) -päätteiset sivut sekä muut kotimaiset sivustot. Otos sisältää sekä yhteisöjen että yksityisten kansalaisten tuottamaa aineistoa.
Tähän mennessä Kansalliskirjasto on tallentanut verkosta kaikkiaan 131 miljoonaa tiedostoa, joihin kuuluu muun muassa miljoonia www-sivuja sekä kymmeniä tuhansia ääni- ja kuvatiedostoja.
Uutta kansallista arkistoa kartutetaan kerran vuodessa tehtävällä peruskeräyksellä. Peruskeräystä vuorostaan täydennetään pitkin vuotta teemakeräyksin, joissa keskitytään tiettyyn aiheeseen tai ajankohtaiseen tapahtumaan. Esimerkkejä jo tehtyjen teemakeräysten kohteista ovat muun muassa Euroviisut, erilaiset vaalisivustot sekä maahanmuuttajuuteen ja ulkosuomalaisuuteen liittyvä materiaali.
Pääsy arkistoituun nettiin
vain Unioninkadun koneilta
Kansalliskirjaston asiakkaat voivat käyttää verkkoarkistoa Unioninkadulla sijaitsevan päärakennuksen tiloissa tarkoitukseen erikseen varatuilla työasemilla. Aluksi asiakaskäytössä on vain yksi työasema, mutta seuraavat kaksi avataan jo alkukesästä. Palvelu laajenee myöhemmin myös maan muiden vapaakappalekirjastojen, Kansallisen audiovisuaalisen arkiston ja Eduskunnan kirjaston asiakaskäyttöön.
Kansalliskirjastossa on tallennettu avoimissa tietoverkoissa julkaistuja aineistoja tekijänoikeuslain nojalla vuodesta 2006 alkaen. Verkkoarkiston asiakaskäyttöön saattamisen teki kuitenkin mahdolliseksi vasta uusi laki kulttuuriaineistojen tallentamisesta ja säilyttämisestä, joka astui voimaan vuoden 2008 alussa.
Tähän mennessä verkkoarkistoon on tallennettu 77,2 miljoonaa html-, 41,3 miljoonaa kuva-, 2,2 miljoonaa pdf-, 270 000 ääni- ja 90 000 videotiedostoa.
Kansalliskirjasto on Suomen suurin ja vanhin tieteellinen kirjasto sekä Helsingin yliopiston suurin erillislaitos. Se vastaa kansallisen julkaisuperintömme ja ainutlaatuisten kokoelmiensa kartuttamisesta, kuvailusta, säilyttämisestä ja käyttöön asettamisesta.
Kansalliskirjasto toimii myös koko kirjastokentän valtakunnallisena palvelu- ja kehittämislaitoksena sekä edistää alansa kotimaista ja kansainvälistä yhteistyötä. Laitoksen vuosibudjetti on noin 25 miljoonaa euroa ja henkilöstömäärä 280.
Vuoteen 2006 saakka Kansalliskirjasto toimi nimellä Helsingin yliopiston kirjasto, ja laitoksen juuret ulottuvat aina Turun Akatemian perustamiseen vuonna 1640.
- Digitodayn tuoreimmat uutiset.
- 10.2. Facebook-kaverin poisto johti kaksoismurhaan
- 10.2. Googlen lompakko hakkeroitiin helposti
- 10.2. Google pystyttää kilpailijaa Dropboxille
- 10.2. Alcatel-Lucent lopettaa työpaikkoja
- 10.2. Pirate Bay uhmaa muistitikulla estoja
- 10.2. Comptel puolittaa osingon
- 10.2. Kodak keskittyy kuvien tulostamiseen
- 10.2. Yle: Piraattiradio häiriköi Turun seudulla
- 10.2. Windows XP:lle harvinaisen vähän korjauksia
- 10.2. Itsemurhatehtaan johtajalta vohkittiin salasana
- 10.2. Googlen ensimmäinen työntekijä lähtee
- 10.2. Microsoft keskeytti yllättäen Lumia 900:n varaukset
- 10.2. FBI: Steve Jobsilla oli top-secret -luokitus
- 9.2. Uusi iPad tulee maaliskuun alussa?
- 9.2. Siri opiskelee kiinaa ja venäjää
- 9.2. Peliskene poimi presidentin palkinnon
- 9.2. Google: Näytä surfailusi, saat rahaa
- 9.2. Skimmaajat teettivät erikoislaitteita Suomen oloihin
- 9.2. Samsungilta ei julkistuksia Barcelonassa
- 9.2. Ciscon tulos parani reippaasti
- Uusimmat
- 48h luetuimmat kaikista uutisista.
- 8.2. Nokia-pomo: Puhelimet ovat Designed in Finland
- 10.2. FBI: Steve Jobsilla oli top-secret -luokitus
- 8.2. Nokian Salon tehdasta on ajettu alas pitkään
- 10.2. Microsoft keskeytti yllättäen Lumia 900:n varaukset
- 8.2. Kaksi minuuttia Iron Skyta – Elokuva "täynnä vastoinkäymisiä"
- 9.2. Sadan tonnin sakot kuluttajien harhauttamisesta
- 8.2. Nokia julkistaa huippupuhelimen Barcelonassa
- 8.2. Applen televisio voi saada liikeohjauksen
- 8.2. Yllätys: Nokia on ylivoimainen web-johtaja
- 9.2. Yllättävä ongelma: iPhone 4S ei toimi kiinalaisten sim-kortilla
- Luetuimmat
- 48h suositelluimmat kaikista uutisista.
- Suositelluimmat
- 48h kommentoiduimmat kaikista uutisista.
- 8.2. Nokia-pomo: Puhelimet ovat Designed in Finland
- 9.2. Yllättävä ongelma: iPhone 4S ei toimi kiinalaisten sim-kortilla
- 10.2. FBI: Steve Jobsilla oli top-secret -luokitus
- 8.2. Nokian Salon tehdasta on ajettu alas pitkään
- 8.2. Applen televisio voi saada liikeohjauksen
- 10.2. Microsoft keskeytti yllättäen Lumia 900:n varaukset
- 9.2. Microsoft tarjoaa Lumia 800 -kimppua ystävänpäivänä
- 8.2. Nokia julkistaa huippupuhelimen Barcelonassa
- 8.2. Yllätys: Nokia on ylivoimainen web-johtaja
- 9.2. Uusi iPad tulee maaliskuun alussa?
- Kommentoiduimmat
Uutisviikko
Mitä viikolla on tapahtunut, mikä puhuttanut eniten? Koko viikon uutiset.
RSS-feedit
Seuraa Digitodayn kaikkia uutisia tai vain tiettyä osiota RSS:llä.
Uusimmat uutiset
- Google pystyttää kilpailijaa Dropboxille 16:15
- Windows XP:lle harvinaisen vähän korjauksia 12:37
- Yllättävä ongelma: iPhone 4S ei toimi kiinalaisten sim-kortilla 10:22
- Windows 8:n testiversio ilmestyy karkauspäivänä 00:22
- @450-verkko vaihtaa tekniikkaa 12:49
- Googlen Terminator-lasit täydentävät todellisuutta 15:13
- Microsoft poistaa start-napin 13:19
- Google pyyhki Atlantiksen kartalta 15:59
- Lisää
Digiyesterday
Viisi vuotta sitten
Kuriiri kadotti 80 000:n potilastiedot
11.02.2007 Amerikkalaisen Johns Hopkins -organisaation 52 000 työntekijän ja 83 000 potilaan tiedot sisältäneet nauhat ovat kadonneet matkalla alihankkijalle, joka tekee nauhoista varmuuskopioita.
Kolme vuotta sitten
Kodintekniikan myynti väheni 4 prosenttia viime vuonna
11.02.2009 Kotekin juuri julkaiseman tilaston mukaan viime vuoden myynti oli hieman yli 2,06 miljardia euroa. Kappalemääräinen myynti oli vuoden 2007 tasolla, mutta keskihintojen laskun myötä myynnin arvossa oli laskua 4 prosenttia.
Taloussanomat
- Koulutettu, ole iloinen huonosta palkastasi 06:01
- SK: Nokia ulkoisti lokakuussa – Accenture jakaa jo eropaketteja 20:59
- Suoraan Wall Streetiltä: "Olen nyt alfauros" 20:24
- Kreikan sopu järkkyi jo: Puoluepomo aikoo äänestää ei 16:22
- Raatoja tulee ravintola-alalla: "Dokaaminen meni muodista" 15:01
- Tämä sana joutui pannaan – Ollila haluaa sen takaisin 15:39
- Erimielisyyksiä osingoista – OP-Pohjola antoi potkut pankkiirilleen 10:07
- USA:ssa luottamus notkahti vielä pelättyäkin enemmän 17:32
- Merkel: Kreikka tarvitsee lisää apua 13:01
- Kreikan poliisi haluaa pidättää EU-virkailijat 17:12
- » Taloussanomat.fi













Kommentit (10)
www PISTE archive PISTE org.
Verkkosivujen tekijöiltäkin jää nyt mainostuloja saamatta. Miksi laki ei ole kaikille sama????
Miten tallennetaa esim. www-sivu jolla oleva kuva tai muu objekti onkin itse asiassa haettuna linkkinä jostain toisesta WWW-palvelusta? Entä ne WWW-sivut joille pitää rekisteröityä saadakseen sisällön täysimääräisenä esille (esim. irc galleria)?
Sanoohan sen järkikin, että keskusteluja yms. ei millään kyetä tallentamaan siten, että ne olisivat ajantasaisia.
Kansalliskirjaston luonne on myös säilyttää tietoa. Yleensä aineisto on annettu tutkimuskäyttöön, tärkeintä on, että kansallinen aineisto on jossakin määrin tallennettuna tallessa.
Archive.orgin tapauksessa suomalaisen aineiston tallentaminen ei ole projektin pääpaino, toisin kuin Kansalliskirjaston hankkeessa.
Sanoohan sen järkikin, että keskusteluja yms. ei millään kyetä tallentamaan siten, että ne olisivat ajantasaisia.
WEB sivuilla on flash, java, video yms. kikkareita joten edelleen ihmettelen mitä ja miten tuo arkistointi tehdään niin että siitä saa jotain tolkkua vuosien päästä?
http://www.arlaingman.fi/fi/ammulator.html
Archive kunnioittaa robots.txt-tiedostoa. Yritin katsella edesmenneen firman sivuja, mutta archive vain ilmoitti, että sivuja ei ole, koska robots.txt oli estänyt tiedon keruun. Firman kakkossivuston sain näkyviin, kun siellä ei tuota robotsia ollut.
Mites Kansalliskirjaston järjestelmä tekee? Voinko estää sitä hakemasta sivujani kokoelmiinsa?