Taloussanomat
Lue uutinen mobiilisivustolla
Wordin piilotiedot

Siivoa tekstitiedostosi metadatasta

2.9.2003 18:00 Word-tiedostoissa piilevä metadata voi vääriin käsiin joutuessaan kertoa ulkopuoliselle kaikenlaista tekstin kirjoittajasta. Yksinkertaisilla toimenpiteillä Wordin käyttäjäkin voi silti nukkua yönsä rauhassa.

Tietotekniikassakaan kaikki ei aina ole sitä, miltä näyttää. Esimerkiksi Word-tekstinkäsittelyohjelmassa käytettävästä doc-tiedostosta ei kaikki näy ulospäin, kuten digitoday viime viikolla kirjoitti.

Pelkältä tekstiltä näyttävä doc-dokumentti sisältää meta- ja jäännösdataa, monenlaista tietoa, joka ei näy käyttäjälle. Näkymätön tieto voidaan työkaluohjelmilla myöhemmin muuntaa luettavaan muotoon, jolloin pahimmassa tapauksessa arkaluontoista tietoa voi päästä vääriin käsiin.

Meta-, piilo- tai jäännösdataa o­n muun muassa tiedoston kirjoittajaan ja hänen tietokoneeseensa liittyvä sekä tekstiä muuttaneita henkilöitä koskeva informaatio, joka ei näy ulospäin luettaessa tekstiä tekstinkäsittelyohjelmassa.

Metadata ei sinänsä ole paha asia. Tiedostossa piilevän informaation tarkoituksena o­n helpottaa asiakirjojen jakamista ja hallintaa, mikä vaikkapa ryhmätyöskentelyä ajatellen o­n hyödyllistä.

Näkymätön data hyvä tiedostaa

Metadata kuitenkin tavallaan myös luo informaation väärinkäytön mahdollisuuksia, koska se antaa ulkopuoliselle ainakin peruskäyttäjän kannalta huomaamatta tietoja. Tällaisia piilotietoja o­n muissakin ohjelmissa kuin Wordissä, mutta tässä artikkelissa keskitytään Microsoftin tekstinkäsittelyohjelmaan. Word o­n sentään maailman ylivoimaisesti eniten käytetty tekstinkäsittelyohjelma ja se oletusarvoisesti käyttää juuri doc-tiedostoja.

Piilotietojen huomioiminen o­n tärkeää etenkin yrityksille ja julkiselle sektorille, mutta jossakin määrin myös yksityisille tietokoneen käyttäjille. Jokaisen kotikäyttäjän tuskin tarvitsee huolestua syntymäpäiväkutsun tai pöytälaatikkoon päätyvän runoharjoitelman jäännöstiedoista, mutta asia o­n hyvä tiedostaa siltä varalta, että joutuu esimerkiksi lähettämään työhakemuksia tai jakamaan tärkeitä dokumentteja.

Jo Wordin omatkin toiminnot voivat tehdä mahdolliseksi tekstiin tehtyjen muutosten palauttamisen. Esimerkiksi tekstin versionumero o­n helposti nähtävissä, siis se, kuinka monta kertaa dokumentti o­n tallennettu. Joissakin tapauksissa tekstiin tehdyt muutokset voidaan ohittaa yksinkertaisesti Wordin Kumoa-komennolla.

Tehokkaammin metadataan pääsee käsiksi tarkoitusta varten kehitetyillä työkaluohjelmilla. Erilaisilla apuohjelmilla piilotietoja voi myös poistaa.

Tallenna nimellä

Tiedostoon jää jälkiä aina kun sitä muokataan. Tekstin kirjoittaja o­n voinut tehdä tiedostoon muutoksia työn edetessä eikä ehkä hän tule ajatelleeksi, että nuo muutokset ovat kumottavissa ja aiemmat versiot poistettuine kohtineen luettavissa. Vaikka tiedosto ei ihan valtiosalaisuuksia sisältäisi, joidenkin asioiden pääseminen ulkopuolisille voi olla ainakin kiusallista.

Jäännöstietoa kertyy, kun käytetään Wordin pikatallennusta (Save/Tallenna). Pikatallennus ei poista aiempia tietoja, vaan tallentaa uuden tiedon niiden perään. Alkuperäiset tiedot o­n myöhemmin palautettavissa, mikä o­n o­ngelma esimerkiksi siinä tapauksessa, että käytetään samaa dokumenttipohjaa, esimerkiksi tarjouslomaketta, moneen kertaan.

Pikatallennus siis yksinkertaisesti lisää uuden datan aiemman perään sen sijaan, että aiempi tuhottaisiin kirjoittamalla sen päälle. Siksi aiempi, käyttäjälle näkymätön versio tiedostosta voidaan jälkikäteen palauttaa luettavaan muotoon.

Jos taas tiedoston tallentaa nimellä (Save as/Tallenna nimellä), muutokset kirjoitetaan aiemman datan päälle, jolloin sen lukeminen jälkikäteen o­n ainakin huomattavasti työläämpää, ellei peräti mahdotonta. Vaikka nimellä tallentaminen o­n hieman pikatallennusta hitaampi tapa, sen avulla tekstin vanhat versiot eivät jää kummittelemaan jäännöstietoihin.

Vältä turhia doc-tiedostoja

Joissakin tapauksissa doc-tiedostomuodon käyttäminen voi olla perusteltua ja tarpeen; jos esimerkiksi usea henkilö työstää samaa laajaa tiedostoa, jokaisen lisäykset ja korjaukset kun pitää saada näkyviin.

Monesti jokin toinen tiedostomuoto – kuten txt tai rtf – kuitenkin riittää halutun informaation välittämiseen turvallisesti. Lisäksi pelkistetyt tekstitiedostot avautuvat vastaanottajankin tietokoneella riippumatta siitä, mitä tekstinkäsittelyohjelmaa hän käyttää.

Tallennusmuodon voi valita File/Tiedosto-valikon komennolla Save as/Tallenna nimellä. Turvallisinta o­n, mikäli mahdollista, valita tekstitiedosto (kuten ASCII tai Plain text), sillä se ei sisällä ylimääräistä dataa.

Doc-tiedostojen välttämistä perustellaan muillakin syillä. Ensinnäkin se vie metadatan vuoksi enemmän tilaa kuin tekstitiedosto, mikä varsinkin sähköpostikäytössä o­n merkillepantavaa. Toiseksi doc-ympäristö o­n makrovirusten temmellyskenttää. Makrot ovat Wordin automaattisia toimintoja, ja ne voi myös kytkeä pois päältä.

Sähköpostissa doc-liitteiden lähettämistä pitäisi muutenkin pyrkiä välttämään, ellei yllämainitun kaltainen ryhmätyöskentely sitä edellytä. Kannattaa ainakin miettiä, o­nko olemassa jokin painava syy Word-dokumentin liittämiselle sähköpostiviestiin. Jos o­n tottunut käyttämään tekstinkäsittelyohjelmaa eikä halua tekstata suoraan sähköpostiohjelmaan, tekstin voi ensin kirjoittaa Wordissä, maalata, kopioida ja liittää sähköpostin viestikenttään.

Käytä muita tiedostomuotoja

Wordin käyttämä doc ei ole ainoa tiedostomuoto, joka sisältää näkymätöntä informaatiota; piilodataa voi olla muissakin Office-dokumenteissa, kuten Excel- ja PowerPoint-tiedostoissa.

Jos tiedostoon tarvitaan muitakin kuin tekstielementtejä, kannattaa harkita pdf:n ja jpg:n kaltaisia formaatteja. Pdf o­n tiedostomuotona varsin turvallinen ja käyttökelpoinen, jos tiedoston ulkoasun o­n säilyttävä samanlaisena julkaisuympäristöstä riippumatta.

Käyttäjä voi toki tallentaa työnsä Wordissä johonkin muuhun kuin doc-muotoon – jos osaa. Moni vain ei tunne käyttämänsä tekstinkäsittelyohjelman tallennusmahdollisuuksia sen paremmin kuin muitakaan ominaisuuksia.

Jos dokumenttia ei tarvitse lähettää mihinkään sähköisessä muodossa mutta siitä tarvitaan kuitenkin kopioita, voi tietysti aina turvautua vanhaan menetelmään, jossa piilotieto o­n minimoitu ja tulostaa tiedosto paperille.

Microsoftilla o­n sivuillaan ohjeita, joilla Wordin asetuksia voi säätää turvallisemmiksi.


Jutun kirjoitti: Antti Kirves

Antti Kirves

Kirjoita kommentti
Ohjeet: Pysy aiheessa ja kirjoita napakasti. Muista, että haastateltavilla, kanssakeskustelijoilla ja toimittajilla on oikeus omaan, eriävään mielipiteeseen. Ole kohtelias ja ystävällinen, äläkä tarkoituksella provosoi tai hauku muita keskustelijoita. Taloussanomat varaa oikeuden poistaa asiattomat viestit. Varauduthan siihen, että linkkejä sisältävät viestit tarkistetaan yksitellen roskapostin suodattamiseksi. Arvostamme mielipidettäsi!
> Lue koko keskusteluetiketti

Uusimmat uutiset

Digiyesterday

Viisi vuotta sitten

Krakkerit töhersivät ydinturvajärjestön nettisivut

11.02.2007 Krakkerit ujuttivat keskiviikkona Kanadan ydinturvakomission web-sivujen etusivulle kuvan ydinräjähdyksestä. Komissiossa ei tiedetä, milloin palvelimelle murtauduttiin ja miten kauan krakkerit siellä viihtyivät.


Kolme vuotta sitten

TeliaSonera: Ruotsin laajakaista on suurin haaste

11.02.2009 TeliaSoneran toimitusjohtajan Lars Nybergin mukaan yhtiön suurin haaste on, miten konserni saa karsittua kuluja laajakaistatoiminnoista. Suurin murhe ovat nyt Ruotsin laajakaistat.

.