Taloussanomat
Lue uutinen mobiilisivustolla
Medialukutaito pelastaa

Hakukoneen vangit

Kuva: Matias Mäki

30.10.2008 11:16 Kuvittele, että yrityksesi on joutunut protestilistalle. Talouslehdet ja verkkopalvelut ovat jakaneet tiedon tuhansille lukijoille.

Protestilistalle voi päätyä isokin yritys. Aina se ei johdu rahan puutteesta, syynä voi olla puhdas vahinko – oma tai toisen.

Protestilista on melko toimiva järjestelmä ja tiettyjen koukeroiden jälkeen olet päässyt sieltä pois. Jäljelle jää vielä pieni ongelma: Hakukone kertoo kaikille, jotka etsivät tietoa yrityksestäsi, että se on protestilistalla. Olet hakukoneen vanki.

Hakukoneen vangit ottavat usein yhteyttä Taloussanomiin, koska hakukone kertoo, että se on löytänyt protestilistan tiedon palvelun sivuilta. Tieto on yleensä  asianmukaisesti poistettu Taloussanomien palvelusta, mutta viittaus siihen elää edelleen Googlessa.

Käytännössä prosessi toimii näin: Asiakastieto toimittaa Taloussanomille protesti-ilmoitukset. Protestit siirtyvät palveluun automaattisesti.

Mikäli protesti on aiheeton, se oikaistaan Asiakastiedolle. Kun Asiakastieto peruuttaa protestin ja ilmoittaa siitä sähköpostilla, niin se poistetaan manuaalisesti lehden sivuilta.

Mutta mitä tehdä hakukoneen keräämän ja tallentaman tiedon kanssa? Verkkopalvelu voi yrittää vaikuttaa jossain määrin tilanteeseen kertomalla sivusta hakurobotille: älä lue näitä sivuja, nämä sivut päivittyvät usein.

Hakurobottien toimintalogiikka on kuitenkin suuri salaisuus, sillä hakukoneyhtiöt taistelevat jatkuvasti roskapostimarkkinointia vastaan. Niiden täytyy, sillä muuten me kaikki lopettaisimme hakukoneiden käytön.

Perusongelma liittyy netin tiedon valtavaan määrään. Minkään yrityksen hakurobotit eivät voi käydä läpi koko nettiä reaaliajassa tai edes joka päivä.

Tehokkuuden nimissä ja käyttäjiä paremmin palvellakseen hakukone, Suomessa se tarkoittaa lähes aina Googlea, arkistoi kaiken hakemansa sisällön. Tässä mielessä hakukoneen tiedot ovat aina "vanhentuneita". Ne kuvastavat sivun sisältöä ainoastaan sillä hetkellä, jolloin hakurobotti on viimeksi sivulla käynyt.

Hakutulosten lisäksi Googlella on mielenkiintoinen välimuisti-toiminto, jolla hakutuloksen kohdesivua voi tarkastella sen näköisenä, millainen se oli kun hakurobotti sen viimeksi indeksoi. Tästä on apua esimerkiksi silloin, kun haluttu sivu on saavuttamattomissa vaikka palvelimen kaatumisen tai sivun poistamisen takia.

Tietojen "takaisin vetämisen" tai korjaamisen kannalta välimuistipalvelu on taas aikamoinen riesa.

Sivun poistamista hakukoneen tuloksista voi toki pyytää, mutta asian käsittelyyn voi mennä viikkojakin, ja sen teettäminen on suurelta osin käsipeliä.

Jos hakukoneen vanki onnistuukin karkaamaan ja saamaan väärän tai vanhentuneen tiedon pois Googlen sivuilta, tieto löytyy kuitenkin vielä nettiarkistosta. Tämä on hakukoneiden läheinen sukulainen, arkistointirobotti, jonka pyrkii arkistoimaan verkon sisällöt pysyvästi.

Esimerkiksi Wayback Machine on palvelu, josta voi kurkata historiaan. Historiaan kirjattujen väärien tietojen muuttaminen onkin sitten mahdotonta.

Silloin ei auta muu kuin luottaa ihmisten medialukutaidon kehittymiseen: kaikki mikä on joskus julkaistu ei välttämättä ole totta.

(Wayback Machine näyttää esimerkiksi sen mitä Digitoday kirjoitti 23. lokakuuta 2003.)

Jutun kirjoitti: Ilya Poropudas

Ilya Poropudas

Teksti on lisensoitu Creative Commons Nimeä-Ei muutoksia-Epäkaupallinen -lisenssillä.

Mainitut yritykset

Kommentit (7)

Huono 0
pahempi ongelma on painetut lehdet. niitä ei kukaan päivitä painon jälkeen.
seitsemän
On hyvä että netti muistaa pitkään tätä ei hämärämiehet ja talousrikolliset halua.
Hakukoneet pitävät puolensa
Netti muistaa myös valikoivasti - kuka arkistoa ylläpitää?
JJ
Huono 4
Mutta mitä tehdä hakukoneen keräämän ja tallentaman tiedon kanssa? Verkkopalvelu voi yrittää vaikuttaa jossain määrin tilanteeseen kertomalla sivusta hakurobotille: älä lue näitä sivuja, nämä sivut päivittyvät usein.

Kyllä Googlen ja suurimmat selaimet voi estää. Voi vain sanoa robots tiedoston avulla mitä ei saa missään tapauksessa indeksoida. Kertomalla taas että joku päivittyy usein, yritetään saada Google käymään sivulla useammin.

Kannattaa katsoa www[dot]robotstxt[dot]org jos asia kiinnostaa.
-
Huono 7
Mjoo kannattaa hieman tutkia hommaa ennen kirjoittelua. Aika simppeli juttu tuo indeksoinnin esto.
Gogle
Huono 7
mm. Googlelle voi myös esim kertoa, että kuinka usein sivu päivittyy eli kuinka usein se kannattaa indeksoida. Myös indeksoinnin googlen välimuistiin (cache) voidaan estää. Yksittäisten sivujen indeksoinnin voi estää itse sivuilla, tai estää sen ettei sivuilta seurata mitään linkkejä. Tämän voi tehdä myös linkkitasolla. jnejnejnejnejne.

Hyvin paljon on mahdollisuuksia. Hoidetaan ne taustatyöt ennen näiden totuuksien kirjoittelua.
Hippi
Huono 2
Mjoo kannattaa hieman tutkia hommaa ennen kirjoittelua. Aika simppeli juttu tuo indeksoinnin esto.

DT:n lukijat taaskaan eivät ymmärrä kirjoitusta. Eikö kyse ollut nimenomaan siitä että jotkut sivut jäävät G:n välimuistiin (tottakai ne sinne halutaan, jotta lukijoita olisi), mutta jos ne halutaan pois sieltä - homma ei olekaan yksinkertaista. Eli jos tämä uutinen poistuu (oikeasti) niin eihän tätä uutista haluta säilyvän Googlen indeksissä tai välimuistissa. Olen itsekkin törmännyt nimittäin samaan asiaan.

Muuta nyt sitten myöhemmin meta-tageja yksittäisten sivujen kohdalla ja toivo että googlerobotti käy uudelleen katsomassa sivua... No ehkä jossain nakkikioskin sivuilla joilla on 3 sivua, ongelmaa ei ehkä esiinny. Ymmärrän tuskan
Ghate
Sivut: 1 Edellinen Seuraava
Kirjoita vastaus
Ohjeet: Pysy aiheessa ja kirjoita napakasti. Muista, että haastateltavilla, kanssakeskustelijoilla ja toimittajilla on oikeus omaan, eriävään mielipiteeseen. Ole kohtelias ja ystävällinen, äläkä tarkoituksella provosoi tai hauku muita keskustelijoita. Taloussanomat varaa oikeuden poistaa asiattomat viestit. Varauduthan siihen, että linkkejä sisältävät viestit tarkistetaan yksitellen roskapostin suodattamiseksi. Arvostamme mielipidettäsi!
> Lue koko keskusteluetiketti

Uusimmat uutiset

Digiyesterday

Viisi vuotta sitten

Alcatel-Lucent irtisanoo tuhansia

10.02.2007 Telelaitevalmistaja Alcatel-Lucent irtisanoo 3 500 työntekijää. Ranskalais - amerikkalaisen yhtiön toiminnallinen tulos romahti viime vuoden viimeisellä neljänneksellä 21 miljoonaan euroon, ja irtisanomiset ovat yhtiön mukaan tarpeen suunnan muuttamiseksi.


Kolme vuotta sitten

Soneralta verkkokauppa 49 eurolla kuukaudessa

10.02.2009 Sonera tuo pk-yrityksille kotisivun, markkinointityökalut ja verkkokaupan 49 eurolla kuussa. Tarjolla on myös pelkkä kotisivupaketti 19 eurolla kuukaudessa.

.