Hakukoneen vangit
30.10.2008 11:16 Kuvittele, että yrityksesi on joutunut protestilistalle. Talouslehdet ja verkkopalvelut ovat jakaneet tiedon tuhansille lukijoille.
Protestilistalle voi päätyä isokin yritys. Aina se ei johdu rahan puutteesta, syynä voi olla puhdas vahinko – oma tai toisen.
Protestilista on melko toimiva järjestelmä ja tiettyjen koukeroiden jälkeen olet päässyt sieltä pois. Jäljelle jää vielä pieni ongelma: Hakukone kertoo kaikille, jotka etsivät tietoa yrityksestäsi, että se on protestilistalla. Olet hakukoneen vanki.
Hakukoneen vangit ottavat usein yhteyttä Taloussanomiin, koska hakukone kertoo, että se on löytänyt protestilistan tiedon palvelun sivuilta. Tieto on yleensä asianmukaisesti poistettu Taloussanomien palvelusta, mutta viittaus siihen elää edelleen Googlessa.
Käytännössä prosessi toimii näin: Asiakastieto toimittaa Taloussanomille protesti-ilmoitukset. Protestit siirtyvät palveluun automaattisesti.
Mikäli protesti on aiheeton, se oikaistaan Asiakastiedolle. Kun Asiakastieto peruuttaa protestin ja ilmoittaa siitä sähköpostilla, niin se poistetaan manuaalisesti lehden sivuilta.
Mutta mitä tehdä hakukoneen keräämän ja tallentaman tiedon kanssa? Verkkopalvelu voi yrittää vaikuttaa jossain määrin tilanteeseen kertomalla sivusta hakurobotille: älä lue näitä sivuja, nämä sivut päivittyvät usein.
Hakurobottien toimintalogiikka on kuitenkin suuri salaisuus, sillä hakukoneyhtiöt taistelevat jatkuvasti roskapostimarkkinointia vastaan. Niiden täytyy, sillä muuten me kaikki lopettaisimme hakukoneiden käytön.
Perusongelma liittyy netin tiedon valtavaan määrään. Minkään yrityksen hakurobotit eivät voi käydä läpi koko nettiä reaaliajassa tai edes joka päivä.
Tehokkuuden nimissä ja käyttäjiä paremmin palvellakseen hakukone, Suomessa se tarkoittaa lähes aina Googlea, arkistoi kaiken hakemansa sisällön. Tässä mielessä hakukoneen tiedot ovat aina "vanhentuneita". Ne kuvastavat sivun sisältöä ainoastaan sillä hetkellä, jolloin hakurobotti on viimeksi sivulla käynyt.
Hakutulosten lisäksi Googlella on mielenkiintoinen välimuisti-toiminto, jolla hakutuloksen kohdesivua voi tarkastella sen näköisenä, millainen se oli kun hakurobotti sen viimeksi indeksoi. Tästä on apua esimerkiksi silloin, kun haluttu sivu on saavuttamattomissa vaikka palvelimen kaatumisen tai sivun poistamisen takia.
Tietojen "takaisin vetämisen" tai korjaamisen kannalta välimuistipalvelu on taas aikamoinen riesa.
Sivun poistamista hakukoneen tuloksista voi toki pyytää, mutta asian käsittelyyn voi mennä viikkojakin, ja sen teettäminen on suurelta osin käsipeliä.
Jos hakukoneen vanki onnistuukin karkaamaan ja saamaan väärän tai vanhentuneen tiedon pois Googlen sivuilta, tieto löytyy kuitenkin vielä nettiarkistosta. Tämä on hakukoneiden läheinen sukulainen, arkistointirobotti, jonka pyrkii arkistoimaan verkon sisällöt pysyvästi.
Esimerkiksi Wayback Machine on palvelu, josta voi kurkata historiaan. Historiaan kirjattujen väärien tietojen muuttaminen onkin sitten mahdotonta.
Silloin ei auta muu kuin luottaa ihmisten medialukutaidon kehittymiseen: kaikki mikä on joskus julkaistu ei välttämättä ole totta.
(Wayback Machine näyttää esimerkiksi sen mitä Digitoday kirjoitti 23. lokakuuta 2003.)
- Digitodayn tuoreimmat uutiset.
- 16:47 Facebook-kaverin poisto johti kaksoismurhaan
- 16:26 Googlen lompakko hakkeroitiin helposti
- 16:15 Google pystyttää kilpailijaa Dropboxille
- 14:05 Alcatel-Lucent lopettaa työpaikkoja
- 14:02 Pirate Bay uhmaa muistitikulla estoja
- 14:00 Comptel puolittaa osingon
- 13:41 Kodak keskittyy kuvien tulostamiseen
- 13:37 Yle: Piraattiradio häiriköi Turun seudulla
- 12:37 Windows XP:lle harvinaisen vähän korjauksia
- 10:03 Itsemurhatehtaan johtajalta vohkittiin salasana
- 09:48 Googlen ensimmäinen työntekijä lähtee
- 09:22 Microsoft keskeytti yllättäen Lumia 900:n varaukset
- 07:00 FBI: Steve Jobsilla oli top-secret -luokitus
- 9.2. Uusi iPad tulee maaliskuun alussa?
- 9.2. Siri opiskelee kiinaa ja venäjää
- 9.2. Peliskene poimi presidentin palkinnon
- 9.2. Google: Näytä surfailusi, saat rahaa
- 9.2. Skimmaajat teettivät erikoislaitteita Suomen oloihin
- 9.2. Samsungilta ei julkistuksia Barcelonassa
- 9.2. Ciscon tulos parani reippaasti
- Uusimmat
- 48h luetuimmat kaikista uutisista.
- 8.2. Nokia-pomo: Puhelimet ovat Designed in Finland
- 07:00 FBI: Steve Jobsilla oli top-secret -luokitus
- 8.2. Nokian Salon tehdasta on ajettu alas pitkään
- 8.2. Kaksi minuuttia Iron Skyta – Elokuva "täynnä vastoinkäymisiä"
- 09:22 Microsoft keskeytti yllättäen Lumia 900:n varaukset
- 7.2. Belle-päivitys tuli viimein Symbianiin
- 9.2. Sadan tonnin sakot kuluttajien harhauttamisesta
- 8.2. Nokia julkistaa huippupuhelimen Barcelonassa
- 8.2. Applen televisio voi saada liikeohjauksen
- 8.2. Yllätys: Nokia on ylivoimainen web-johtaja
- Luetuimmat
- 48h suositelluimmat kaikista uutisista.
- 7.2. Äidit käyvät imettämällä Facebookia vastaan
- 7.2. Intia perui toimiluvat, Telenor uhkaa lähteä
- 7.2. Nokia kertoo miten käy Salon tehtaan
- Suositelluimmat
- 48h kommentoiduimmat kaikista uutisista.
- 8.2. Nokia-pomo: Puhelimet ovat Designed in Finland
- 9.2. Yllättävä ongelma: iPhone 4S ei toimi kiinalaisten sim-kortilla
- 07:00 FBI: Steve Jobsilla oli top-secret -luokitus
- 8.2. Nokian Salon tehdasta on ajettu alas pitkään
- 8.2. Applen televisio voi saada liikeohjauksen
- 09:22 Microsoft keskeytti yllättäen Lumia 900:n varaukset
- 9.2. Microsoft tarjoaa Lumia 800 -kimppua ystävänpäivänä
- 7.2. Nokia kertoo miten käy Salon tehtaan
- 7.2. Microsoft poistaa start-napin
- 8.2. Nokia julkistaa huippupuhelimen Barcelonassa
- Kommentoiduimmat
Uutisviikko
Mitä viikolla on tapahtunut, mikä puhuttanut eniten? Koko viikon uutiset.
Uutispäivä
Vuorokauden kaikki uutiset yhdellä sivulla.
Uusimmat uutiset
- Twiittaileva Murdoch sättii Obamaa ja Googlea 10:55
- Homovastainen kirkko protestoi Jobsin hautajaisissa 09:41
- Skype ostaa GroupMe-ryhmäviestiyhtiön 08:48
- Applea vastaan aktivismipäivä Suomessa 14:02
- Kiina kielsi ihmisoikeus-sanan tekstiviesteissä 15:23
- Asbestikalsarit liekeissä 15:42
- Lasten paikannusranneke pelottaa ja houkuttaa 11:03
- EU epäilee älykorttien sirunvalmistajia hintakartellista 13:22
- Lisää
Digiyesterday
Viisi vuotta sitten
Alcatel-Lucent irtisanoo tuhansia
10.02.2007 Telelaitevalmistaja Alcatel-Lucent irtisanoo 3 500 työntekijää. Ranskalais - amerikkalaisen yhtiön toiminnallinen tulos romahti viime vuoden viimeisellä neljänneksellä 21 miljoonaan euroon, ja irtisanomiset ovat yhtiön mukaan tarpeen suunnan muuttamiseksi.
Kolme vuotta sitten
Soneralta verkkokauppa 49 eurolla kuukaudessa
10.02.2009 Sonera tuo pk-yrityksille kotisivun, markkinointityökalut ja verkkokaupan 49 eurolla kuussa. Tarjolla on myös pelkkä kotisivupaketti 19 eurolla kuukaudessa.
Taloussanomat
- Koulutettu, ole iloinen huonosta palkastasi 06:01
- Raatoja tulee ravintola-alalla: "Dokaaminen meni muodista" 15:01
- Tämä sana joutui pannaan – Ollila haluaa sen takaisin 15:39
- Kreikan sopu järkkyi jo: Puoluepomo aikoo äänestää ei 16:22
- Erimielisyyksiä osingoista – OP-Pohjola antoi potkut pankkiirilleen 10:07
- USA:ssa luottamus notkahti vielä pelättyäkin enemmän 17:32
- Merkel: Kreikka tarvitsee lisää apua 13:01
- Kreikan poliisi haluaa pidättää EU-virkailijat 17:12
- ABC-ketju ei onnistukaan ihan kaikessa 06:04
- IEA: Öljyn kysyntä laskee 14:50
- » Taloussanomat.fi














Kommentit (7)
Kyllä Googlen ja suurimmat selaimet voi estää. Voi vain sanoa robots tiedoston avulla mitä ei saa missään tapauksessa indeksoida. Kertomalla taas että joku päivittyy usein, yritetään saada Google käymään sivulla useammin.
Kannattaa katsoa www[dot]robotstxt[dot]org jos asia kiinnostaa.
Hyvin paljon on mahdollisuuksia. Hoidetaan ne taustatyöt ennen näiden totuuksien kirjoittelua.
DT:n lukijat taaskaan eivät ymmärrä kirjoitusta. Eikö kyse ollut nimenomaan siitä että jotkut sivut jäävät G:n välimuistiin (tottakai ne sinne halutaan, jotta lukijoita olisi), mutta jos ne halutaan pois sieltä - homma ei olekaan yksinkertaista. Eli jos tämä uutinen poistuu (oikeasti) niin eihän tätä uutista haluta säilyvän Googlen indeksissä tai välimuistissa. Olen itsekkin törmännyt nimittäin samaan asiaan.
Muuta nyt sitten myöhemmin meta-tageja yksittäisten sivujen kohdalla ja toivo että googlerobotti käy uudelleen katsomassa sivua... No ehkä jossain nakkikioskin sivuilla joilla on 3 sivua, ongelmaa ei ehkä esiinny. Ymmärrän tuskan