Taloussanomat
Lue uutinen mobiilisivustolla
Tutkijat kehittävät sisältövetoista mainejärjestelmää Wikeille

Algoritmi selvittää Wikipedia-kirjoittajien luotettavuuden

6.8.2007 14:45 Santa Cruzin yliopistossa on kehitetty yksinkertainen tapa kertoa netin suositun tietosanakirjan tietojen luotettavuudesta.

Santa Cruzin yliopiston tietojenkäsittely-yksikön Wikipedialle kehittämän ehdotuksen tarkoituksena on esitellä tapa kertoa, kuinka luotettavia Wikipedian tiedot ovat.

Järjestelmä perustuu kirjoittajien tekemien muutosten pitkäikäisyyteen. Mitä pidemmän aikaa kirjoittajan kirjoittama tekstinpätkä pysyy muuttumattomana, sitä uskottavampi kirjoittaja on. Käytännössä siis kehitetty algoritmi seuraa, korjaavatko muut Wikipedian käyttäjät kirjoittajan muutoksia vai eivät.

On helppoa olettaa, että pitkään muokkaamattomana säilynyt teksti on tiedoiltaan oikein.

Wikin lukijoille tiedon uskottavuus ilmaistaan sanoittain. Mitä epäluotettavampi sanan, lauseen tai kappaleen kirjoittaja on, sitä oranssimmaksi tekstin taustaväri muuttuu.

Ratkaisun keksijät Luca de Alfaro, B. Thomas Adler, Marco Faella, Ian Pye ja Caitlin Sadowski kutsuvat kehittämäänsä järjestelmää sisältövetoiseksi mainejärjestelmäksi, koska jokaisen kirjoittajan maine lasketaan automaattisesti tekstianalyysin avulla.

Kehittäjien mukaan luotettavuuden laskualgoritmi on vielä keskeneräinen, mutta sillä päästään jo aika hyviin tuloksiin.

Toistaiseksi yliopiston kehittämä mainejärjestelmä on pelkkä ehdotus. Tekniikkaan voi tutustua projektin kotisivulla ja esittely-wikissä.

Jutun kirjoitti: Matias Mäki

Matias Mäki

Teksti on lisensoitu Creative Commons Nimeä-Ei muutoksia-Epäkaupallinen -lisenssillä.

Mainitut yritykset

Kommentit (17)

Huono 0
Santa Cruzin yliopistossa on kehitetty yksinkertainen tapa kertoa netin suositun tietosanakirjan tietojen luotettavuudesta.
Digitoday
Huono 0
Uutisen aihe on mielenkiintoinen mutta otsikointia olisi voinut harkita paremmin. Nyt ainakin minulle syntyi mielikuva, että Wikipediaan kirjoittavien luotettavuus olisi jotenkin kyseenalainen ja uutinen käsittelisi sitä kuinka epäluotettavia kirjoitukset ovat.
Wikipedisti-kielipoliisi
Huono 0
/** Palauttaa Wikipedian tekstikappaleen luotettavuuden. 0.0 on täysin epäluotettava, 1.0 täysin luotettava. */
public static double luotettavuus(String kappale) {
// Tyhjä rivi/kappale todennäköisesti on aika luotettava
if (kappale.length>0) {
return 0.0;
}
return 1.0; // Luotettavaa materiaalia!
}

Noin jos vakavissaan ollaan, niin minun algoritmini on vähintään yhtä hyödyllinen! Uutisoitu algoritmi tosiaankin perustuu mahdollisesti erittäin vaarallisiin ja virheellisiin lähtöolettamuksiin.
Algoritmi
Huono 0
Mitenkäs, jos joku kirjoittaa Wikiin täysin keksityn artikkelin? Eihän sitä kukaan osaa korjata, joten se näyttää tällä algoritmillä hyvin pätevältä. Entä päivittäin muuttuvista asioista kertovat artikkelit? Nehän olisivat tämän systeemin mielestä äärimmäisen epäluotettavia, kun niiitä muutetaan muka liian usein.

Entä epäsuositut artikkelit? Tottakai paljon luettuja artikkeleja muutetaan enemmän. Harvoin tai ei ollenkaan luetut näyttävät jälleen tällä tavalla luotettavammilta.
Joutsenon mie
Huono 0
"Joutsenon mie" on oikeassa:
Wikipedian ongelmat ovat:
1) kukaan ei päivitä muuttuvaa tietoa.
2) harvoin luetut artikkelit voivat jäädä alkeelliseen muotoon.
Kirjoittaja
Huono 0
Juuri tämä algoritmi ei tosiaan toimi. Niin monesta asiasta taistellaan ja vaihdellaan rivejä eestaas. Tämän mukaan siis nämä kirjoittajat ovat epäluotettavia.

Tai entäs kun haluan kiusata henkilöä X. Katson hänen tekemänsä muutokset monta kertaa päivässä ja menen palauttamaan edellisen version tai sotken rivejä. Siinähän sitten näkyy että henkilön muutokset eivät pysy kauaa, joten on epäluotettava.

Eli mitäpä jos miettisivät uudestaan tätäkin asiaa taas.
-
Huono 0
Kaippa sieltä joutuu kirjotusvihreitä ja kankeita lauserakenteitakin joku joskus korjailemaan. Artikkelihan voi olla täynnä oikeaa ja luotettavaa tietoa, mutta kirjoittaja kaivata vähän avustusta kielipoliisilta... Silloinhan tämä järjestelmä näyttää "väärää negatiivista"...
Iona
Huono 0
Wikipedian kielibesserwisserit ovat juuri niitä, jotka korjailisivat vaikka Veijo Meren koko tuotannon piloille!
joojoo
Huono 0
Taas tämä tyypillinen tarina, ulkomaan ilouutinen ilmoittaa että on saatu kehitettyä jotain mikä parantaa nykyisyyttä. Sitten 7X suomalainen reaktio eli yhteenääneen arvon mitätöinti ja halveeraus.

Toisaalta tuotekehitys ja uraauurtava-ajattelu eivät ole ikinä olleet Hölmölässä pop, eikä siis ihme että ne innovatiivisimmat tuotteet myydään Lidl:issä. Yleisesti ottaen Hölmölän tuotteiden muotoilu ja kehitystaso näyttävät jääneen 80-luvulle; kiitos tehokkaan muutosvastarintaliikkeen.
Positiivisuutta suomalaiset
Huono 0
Positiivisuutta suomalaiset: Positiivista ajattelua kannatan itsekin, mutta kyllä itsestänikin tämä algoritmi kuulosti ensi lukemalta aika pöhköltä, ainakin noilla tiedoilla, mitä tässä uutisessa kerrottiin. Joku voi tosiaan kirjoittaa sisällöltään hyvän artikkelin Wikipediaan, mutta siinä on hieman kirjoitusvirheitä tai asiat olisi voinut sanoa järkevämmässä muodossa. Ja siis näkyisikö artikkelissa tekstit oranssina? Muutenkin wikiartikkelit on jo vähän hankalaa luettavaa, kun siellä on joka sanan takana linkki. Kyllä tekstin luettavuus kärsisi melkoisesti, jos joka sana olisi erisävyisellä oranssilla korostettu.
Positiivari
Sivut: 1 2 Edellinen Seuraava

Uusimmat uutiset

Digiyesterday

Viisi vuotta sitten

Kuriiri kadotti 80 000:n potilastiedot

11.02.2007 Amerikkalaisen Johns Hopkins -organisaation 52 000 työntekijän ja 83 000 potilaan tiedot sisältäneet nauhat ovat kadonneet matkalla alihankkijalle, joka tekee nauhoista varmuuskopioita.


Kolme vuotta sitten

Hudson-onnettomuuden ääninauhat kuunneltavissa

11.02.2009 Sankarilentäjäksi mainittu Chesley Sullenberger on kertonut hanhien osumisen koneeseensa olleen järkyttävä kokemus. Mutta ääninauhoilla hän kuulostaa erittäin rauhalliselta.

.