Algoritmi selvittää Wikipedia-kirjoittajien luotettavuuden
6.8.2007 14:45 Santa Cruzin yliopistossa on kehitetty yksinkertainen tapa kertoa netin suositun tietosanakirjan tietojen luotettavuudesta.
Santa Cruzin yliopiston tietojenkäsittely-yksikön Wikipedialle kehittämän ehdotuksen tarkoituksena on esitellä tapa kertoa, kuinka luotettavia Wikipedian tiedot ovat.
Järjestelmä perustuu kirjoittajien tekemien muutosten pitkäikäisyyteen. Mitä pidemmän aikaa kirjoittajan kirjoittama tekstinpätkä pysyy muuttumattomana, sitä uskottavampi kirjoittaja on. Käytännössä siis kehitetty algoritmi seuraa, korjaavatko muut Wikipedian käyttäjät kirjoittajan muutoksia vai eivät.
On helppoa olettaa, että pitkään muokkaamattomana säilynyt teksti on tiedoiltaan oikein.
Wikin lukijoille tiedon uskottavuus ilmaistaan sanoittain. Mitä epäluotettavampi sanan, lauseen tai kappaleen kirjoittaja on, sitä oranssimmaksi tekstin taustaväri muuttuu.
Ratkaisun keksijät Luca de Alfaro, B. Thomas Adler, Marco Faella, Ian Pye ja Caitlin Sadowski kutsuvat kehittämäänsä järjestelmää sisältövetoiseksi mainejärjestelmäksi, koska jokaisen kirjoittajan maine lasketaan automaattisesti tekstianalyysin avulla.
Kehittäjien mukaan luotettavuuden laskualgoritmi on vielä keskeneräinen, mutta sillä päästään jo aika hyviin tuloksiin.
Toistaiseksi yliopiston kehittämä mainejärjestelmä on pelkkä ehdotus. Tekniikkaan voi tutustua projektin kotisivulla ja esittely-wikissä.
- Digitodayn tuoreimmat uutiset.
- 10.2. Facebook-kaverin poisto johti kaksoismurhaan
- 10.2. Googlen lompakko hakkeroitiin helposti
- 10.2. Google pystyttää kilpailijaa Dropboxille
- 10.2. Alcatel-Lucent lopettaa työpaikkoja
- 10.2. Pirate Bay uhmaa muistitikulla estoja
- 10.2. Comptel puolittaa osingon
- 10.2. Kodak keskittyy kuvien tulostamiseen
- 10.2. Yle: Piraattiradio häiriköi Turun seudulla
- 10.2. Windows XP:lle harvinaisen vähän korjauksia
- 10.2. Itsemurhatehtaan johtajalta vohkittiin salasana
- 10.2. Googlen ensimmäinen työntekijä lähtee
- 10.2. Microsoft keskeytti yllättäen Lumia 900:n varaukset
- 10.2. FBI: Steve Jobsilla oli top-secret -luokitus
- 9.2. Uusi iPad tulee maaliskuun alussa?
- 9.2. Siri opiskelee kiinaa ja venäjää
- 9.2. Peliskene poimi presidentin palkinnon
- 9.2. Google: Näytä surfailusi, saat rahaa
- 9.2. Skimmaajat teettivät erikoislaitteita Suomen oloihin
- 9.2. Samsungilta ei julkistuksia Barcelonassa
- 9.2. Ciscon tulos parani reippaasti
- Uusimmat
- 48h luetuimmat kaikista uutisista.
- 10.2. FBI: Steve Jobsilla oli top-secret -luokitus
- 8.2. Nokia-pomo: Puhelimet ovat Designed in Finland
- 8.2. Nokian Salon tehdasta on ajettu alas pitkään
- 10.2. Microsoft keskeytti yllättäen Lumia 900:n varaukset
- 8.2. Kaksi minuuttia Iron Skyta – Elokuva "täynnä vastoinkäymisiä"
- 9.2. Sadan tonnin sakot kuluttajien harhauttamisesta
- 8.2. Nokia julkistaa huippupuhelimen Barcelonassa
- 8.2. Applen televisio voi saada liikeohjauksen
- 8.2. Yllätys: Nokia on ylivoimainen web-johtaja
- 9.2. Yllättävä ongelma: iPhone 4S ei toimi kiinalaisten sim-kortilla
- Luetuimmat
- 48h suositelluimmat kaikista uutisista.
- 8.2. IPadille haetaan porttikieltoa Kiinaan
- 8.2. Kiinassa tarjolla miljardien eurojen verkkourakat
- 8.2. Nokian potkut uhkaavat tuhatta Salon tehtaalla
- 9.2. Microsoft tarjoaa Lumia 800 -kimppua ystävänpäivänä
- 9.2. Windows 8:n testiversio ilmestyy karkauspäivänä
- 9.2. Apple myy vihdoin iPhone 4S:ää Kiinassa
- Suositelluimmat
- 48h kommentoiduimmat kaikista uutisista.
- 8.2. Nokia-pomo: Puhelimet ovat Designed in Finland
- 9.2. Yllättävä ongelma: iPhone 4S ei toimi kiinalaisten sim-kortilla
- 10.2. FBI: Steve Jobsilla oli top-secret -luokitus
- 10.2. Microsoft keskeytti yllättäen Lumia 900:n varaukset
- 8.2. Nokian Salon tehdasta on ajettu alas pitkään
- 8.2. Applen televisio voi saada liikeohjauksen
- 9.2. Microsoft tarjoaa Lumia 800 -kimppua ystävänpäivänä
- 8.2. Nokia julkistaa huippupuhelimen Barcelonassa
- 8.2. Yllätys: Nokia on ylivoimainen web-johtaja
- 9.2. Uusi iPad tulee maaliskuun alussa?
- Kommentoiduimmat
Uutispäivä
Vuorokauden kaikki uutiset yhdellä sivulla.
Palautetta?
Lähetä risut, ruusut ja uutisvinkit toimitukselle.
Uusimmat uutiset
- Yle: Piraattiradio häiriköi Turun seudulla 13:37
- Peliskene poimi presidentin palkinnon 15:55
- Google: Näytä surfailusi, saat rahaa 14:20
- Angry Birds laskeutui Helsinki-Vantaalle 11:02
- Kaksi minuuttia Iron Skyta – Elokuva "täynnä vastoinkäymisiä" 22:50
- Xbox nousi vuoden ostetuimmaksi 13:17
- Facebook julkaisee uudestaan poistettuja kuvia 14:11
- Äidit käyvät imettämällä Facebookia vastaan 09:21
- Lisää
Digiyesterday
Viisi vuotta sitten
Kuriiri kadotti 80 000:n potilastiedot
11.02.2007 Amerikkalaisen Johns Hopkins -organisaation 52 000 työntekijän ja 83 000 potilaan tiedot sisältäneet nauhat ovat kadonneet matkalla alihankkijalle, joka tekee nauhoista varmuuskopioita.
Kolme vuotta sitten
Hudson-onnettomuuden ääninauhat kuunneltavissa
11.02.2009 Sankarilentäjäksi mainittu Chesley Sullenberger on kertonut hanhien osumisen koneeseensa olleen järkyttävä kokemus. Mutta ääninauhoilla hän kuulostaa erittäin rauhalliselta.
Taloussanomat
- Kilpailuta asuntolaina, voit säästää 3 300 euroa 06:01
- Osuusliike myy samppanjaa alle Alkon hintojen 06:06
- Kymmenien italialaispankkien luottoluokitus laski 16:05
- HS: SAK ei enää torju eläkeiän nostoa 10:13
- Kreikan hallitus hyväksyi säästöt uudestaan 15:29
- Professori Ylelle: Valtiollisten lentoyhtiöiden aika on ohi 10:31
- Skoda somisti Roomsterinsa partiopoikatyylillä 06:10
- TS: "Luonnonkalojen lääkejäämien riskit selvitettävä" 11:13
- Koulutettu, ole iloinen huonosta palkastasi 06:01
- SK: Nokia ulkoisti lokakuussa – Accenture jakaa jo eropaketteja 20:59
- » Taloussanomat.fi















Kommentit (17)
public static double luotettavuus(String kappale) {
// Tyhjä rivi/kappale todennäköisesti on aika luotettava
if (kappale.length>0) {
return 0.0;
}
return 1.0; // Luotettavaa materiaalia!
}
Noin jos vakavissaan ollaan, niin minun algoritmini on vähintään yhtä hyödyllinen! Uutisoitu algoritmi tosiaankin perustuu mahdollisesti erittäin vaarallisiin ja virheellisiin lähtöolettamuksiin.
Entä epäsuositut artikkelit? Tottakai paljon luettuja artikkeleja muutetaan enemmän. Harvoin tai ei ollenkaan luetut näyttävät jälleen tällä tavalla luotettavammilta.
Wikipedian ongelmat ovat:
1) kukaan ei päivitä muuttuvaa tietoa.
2) harvoin luetut artikkelit voivat jäädä alkeelliseen muotoon.
Tai entäs kun haluan kiusata henkilöä X. Katson hänen tekemänsä muutokset monta kertaa päivässä ja menen palauttamaan edellisen version tai sotken rivejä. Siinähän sitten näkyy että henkilön muutokset eivät pysy kauaa, joten on epäluotettava.
Eli mitäpä jos miettisivät uudestaan tätäkin asiaa taas.
Toisaalta tuotekehitys ja uraauurtava-ajattelu eivät ole ikinä olleet Hölmölässä pop, eikä siis ihme että ne innovatiivisimmat tuotteet myydään Lidl:issä. Yleisesti ottaen Hölmölän tuotteiden muotoilu ja kehitystaso näyttävät jääneen 80-luvulle; kiitos tehokkaan muutosvastarintaliikkeen.