Taloussanomat
Lue uutinen mobiilisivustolla
Arvioiva p2p-haku kirjoitusvirheitä vastaan

Cubit-hakuprotokolla pyrkii syrjäyttämään torrent-sivustot

Vertaisverkossa jaetut tiedostot löytyvät väärälläkin kirjoitusasulla Cubitin avulla
Kuva: Antti Kirves

18.6.2008 13:45 Cubitiksi nimetty vertaisverkko (p2p) -hakuprotokolla nousee haastamaan torrent-sivustot. Cubitin tavoitteena on tarjota käyttäjille toimiva haku tiedostojenjakoon p2p-verkoissa.

Cornellin yliopiston projektissa pyritään kehittämään pätevä hakutekniikka, joka pystyisi käsittelemään epätarkkoja merkkijonohakuja tiedostojenjako-ohjelmissa.

Cubitin yksi kehittäjistä, Bernard Wong, kertoo Ars Technica-sivustolla projektin motivaatioksi kirjoitusvirheet sekä hauissa, että tiedostojen nimissä. Wong esitteli sivustolle esimerkiksi Googlen tilastoja Britney Spears-hauista. Tilastot osoittivat, että laulajan nimi oli 20 prosentissa hauista kirjoitettu väärin.

Hakutulokset koostuvat
merkkijonojen muutoksista

Teknisesti Cubit luo alkuun tunnistetiedot p2p-verkoston kaikille jaossa oleville tiedostoille.

Tietokone luo tämän jälkeen sisäisen kartan tunnistetietojen perusteella. Kartta verkottaa esimerkiksi sanat talo ja valo lähekkäin, koska niiden merkkijonojen välinen muutos on yksi. Sisäinen kartta sijoittaa sanan valas kohtalaisen lähelle sanaa talo, sillä merkkijonojen välinen muutos on kolme.

Tällöin haun tapahtuessa väärinkirjoitetulla sanalla ralo, tulokset sanoille talo ja valo sijoittuisivat korkealle merkkijonojen välisen muutoksen ollessa yksi.

Sisäisen kartan koontitavan vuoksi hakujen ei tarvitse tarkistaa jokaista verkon tiedostoa.

P2P-ohjelmat sisältävät jo hajautustauluun pohjautuvia hakutoimintoja, mutta ne yleisesti toimivat vain tarkkojen hakusanojen kanssa. 

Arvioiva haku ei vielä
haasta torrent-sivustoja

Cubitin päivä parrasvaloissa on kuitenkin vielä kaukana, torrent-sivustojen pystyessä vielä tällä hetkellä tarjoamaan paremmin metatietoa ja parempaa organisointia. Cubit pohjaa hakunsa tiedostojen nimiin ja kommenttiosioihin.

Laittoman materiaalin jakamisen tutkimista Cubit ei varsinaisesti helpota tai vaikeuta. Hakuprotokolla pystyy kuitenkin kohdentamaan laittoman sisällön jäljittämisen käyttäjiin sivustojen sijaan. 

PdfProjektin tarkka kuvaus
Jutun kirjoitti: Hannu Nokso-Koivisto

Hannu Nokso-Koivisto

Teksti on lisensoitu Creative Commons Nimeä-Ei muutoksia-Epäkaupallinen -lisenssillä.

Kommentit (6)

Huono 0
Oi ei, eli saamme samantyyppistä hakua kuin Googlella nykyään, eli kun haen sanaa fhrwef, Google päättää että halusinkin hakea fhatef ja näyttää miljoonia kiinnostamattomia tuloksia. EI kiitos.
-
Googlen eka hitti haulle "fhrwef", tämä uutinen. Nopeaa indeksointia.

Ja ehdotus: Tarkoititko: fahrweg

Huijari! ;)
gOEGGELS
Huono 7
Olen kokeillut, ei toimi. En tarkoita tuota turhaa oikeinkirjoitus systeemiä vaan ohjelman tuomia tuloksia. Se ei kykene tarjoamaan minulle sellaisia torrentteja, joita etsin.
Pettynyt
Huono 6
kuulostaa ikään kuin emulelta
JJ
Huono 5
Tarkoittaa käsivarren mittaa, ainakin tulokset taitaa olla semmoisen päässä. Sattuva nimi siis.
Mutta entäs jos hakeekin Mary Carey:ä eikä laulajaheitukkaa..?

Oli miten oli, sekoittuu kuitenkin qubittiin.
sekoittuu
Huono 5
Tarkoittaa käsivarren mittaa, ainakin tulokset taitaa olla semmoisen päässä. Sattuva nimi siis.
Mutta entäs jos hakeekin Mary Carey:ä eikä laulajaheitukkaa..?

Oli miten oli, sekoittuu kuitenkin qubittiin.
sekoittuu
Sivut: 1 Edellinen Seuraava

Uusimmat uutiset

Digiyesterday


Kolme vuotta sitten

Sun julkisti avoimen lähdekoodin GlassFish-sovellusalustan

11.02.2009 Sun Microsystems on julkistanut avoimeen lähdekoodiin perustuvan Sun GlassFish Portfolio -sovellusalustan web-sovellusten kehittämiseen. Siihen on koottu usean avoimen koodin projektin tuloksia.

.