Tekes kehittää älykästä internet-hakukonetta
8.7.2003 15:55 Internetin suurimpien hakukoneiden omistus on keskittynyt Yhdysvaltoihin ja ne toimivat kaupallisilla periaatteilla. Tekesin Fenix - Vuorovaikutteinen tietotekniikka -teknologiaohjelmaan kuuluvassa projektissa kehitetään eurooppalaista, avoimeen lähdekoodiin
perustuvaa hakukonetta.
Teknillisen korkeakoulun ja Helsingin yliopiston yhteisen tietotekniikan tutkimusinstituutin HIIT:in Search-In-a-Box -projektissa lähdetään liikkeelle Internetiä helpommin hallittavissa olevasta tietomassasta. Siinä hakukonetta sovelletaan esimerkiksi yritysten intranetiin tai yhden käyttäjän henkilökohtaisiin sähköposteihin. Projektissa kehitetään intranet-käyttöliittymää ja palvelinta, jonka päälle yritykset voivat rakentaa sisäiseen verkkoonsa oman hakukoneen ja räätälöidä sen omien tarpeidensa mukaan.
- Yrityksillä ja yksittäisillä ihmisillä on koneillaan suuria määriä tietoa, johon ei ole mitään keinoa päästä käsiksi. Koneiden suorituskyvyn kasvaessa tiedon määrä lisääntyy ja tiedonhaun ongelmaan on löydettävä ratkaisu, sanoo tutkimusjohtaja Henry Tirri.
Avainsanahausta käsitehakuun
Tirrin tutkimusryhmän tavoitteena on kehittää hakukone, joka korvaa avainsanoihin perustuvan haun käsitepohjaisella hakujärjestelmällä. Se kuvaa dokumenttien sisältöä ja etsii avainsanoja ja termejä yläkäsitteiden alle. Tirrin mukaan hakukone ei analysoidessaan tekstiä etsi luonnollisen kielen kaltaisia yhtäläisyyksiä vaan todennäköisyyksiä hakujen perustaksi. Silloin esimerkiksi James Bondia ei käsitellä vain henkilönä vaan piirteenä löytää agenttielokuvia.
Hakujärjestelmä huomioi myös hakuhistorian ja käyttäjäkontekstin, oppii niistä ja luo automaattisesti hakijan henkilökohtaisen profiilin. Hakuja voidaan tehdä paitsi sanoilla, myös pitkillä teksteillä.
- Käsitteisiin perustuva haku tunnistaa käsitteiden lisäksi teeman, tyylin ja synonyymit. Visioissa on, että hakukoneella voitaisiin hakea myös kuvia. Voisin ottaa kamerakännykällä kuvan henkilöstä tai paikasta ja pyytää hakukonetta etsimään Internetistä kaikki kuvat kohteesta, visioi Tirri.
Internetistä malli skaalautuvuudelle
Hakukone toimii skaalautuvasti eli sen pyörittämän tietomassan koko kasvaa vähitellen. Aluksi sitä voidaan käyttää vaikkapa Intranetissä, sitten muutamilla www-sivuilla ja lopulta sillä voi olla mahdollista käsitellä koko Internetin tietomassaa.
Avoimeen lähdekoodiin perustuvan hakukoneen ajatuksena on, että Internetin käyttäjät voisivat itse pitää yllä hakupalvelua. Eri hakupalvelut toimisivat yhteydessä toisiinsa ja tukisivat siten toinen toistaan. Hakukoneen tietomassa voisi kasvaa samalla tavalla kuin Internetin tietomassa kasvaa.
- Esimerkiksi Google preferoi dokumentteja, joihin muissa dokumenteissa viitataan usein. Näin vaikkapa yksityisten ihmisten sivut tai heikot signaalit pääsevät vain harvoin listalle. Myös kaupallisuus vaikuttaa. Oikeusjuttujen pelossa hauista voidaan poistaa esimerkiksi tiettyjä tahoja kritisoivat sivut, kertoo Tirri.
Hakukoneet on suosittu tutkimusalue, mutta samassa muodossa kuin HIIT:n projektissa niitä tutkitaan vain vähän. Tirrin tutkimusryhmä kuuluu alan kolmen tunnetuimman joukkoon. Tirrin mukaan projekti on ensimmäinen niin sanottu big science -projekti, joka on noussut tietojenkäsittelytieteen sisältä. Hän arvelee projektin voivan toimia uusien perustutkimushankkeiden ja sovellusten vauhdittajan samaan tapaan kuin hiukkaskiihdytin fysiikassa.
- Digitodayn tuoreimmat uutiset.
- 25.5. Robottikäsivarsi hinasi Dragonin asemalle
- 25.5. Googlen Android-kauppa sai uusia rahastuskeinoja
- 25.5. Zuckerberg unohti sulhasen ohjeen - antoi 20 000 euron vihkisormuksen
- 25.5. Diablo III:n julkaisija hekumoi myyntiä ja pahoittelee bugeja
- 25.5. Lumialla voi katsella videoklippejä
- 25.5. Applen Cook kieltäytyy optioiden osingoista
- 25.5. ZTE toimittaa suomalaisella 3d-tekniikalla tehtyjä Android-puhelimia
- 25.5. Tämä käkikello muni Pebblen Kickstarter- pesään
- 25.5. Facebook Camera ottaa ja jakaa kuvia iPhonessa
- 24.5. IPhoneen uusi alihankkija
- 24.5. IBM pitää iPhonen Siriä tietoturvariskinä
- 24.5. Yle siirtää seuraavaksi Pasilan teräväpiirtoon
- 24.5. Nokia luopuu isosta massatapahtumasta
- 24.5. Huhu: Symbianiin ei enää päivityksiä
- 24.5. Blackberryn joukot harvenevat
- 24.5. Adoben flash saa saattohoitoa Windows 8:ssa
- 24.5. HP irtisanoo ja palaa taulutietokoneisiin
- 24.5. Motorola Mobilityn johdossa on nyt myyntimies
- 23.5. Oracle hävisi Googlelle taas: Ei patenttirikettä
- 23.5. Apple ja Samsung epäonnistuivat neuvotteluissa
- Uusimmat
- 48h luetuimmat kaikista uutisista.
- 23.5. Nykyinen televisiosi simahtaa vuonna 2026
- 24.5. Huhu: Symbianiin ei enää päivityksiä
- 23.5. Nokia pettyi - halpa-Lumian muisti ei riitä Skypeen
- 23.5. Nokia julkaisi uusia ”luksuskarkkeja”
- 25.5. Zuckerberg unohti sulhasen ohjeen - antoi 20 000 euron vihkisormuksen
- 23.5. Taulukko paljastaa – Nokialla ongelmia superhalvoissa ja huippupuhelimissa Kiinassa
- 23.5. Googlen Larry Page: Facebook pitää käyttäjiä panttivankeina
- 25.5. Lumialla voi katsella videoklippejä
- 23.5. Kodakin ”ilmiselvän” patentointi ei kelpaa
- 23.5. Sony avaa perjantaina Spotify-kilpailijan iPhoneen
- Luetuimmat
- 48h suositelluimmat kaikista uutisista.
- 23.5. Kodakin ”ilmiselvän” patentointi ei kelpaa
- 23.5. Amerikkalaiset kaapelioperaattorit yhdistävät wlan-palvelunsa
- Suositelluimmat
- 48h kommentoiduimmat kaikista uutisista.
- 23.5. Nokia pettyi - halpa-Lumian muisti ei riitä Skypeen
- 23.5. Nykyinen televisiosi simahtaa vuonna 2026
- 24.5. Huhu: Symbianiin ei enää päivityksiä
- 25.5. Lumialla voi katsella videoklippejä
- 23.5. Taulukko paljastaa – Nokialla ongelmia superhalvoissa ja huippupuhelimissa Kiinassa
- 25.5. ZTE toimittaa suomalaisella 3d-tekniikalla tehtyjä Android-puhelimia
- 24.5. IBM pitää iPhonen Siriä tietoturvariskinä
- 25.5. Applen Cook kieltäytyy optioiden osingoista
- 24.5. IPhoneen uusi alihankkija
- 24.5. Nokia luopuu isosta massatapahtumasta
- Kommentoiduimmat
Uutispäivä
Vuorokauden kaikki uutiset yhdellä sivulla.
RSS-feedit
Seuraa Digitodayn kaikkia uutisia tai vain tiettyä osiota RSS:llä.
Uusimmat uutiset
- Googlen Android-kauppa sai uusia rahastuskeinoja 17:09
- Lumialla voi katsella videoklippejä 10:21
- ZTE toimittaa suomalaisella 3d-tekniikalla tehtyjä Android-puhelimia 08:36
- Tämä käkikello muni Pebblen Kickstarter- pesään 08:24
- Facebook Camera ottaa ja jakaa kuvia iPhonessa 07:00
- IPhoneen uusi alihankkija 16:05
- Yle siirtää seuraavaksi Pasilan teräväpiirtoon 14:14
- Nokia luopuu isosta massatapahtumasta 11:15
- Lisää
Poiminnat
Digiyesterday
Viisi vuotta sitten
Tulevaisuuden näyttötekniikka imee energiansa auringosta
26.05.2007 Monen laitteen suurin virtasyöppö on näyttö. Nyt näytöt halutaan valjastaa tuottamaan itse oma energiansa.
Kolme vuotta sitten
Twitteristä kehitetään tv-ohjelma
26.05.2009 Tekstiviestejä käyttävä pikaviestipalvelu kelpaa tv-sarjan rakennusaineiksi.
Taloussanomat
- Suomi löysi taas Nokian älypuhelimet 06:01
- Autonvuokrauksessa hurjat eurohintaerot 06:09
- Haluatko menestyä? Unohda nämä koulun opit 16:35
- Lumia 900:n myynti alkoi: "Näyttää erittäin lupaavalta" 06:03
- IMF-pomo: Olen enemmän huolissani Afrikan lapsista kuin kreikkalaisista 15:54
- Kevään epämukavin pikku-Fiat 06:15
- Oikeus päätti: Tekstarin lähettäjä syytön onnettomuuteen 10:13
- HS: Palkkakuilu levenee kovaa vauhtia 09:43
- Vain yksi pankki lellii asuntovelkaista korkokikkailijaa 06:01
- Taloussanomilta KHO-valitus VM:n vakuuspäätöksestä 12:58
- » Taloussanomat.fi











