Projektin taustaa

Pysäkkimies perustuu Speech-based and Pervasive Interaction-ryhmässä kehitettyyn Jaspis -puhekäyttöliittymäarkkitehtuuriin ja Tampereen kaupungin liikennelaitoksen informaatiojärjestelmiin.

Pysäkkimies-järjestelmän äänenä toimii Timehouse-nimisen suomalaisen yrityksen Mikropuhe-puhesynteesi (versiot 4 ja 5). Puheentunnistimen on toimittanut suomalainen Lingsoft.

Pysäkkimies-hankkeen toteutus alkoi Henkilöliikenteen info-ohjelmassa (Heili) vuonna 2003. Tämä versio tunnisti pysäkkien numeroita. Sen jälkeen järjestelmää on kehitetty eteenpäin Puheteknologian uudet menetelmät ja sovellukset (PUMS) -projektissa, jolloin toiminnallisuuteen on lisätty mm. pysäkkien nimien tunnistaminen. Lisäksi PUMSissa on kehitetään järjestelmästä PDA-alustalla ja älypuhelimella toimivat versiot sekä tutkitaan järjestelmän skaalautuvuutta Helsingin ja Kouvolan liikenteeseen.

Puheentunnistuksesta lyhyesti

Puheentunnistus toimii siten, että ennalta määritellään kielimalli eli ne sanat, joita järjestelmän täytyy tunnistaa. Kun puheentunnistimelle annetaan ääninäyte, tunnistin yrittää sovittaa sitä kielimalliin. Käyttäjän puhunnosta siis sovitetaan aina annettuun kielimalliin ja tuloksena on, että puhunnos tunnistetaan joksikin sanastossa olevaksi sanaksi tai sanonnaksi, vaikka puhunnos sisältäisikin sanaston ulkopuolisia sanoja. Puheentunnistus ei siis ole täysin virheetöntä. Pääsääntönä on, että mitä enemmän sanoja kielimalli sisältää, sitä epävarmempaa tunnistus on. Pysäkkimiehen tapauksessa kielimallia vaihdetaan tilanteen mukaan. Esimerkiksi pysäkin nimeä annettaessa tunnistettavana on noin 900 sanaa, päivän valinnassa hieman yli 10.

Tampereen yliopisto Tietojenkäsittelytieteiden laitos Tampere Unit for Computer Human Interaction Group
Tampereen yliopisto Tietojenkäsittelytieteiden laitos TAUCHI - Tampere Unit for Computer-Human Interaction