Puhekäyttöliittymiin ja läsnäolevaan tietotekniikkaan liittyviä tutkielmien aiheita

Oheiset aiheet on tarkoitettu ensisijaisesti pro graduiksi. Niistä voidaan räätälöidä myös muiden tutkielmien vaatimuksiin sopivia kokonaisuuksia esim. kandidaatintutkielmia ja seminaaritöitä varten. Monet aiheista liittyvät konstruktiiviseen ihmisen ja tietokoneen välisen vuorovaikutuksen tutkimukseen. Niissä voi olla osana myös empiiristä käyttöliittymätutkimusta. Tutkielmiin tulee aina liittyä myös vahva teoreettinen taustakartoitus.

Tiedustelut: mturunen@cs.uta.fi.

  1. Puhesovellusten käytettävyyden tutkiminen. Puhesovellusten käytettävyyven tutkimukseen liittyy useita erikoispiirteitä. Työ voidaan suunnata erilaisiin menetelmiin (esim. PARADISE, SERVQUAL). Työhön voi sisältyä olemassaolevan puhesovelluksen empiirinen tutkimus.
  2. Wizard Of Oz evaluointimenetelmänä. WoZ - tutkimukset ovat paljon käytetty menetelmä puhesovellusten yhteydessä. Perusideana on, että tietokoneen osuutta simuloidaan. Tähän liittyy paljon kiinnostavia näkökohtia mm. prosessin, työvälineiden ja tulosten yleistettävyyden kannalta. Aiheesta voidaan räätälöidä teoreettisia, sovelluslähtöisiä ja empiirisiä  tutkmiuksia,  esim. WoZ-apuvälineiden kehitystä ja kehitteillä olevien sovellusten empiirisiä  tutkimuksia.
  3. Puhujan tunnistus käyttöliittymässä. Puhujan tunnistamisella tarkoitetaan joko puhujan identifiointia tai verifiointia. Molemmilla menetelmillä on lukuisia sovelluskohteita puhekäyttöliittymissä. Tutkielman aihe voi olla teoreettinen tai sisältää konstruktiivisen/empiirisen osuuden.
  4. Prosodia puhekäyttöliittymässä. Äänen prosodisten ominaisuuksien (äänen korkeus, voimakkuus, rytmi jne.) hyödyntäminen puhesynteesissä tai -tunnistuksessa.
  5. Puhetulosteiden tehokas hyödyntäminen. Puhesynteesiin liittyy monia mielenkiintoisia tutkimuskohteita. Näitä ovat esimerkiksi synteettisen puheen miellyttävyyden/ymmärrettävyyden tutkiminen ja rakenteisten kokonaisuuksien (esim. taulukot) tehokas esittäminen.
  6. Ei-puheäänten hyödyntäminen sovelluksissa. Erilaisia äänielementtejä (earcons, auditory icons, musiikki) voidaan hyödyntää puhesovelluksissa monipuolisesti esimerkiksi ilmaisemaan rakennetta puheen yhteydessä tai tarjoamaan kontekstitietoutta läsnäolevan tietotekniikan (ubiquitous computing) sovelluksissa.
  7. Puhe ja virtuaalimaailmat. Puhe on soveltuva myös virtuaalimaailmassa tapahtuvaan vuorovaikutukseen useilla tasoilla.
  8. Puhe mobiililaitteissa. Puhe on erityisen käyttökelpoinen kommunikointimuoto pienissä, mukana kulkevissa laitteissa kuten PDA-laitteissa ja matkapuhelimissa. Aihetta voidaan tutkia erilaisista näkökulmista.
  9. Puhe läsnäolevan tietotekniikan sovelluksissa. Yksi puhetutkimuksen uusista suuntauksista koskee puheen hyödyntämistä läsnäolevan tietotekniikan (ubiquitous computing) sovelluksissa.
  10. Dialoginhallinta puhesovelluksissa. Dialoginhallintaa on tutkittu paljon erilaisissa teksti, puhe- ja multimodaalisissa järjestelmissä. Mielenkiintoisia aihealueita ovat mm. dialogijärjestelmien tekniseen toteutukseen liittyvät kysymykset ja erilaisten dialogistrategioiden (aloite käyttäjällä, aloite järjestelmällä) vertailu empiirisesti.
  11. Puhepohjaiset agentit. Puhetta hyödyntäviä agentteja käytetään usein multimodaalisissa järjestelmissä. Agentteihin liittyy useita sekä käytettävyyteen että ohjelmistoteknisiä kysymyksiä käsitteleviä aiheita.
  12. Fiktiiviset elementit puhetulosteissa. Puhepohjainen kommunikaatio tuo aina mukaan nk. fiktiivisiä elementtejä (keskustelun osallistujat, heidän persoonallisuutensa jne.). Näin sanavalinnoilla (esim. puhuttelumuodot jne.) voi olla merkittävä vaikutus käyttöliittymään.
  13. VoiceXML & SALT. VoiceXML ja SALT ovat yritysiä luoda de facto standardeja puhesovelluksiin. Molemmat ovat saaneet suurta huomiota osakseen. Tutkielma voisi käsitellä näitä merkintäkieliä yleisesti, niiden soveltuvuutta eri sovelluksiin sekä käsittää konstruktiivisen osion, jossa rakennetaan sovellus merkintäkieliä käyttäen.
  14. HTML dokumenttien lukeminen. Kuinka HTML-dokumentit voidaan lukea tehokkaasti synteesiä käyttäen? Tutkielmaan voi liittyä konstruktiivinen tai empiirinen osuus ja se voidaan laajentaa käsittämään myös puheohjaus lukemisen ohjaukseen.
  15. Käyttäjän mallintaminen. Puhekäyttöliittymissä järjestelmän sopeutuminen käyttäjään on erityisen tärkeää. Jotta järjestelmä voi adaptoitua käyttäjään, tulee sillä olla malli käyttäjästä. Puheen luonne asettaa yleiselle käyttäjän mallinnukselle omat vaatimuksensa.
  16. Puheen käyttö viihdesovelluksissa. Puhetta käytetään tietokoneohjelmista ehkäpä eniten peleissä - miltei kaikki nykyaikaiset pelit sisältävät puhetulosteita. Useimmiten puhe on valmiiksi nauhoitettua, mutta joissakin peleissä on käytetty myös synteettistä puhetta. On myös olemassa näkövammaisille käyttäjille suunnnattuja puheeseen ja (tila)ääneen pohjautuvia pelejä. Myös puheentunnistusta on kokeiltu joissakin peleissä. Tutkielman aiheena on kartoittaa puheen käyttöä erilaisissa viihdesovelluksissa, joita voi olla pelien lisäksi esim. läsnäolevan tietotekniikan sovellukset.
  17. Multimodaalisuus puhejärjestelmissä. Multimodaalisuus on saanut runsaasti huomiota puhejärjestelmissä. Aiheeseen liittyy kuitenkin paljon tutkimattomia näkökohtia. Työ voidaan suunnata johonkin multimodaalisuuden erityiskysymykseen.