Puhekäyttöliittymiin ja läsnäolevaan tietotekniikkaan liittyviä tutkielmien aiheita
Oheiset aiheet on tarkoitettu ensisijaisesti pro graduiksi. Niistä
voidaan räätälöidä myös muiden tutkielmien vaatimuksiin sopivia kokonaisuuksia esim.
kandidaatintutkielmia ja seminaaritöitä varten.
Monet aiheista liittyvät konstruktiiviseen ihmisen ja
tietokoneen välisen vuorovaikutuksen tutkimukseen.
Niissä voi olla osana myös empiiristä käyttöliittymätutkimusta.
Tutkielmiin tulee aina liittyä myös vahva teoreettinen taustakartoitus.
Tiedustelut: mturunen@cs.uta.fi.
-
Puhesovellusten käytettävyyden tutkiminen.
Puhesovellusten käytettävyyven tutkimukseen liittyy useita erikoispiirteitä.
Työ voidaan suunnata erilaisiin menetelmiin (esim. PARADISE, SERVQUAL).
Työhön voi sisältyä olemassaolevan puhesovelluksen empiirinen tutkimus.
-
Wizard Of Oz evaluointimenetelmänä. WoZ - tutkimukset ovat paljon käytetty
menetelmä puhesovellusten yhteydessä. Perusideana on, että tietokoneen
osuutta simuloidaan. Tähän liittyy paljon kiinnostavia näkökohtia mm.
prosessin, työvälineiden ja tulosten yleistettävyyden kannalta. Aiheesta
voidaan räätälöidä teoreettisia, sovelluslähtöisiä ja
empiirisiä tutkmiuksia, esim. WoZ-apuvälineiden kehitystä ja
kehitteillä olevien sovellusten empiirisiä tutkimuksia.
-
Puhujan tunnistus käyttöliittymässä. Puhujan tunnistamisella tarkoitetaan joko puhujan
identifiointia tai verifiointia. Molemmilla menetelmillä on lukuisia
sovelluskohteita puhekäyttöliittymissä. Tutkielman aihe voi olla
teoreettinen tai sisältää konstruktiivisen/empiirisen osuuden.
-
Prosodia puhekäyttöliittymässä. Äänen prosodisten ominaisuuksien
(äänen korkeus, voimakkuus, rytmi jne.) hyödyntäminen puhesynteesissä
tai -tunnistuksessa.
-
Puhetulosteiden tehokas hyödyntäminen. Puhesynteesiin liittyy monia mielenkiintoisia tutkimuskohteita.
Näitä ovat esimerkiksi synteettisen
puheen miellyttävyyden/ymmärrettävyyden tutkiminen ja rakenteisten
kokonaisuuksien (esim. taulukot) tehokas esittäminen.
-
Ei-puheäänten hyödyntäminen sovelluksissa. Erilaisia
äänielementtejä (earcons, auditory icons, musiikki) voidaan hyödyntää
puhesovelluksissa monipuolisesti esimerkiksi ilmaisemaan rakennetta puheen
yhteydessä tai tarjoamaan kontekstitietoutta läsnäolevan tietotekniikan (ubiquitous
computing) sovelluksissa.
-
Puhe ja virtuaalimaailmat. Puhe on soveltuva myös
virtuaalimaailmassa tapahtuvaan vuorovaikutukseen useilla tasoilla.
-
Puhe mobiililaitteissa. Puhe on erityisen käyttökelpoinen
kommunikointimuoto pienissä, mukana kulkevissa laitteissa kuten
PDA-laitteissa ja matkapuhelimissa. Aihetta voidaan tutkia erilaisista
näkökulmista.
-
Puhe läsnäolevan tietotekniikan sovelluksissa. Yksi puhetutkimuksen
uusista suuntauksista koskee puheen hyödyntämistä läsnäolevan
tietotekniikan (ubiquitous computing) sovelluksissa.
-
Dialoginhallinta puhesovelluksissa. Dialoginhallintaa on tutkittu
paljon erilaisissa teksti, puhe- ja multimodaalisissa järjestelmissä.
Mielenkiintoisia aihealueita ovat mm. dialogijärjestelmien tekniseen
toteutukseen liittyvät kysymykset ja erilaisten dialogistrategioiden
(aloite käyttäjällä, aloite järjestelmällä) vertailu empiirisesti.
-
Puhepohjaiset agentit. Puhetta hyödyntäviä agentteja käytetään
usein multimodaalisissa järjestelmissä. Agentteihin liittyy useita
sekä käytettävyyteen että ohjelmistoteknisiä kysymyksiä käsitteleviä aiheita.
-
Fiktiiviset elementit puhetulosteissa. Puhepohjainen
kommunikaatio tuo aina mukaan nk. fiktiivisiä elementtejä (keskustelun
osallistujat, heidän persoonallisuutensa jne.). Näin sanavalinnoilla
(esim. puhuttelumuodot jne.) voi olla merkittävä vaikutus
käyttöliittymään.
-
VoiceXML & SALT. VoiceXML ja SALT ovat yritysiä luoda de facto standardeja puhesovelluksiin.
Molemmat ovat saaneet suurta huomiota osakseen. Tutkielma voisi käsitellä näitä merkintäkieliä
yleisesti, niiden soveltuvuutta eri sovelluksiin sekä käsittää
konstruktiivisen osion, jossa rakennetaan sovellus merkintäkieliä käyttäen.
-
HTML dokumenttien lukeminen. Kuinka HTML-dokumentit voidaan lukea
tehokkaasti synteesiä käyttäen? Tutkielmaan voi liittyä konstruktiivinen
tai empiirinen osuus ja se voidaan laajentaa käsittämään myös
puheohjaus lukemisen ohjaukseen.
-
Käyttäjän mallintaminen. Puhekäyttöliittymissä järjestelmän
sopeutuminen käyttäjään on erityisen tärkeää. Jotta järjestelmä voi
adaptoitua käyttäjään, tulee sillä olla malli käyttäjästä. Puheen
luonne asettaa yleiselle käyttäjän mallinnukselle omat vaatimuksensa.
-
Puheen käyttö viihdesovelluksissa. Puhetta käytetään tietokoneohjelmista
ehkäpä eniten peleissä - miltei kaikki nykyaikaiset pelit sisältävät
puhetulosteita. Useimmiten puhe on valmiiksi nauhoitettua, mutta
joissakin peleissä on käytetty myös synteettistä puhetta.
On myös olemassa näkövammaisille käyttäjille suunnnattuja
puheeseen ja (tila)ääneen pohjautuvia pelejä.
Myös puheentunnistusta on kokeiltu joissakin peleissä. Tutkielman
aiheena on kartoittaa puheen käyttöä erilaisissa viihdesovelluksissa,
joita voi olla pelien lisäksi esim. läsnäolevan tietotekniikan sovellukset.
-
Multimodaalisuus puhejärjestelmissä. Multimodaalisuus on
saanut runsaasti huomiota puhejärjestelmissä. Aiheeseen liittyy
kuitenkin paljon tutkimattomia näkökohtia. Työ voidaan suunnata
johonkin multimodaalisuuden erityiskysymykseen.