Snart snakker du til PCen din - garantert

Talegjenkjenning har vært et tema lenge, men det er først nå PCene er blitt raske nok til å holde følge på en god måte. På CeBIT-messen viser flere leverandører imponerende produkter.

Etter å ha lest et avsnitt fra avisen, dukker teksten opp i tekstbehandleren - helt feilfri. Foto: Torvald KVamme Vis mer
Foto: Erik Andersen Vis mer

1998 var året da det ble mulig å skille ut enkeltord i sammenhengende tale. Dette krever skikkelig datakraft, og det blir først tilgjengelig nå med lanseringen av Pentium III og andre kraftige prosessorer.

Markedet for talegjenkjenning domineres foreløpig av tre store aktører: IBM med programmet Via Voice, Lernout and Hauspie med Voice Xpress og Dragon Systems med programmet Naturally Speaking. Alle disse pakkene håndterer sammenhengende tale.

Prisen er ikke avskrekkende, og alle tre selges for ca. 1.000 kroner inkludert mikrofon. På CeBIT messen viser produsentene hva de har å tilby, og denne skribenten er overbevist om at talgjenkjenning blir et naturlig tilskudd til tastatur og mus. For det er bare snakk om et tilskudd. Mange operasjoner kan jo gjøres uhyre effektivt med tastaturet.

Vanlig småprat er nok

Mange tror at det å snakke med en PC krever at du snakker svært sakte og stakkato. Dette er ikke tilfelle med de nye systemene som ser dagens lys nå. Programmene skjønner til og med sammenhengende ord, så det er ikke lenger nødvendig med en liten pause mellom ordene.

Dragon Systems demonstrerte dette på en svær overbevisende måte. Demonstratøren leste fra en avis i helt vanlig tempo, og det eneste uvanlige i forhold til vanlig opplesing, var at han anga hvor det skulle være komma, punktum og nytt avsnitt. Resultatet i tekstbehandleren var helt perfekt.

Genialt for landeveiens krigere

Dragon Systems viste også frem en løsning med en digital diktafon som kobles direkte med talegjenkjenningsprogrammet. Diktafonen er så liten at den får plass i enhver lomme uten problemer. Når du har lest inn et diktat, kan du bare sette diktafonen i en dokk-stasjon, så fikser programmet konverteringen til redigerbar tekst.

Tenk for eksempel på legene som i dag går rundt med en vanlig diktafon som siden sendes til en skrivestue for avskrift til pasientjournal. Med en slik diktafon kunne opptakene bli konvertert til tekst uten noe mellomledd.

Mange fordeler

Fordelene er ikke så mange hvis utgangspunktet er ren tekstbehandling, og da spesielt redigering. For innlesing av tekst kan det være OK, men ikke for merking og redigering.

Men fordelene er enorme med tanke på styring av PCen på ulike måter. Talegjenkjenning kan gjøre mange vanlige operasjoner mye mer effektive. Tenk deg f.eks. at du sier til PCen: ”Lage en mappe på harddisken som heter prosjekt 2000, og kopier alle Word-dokumentene på disketten til denne katalogen”. Når dette kommer, kan du prøve å konkurrere med bare mus og tastatur. Det er spesielt IBM som jobber med denne typen tilpasninger.

Det blir også lettere å gjøre vanlige oppgaver på PCen på denne måten. Du kan f.eks. si: ”Start diskdefragmentering”, og programmet starter umiddelbart.

Men hva med norsk?

Representanten for Dragon Systems sier at de bruker ca. 2. mill. dollar på en nasjonal tilpasning av basiskoden som trengs for at datamaskinen skal kunne kjenne igjen vanlige tale. Det er derfor klart at det norske markedet er uaktuelt for dette selskapet. For øyeblikket planlegges det en japansk versjon. Den tyske er nettopp ferdig.

Men egentlig burde det være et nasjonalt ansvar å bygge opp et bibliotek av kildekode som produsenter som IBM og Dragon Systems kunne ta i bruk gratis i sine programmer. Talegjenkjenning kommer garantert til de aller fleste PCer siden fordelene er så åpenbare, og da er det viktig å bevare en nasjonal egenart også gjennom den prosessen.