World Wide Web Consortium publicerar VoiceXML 2.0 som W3C Proposed Recommendation

En av h�rnstenarna i W3C:s ramverk f�r talbaserad interaktion �r n�stan f�rdig

Kontaktpunkt Amerika, Australien --: Janet Daly, <janet@w3.org>, +1.617.253.5884 eller +1.617.253.2613
Kontaktpunkt Europa --: Marie-Claire Forgue, <mcf@w3.org>, +33.492.38.75.94
Kontaktpunkt Asien --: Yasuyuki Hirakawa <yasuyuki@w3.org>, +81.466.49.1170

http://www.w3.org/ -- 3:e februari 2004 -- Som ett steg i arbetet mot en talande webb har nu World Wide Web Consortium (W3C) publicerat VoiceXML 2.0 som en W3C Proposed Recommendation. M�let med VoiceXML 2.0 �r att g�ra det m�jligt att utnyttja webbens i interaktiva talstyrda till�mpningar.

Att ett W3C-dokument har f�tt status Proposed Recommendation betyder att arbetsgruppen har g�tt igenom s�v�l granskning inom W3C som offentlig granskning, och att demonstrerbara interoperabla implementationer tagits fram. Status Proposed Recommendation inneb�r att den nu genomg�r slutgiltig granskning innan den blir W3C Recommendation, det som vi vanligen kallar webb-standard.

Mot en talande webb - W3C:s ramverk f�r talstyrning

Alltsedan 1999 har W3C arbetat med ett ramverk f�r tal-baserad interaktion, som ett s�tt att l�ta anv�ndare interagera med hj�lp av tangentbord/knappsatser, styra via tal, och lyssna p� inspelat tal, syntetiskt tal och musik. Eftersom antalet telefoner, fasta s�v�l som mobila, i v�rlden �verstiger en miljard, s� kommer W3C:s ramverk f�r talinteraktion att ge ott ofantligt antal anv�ndare m�jligheter att f� tillg�ng till l�mpligt utformade tj�nster p� webben.

VoiceXML 2.0 ger r�st och interaktivitet till ramverket f�r tal-baserade teknologi.

VoiceXML 2.0 g�r det m�jligt f�r utvecklare att skapa tal-baserade dialoger med syntetiserat tal, digitaliserat ljud, igenk�nning av talade och knappstyrda kommandon, inspelning av tal, telefoni och dialoger av typ "mixed-initiave".

"VoiceXML 2.0 f�r�ndrar s�ttet att utveckla telefonbaserade informations- och andra anv�ndartj�nster. Det �r inte l�ngre beh�vligt att trycka p� knappen 'etta' f�r att f� det ena och trycka knappen 'tv�a' f�r att f� det andra. Ist�llet kan vi g�ra v�ra val genom att tala dem", f�rklarar Dave Raggett, ledare av W3C:s aktivitet f�r Voice Browser. "Dessutom ger VoiceXML 2.0 m�jligheter f�r anv�ndare med synhinder och f�r de som beh�ver anv�nda webben medan deras h�nder och �gon �r upptagna med andra saker, t.ex. f�r att f� hj�lp med v�gval medan man k�r bil".

I W3C:s ramverk f�r talinteraktion styr VoiceXML hur en till�mpning interagerar med en anv�ndare, medan Speech Synthesis Markup Language (SSML) anv�ndes f�r talad inmatning och Speech Recognition Grammar Specification (SRGS) f�r att styra taligenk�nnare m.h.a. grammatiker som beskriver vad anv�ndaren f�rv�ntas uttrycka. Andra specifikationer i ramverket �r t.ex. Voice Browser Call Control (CCXML), som st�der telefonuppringning inom VoiceXML och andra dialogsystem, och Semantic Interpretation for Speech Recognition, som definierar syntax och semantik av uppm�rkningsord i SRGS.

VoiceXML 2.0 har redan brett industrist�d.

F�r att en W3C-specifikation skall f� status Proposed recommendation m�ste det finnas ett flertal oberoende implementationer av denna, dvs det m�ste finnas bevis p� att specifikationen tekniskt fungerar. �tminstone �tta implementationer av VoiceXML 2.0 har utvecklats som prototyper eller fullt fungerande produkter. En fullst�ndig f�rteckning �ver implementationer finns dokumenterad.

Det finns en utf�rlig allm�nt tillg�nglig testsvit. Den f�rsta versionen av denna inneh�ller �ver 300 tester, och m�let f�r den slutliga versionen �r att den skall inneh�lla fler �n 500 tester. Uppdateringar av testsviten annonseras p� Voice Browsers �ppna epostlista.

Dessa tester utg�r ett komplement till testsviten f�r Speech Recognition Grammar Specification, som blev W3C Candidate Recommendation i juni 2002. Testsviter f�r �vriga specifikationer i W3C:s ramverk f�r talbaserad interaktion (bl.a. f�r Speech Synthesis Markup Language) utvecklas av W3C:s arbetsgrupp f�r Voice Browser, och de kommer att publiceras under de n�rmaste m�naderna.

VoiceXML 2.0, ramverk f�r talinteraktion vidareutvecklas, patentfr�gor l�sta.

W3C:s arbetsgrupp f�r Voice Browser �r en av de st�rsta och mest aktiva i W3C. Bland dess deltagare �terfinnes BeVocal Inc., Canon, Comverse, France Telecom, Genesys Telecommunications Laboratories, HP, HeyAnita, Hitachi, IBM, Intel, Loquendo, Microsoft, MITRE, Mitsubishi, Motorola, Nokia, Nortel Networks, Nuance, Philips, PipeBeach, SAP, ScanSoft, SnowShore Networks, SpeechWorks, Sun, Syntellect, Tellme Networks, Unisys, Verascape, Vocalocity; VoiceGenie, Voxeo, och Voxpilot.

Patent-relaterade diskussioner som uppst�tt inom ramen f�r arbetsgruppens avgiftsfria licensieringsmodell har hanterats av W3C:s Patent Advisory Group i enlighet med W3C:s nuvarande policy f�r patent. Som ett resultat av detta har arbetsgruppen f�r Voice Browser kommit �verens om att ta fram en �ppen specifikation, och Voice Browser Patent Advisory Group arbetade fram l�sningar p� �terst�ende problem, vilket gjort det m�jligt att de centrala delarna av specificationen f�r VoiceXML 2.0 kan utnyttjas enligt W3C:s avgiftsfria licens.

Om World Wide Web Consortium [W3C]

W3C skapades f�r att leda webben till sin fulla potential, genom att utveckla gemensamma protokoll som bidrar till webbens utveckling och s�krar dess interoperabilitet. W3C �r ett internationellt industri-konsortium som drivs gemensamt av Computer Science and Artificial Intelligence Laboratory (MIT CSAIL) i USA, European Research Consortium for Informatics and Mathematics (ERCIM) med h�gkvarter i Frankrike, och Keio University i Japan. Bland de tj�nster som konsortiet erbjuder finns t.ex. databaser med information om webben, riktat till s�v�l utvecklare som anv�ndare, och olika prototyper och exempeltill�mpningar, som demonstrerar anv�ndandet av ny teknologi. Idag �r n�rmare 400 organisationer medlemmar i konsortiet. Mer information finns p� http://www.w3.org/