World Wide Web Consortium publicerar VoiceXML 2.0 och Speech Recognition Grammar som W3C Recommendations

Kritiska delar av W3C:s ramverk f�r talstyrda gr�nssnitt har nu blivit f�rdiga

Kontaktpunkt Amerika, Australien --: Janet Daly, <janet@w3.org>, +1.617.253.5884 eller +1.617.253.2613
Kontaktpunkt Europa --: Marie-Claire Forgue, <mcf@w3.org>, +33.492.38.75.94
Kontaktpunkt Asien --: Yasuyuki Hirakawa <yasuyuki@w3.org>, +81.466.49.1170

http://www.w3.org/ -- 16:e Mars 2004 -- I sitt arbete mot den talande webben har nu World Wide Web Consortium (W3C) publicerat VoiceXML 2.0 och Speech Recognition Grammar Specification (SRGS) som W3C Recommendations. M�ls�ttningen med VoiceXML 2.0 �r att f�rena f�rdelarna med webb-baserad utveckling och inneh�llsleverans med talstyrda interaktiva till�mpningar. SRGS �r en nyckelkomponent i VoiceXML:s st�d f�r taligenk�nning, och anv�nds av utvecklare f�r att beskriva slutanv�ndarnas svar p� talade fr�gor.

I och med dagens offentligg�rande har nu de tv� f�rsta specifikationerna i W3C:s ramverk f�r talstyrning f�tt status Recommendation. Med de n�rmare tv� miljarder sladd- och mobiltelefoner som finns i v�rlden, s� blir det nu m�jligt f�r ett enormt antal anv�ndare att anv�nda telefonen f�r att interagera med l�mpligt utformade webb-till�mpningar, via knappsatser, talade kommandon samt att ta emot inspelat tal, syntetiskt tal och musik.

"En viktig milstolpe i konvergensen mellan telefoniteknologi och webbteknologi har nu n�tts, i och med att VoiceXML 2.0 och SRGS nu f�rdigst�llts. I det historiskt perspektivet har vi sett b�de tekniska och kulturella klyftor mellan talbaserade systems utveckling och Internets/webbens utveckling, n�got som gjort att information som �r tillg�nglig i den ena teknologin �r om�jligt att n� fr�n den andra," f�rklarar Tim Berners-Lee, W3C:s ledare. "I och med utvecklingen av W3C:s ramverk f�r talstyrda gr�nssnitt, som bl.a. inneh�ller VoiceXML 2.0 och SRGS, s� kan vi nu integrera, och dra nytta av, styrkan hos dessa b�da sektorer -- � ena sidan kraftfullheten hos och effekterna av industriell forskning och bred produkttestning och drifttagande, och � andra sidan �ppenheten hos och utbyggbarheten av de tekniska l�sningar som �r konsistenta med webbens tekniska principer och �r skalbara."

En World Wide Web Consortium (W3C) Recommendation uppfattas av industrin och av webbanv�ndare som en standard f�r webben. Varje Recommendation �r en stabil specifikation, utvecklad av en arbetsgrupp (Working Group) inom W3C, och granskad av W3C:s medlemmar. Specifikationer i form av Recommendations bidrar till �kad interoperabilitet p� webben, genom att de �r ett uttryck f�r den konsensus som uppn�tts mellan industriella deltagare och andra intressenter i arbetsgruppen.

VoiceXML 2.0 och SRGS skapar grunden f�r W3C:s ramverk f�r talstyrda gr�nssnitt

I W3C:s ramverk f�r talstyrda gr�nssnitt �r det VoiceXML som styr hur till�mpningen interagerar med anv�ndaren, medan Speech Synthesis Markup Language (SSML) anv�nds f�r talad utmatning, och Speech Recognition Grammar Specification (SRGS) f�r att styra taligenk�nnare m.h.a. grammatiker som beskriver vad anv�ndaren f�rv�ntas s�ga. I ramverket ing�r �ven Voice Browser Call Control (CCXML), som erbjuder st�d f�r telefonuppringning via VoiceXML och andra dialoghanterare, liksom Semantic Interpretation for Speech Recognition, som definierar hur talgrammatiker knytes till till�mpningar.

VoiceXML 2.0 st�der tal och interaktivitet i W3C:s ramverk f�r talstyrda gr�nssnitt

Med VoiceXML 2.0 kan utvecklare skapa dialoger i talform, som inneh�ller syntetiserat tal, digitaliserat ljud, igenk�nning av talad inmatning, av inmatning via knappsats, inspelning av tal, telefoni och flexibla dialogstrukturer. Inneh�ll uttryckt som VoiceXML laddas ner fr�n HTTP-servrar, p� samma s�tt som HTML. Detta betyder att utvecklare av till�mpningar kan dra full nytta av brett tillg�ngliga och bepr�vade webbteknologier.

"VoiceXML 2.0 kan f�r�ndra s�ttet att utveckla telefonibaserade informations- och kundtj�nster. Vi beh�ver inte l�ngre trycka 'etta' f�r att v�lja det ena och 'tv�a' f�r att v�lja det andra. Ist�llet kan vi g�ra val och ge information genom tal," s�ger Dave Raggett, ledare av W3C:s arbete med Voice Browser. "Dessutom g�r VoiceXML 2.0 det m�jligt f�r anv�ndare med synfel att anv�nda webben, och likaledes de som beh�ver anv�nda webben n�r deras h�nder och �gon �r upptagna med annat, s�som att f� v�gledning n�r man k�r bil."

SRGS ger stabilt st�d f�r igenk�nning av talad inmatning

I grammatiken f�r taligenk�nning, Speech Recognition Grammar Specification - SRGS, kan till�mpningar specificera de ord och fraser som anv�ndare ger som svar p� fr�gor. D�rmed uppn�r man robust, talaroberoende, taligenk�nning.

SRGS st�der s�v�l talad inmatning som inmatning med knappsats. Det �r viktigt att kunna mata in kommandon och svar med hj�lp av knappsaster, speciellt i milj�er med mycket st�rande ljud eller d�r omgivningen av andra sk�l g�r det ol�mpligt att uttrycka sig med tal. Taligenk�nnare kan i allm�nhet ge information om hur s�kra de �r p� att de uppfattat ord eller fraser korrekt, och kan ge en lista, ordnad efter sannolikhet, �ver de de mest troliga tolkningarna av vad anv�ndaren sa.

SRGS kan anv�ndas f�r mer �n talad information, och har �ven med lyckat resultat anv�nts f�r ingenk�nning av handskriven text i situationer d�r anv�ndaren f�r anv�nda en begr�nsad m�ngd ord.

VoiceXML 2.0 och SRGS har redan brett industrist�d

F�r att en specifikation skall bli Recommendation m�ste det finnas ett flertal oberoende men interoperabla implementationer av specifikationen -- dvs specifikationen m�ste bevisbart fungera. F�r VoiceXML 2.0 finns rej�la bevis av implementerbarhet -- �tminstone �tta implementationer f�religger i antingen prototypform eller som produkter p� marknaden. En fullst�ndig f�rteckning �ver implementat�rer finns tillg�nglig. Implementeringsrapporten f�r SRGS beskriver �tminstone sex fullst�ndiga och oberoende implementationer.

En omfattande offentlig testsvit finns tillg�nglig. Dess f�rsta version inneh�ll 300 tester, men nu inneh�ller den mer �n 600 olika tester. Ut�ver denna testsvit finns dessutom sedan tidigare en testsvit f�r Speech Recognition Grammar Specification och en testsvit f�r Speech Synthesis Markup Language, vilken blev W3C Candidate Recommendations i december 2003. Testsviter f�r de �terst�ende specifikationerna i W3C:s ramverk f�r talstyrda gr�nssnitt, t.ex. Semantic Interpretation for Speech Recognition och CCXML, h�ller p� att tas fram av W3C:s arbetsgrupp f�r Voice Browser, och de kommer att publiceras under de n�rmaste m�naderna.

Ut�ver fortsatt arbete med ramverket f�r talstyrda gr�nssnitt h�ller arbetsgruppen f�r Voice Browser p� att identifiera krav p� n�sta version av spr�ket f�r tal-orienterad uppm�rkning. Det kommer att bygga vidare p� VoiceXML 2.0 och inkorporera ideer fr�n SALT, XHTML+Voice och andra f�rslag som W3C:s medlemmar bidrar med.

Arbetsgruppen f�r Voice browser �r en av de st�rsta och mest aktiva arbetsgrupperna i W3C. Balnd dess deltagare �terfinns: Aspect Communications, BeVocal, Canon, Comverse Technology, Convedia, ERCIM, France Telecom, HeyAnita, Hitachi, HP, IBM, Intel, IWA-HWG, Loquendo, Microsoft, MITRE, Mitsubishi Electric, Motorola, Nuance Communications, Openstream, SAP, Scansoft, Siemens, Snowshore Networks, Sun Microsystems, Telera, Tellme Networks, Verscape, Vocalocity, VoiceGenie Technologies, Voxeo, och Voxpilot.

Om World Wide Web Consortium [W3C]

W3C skapades f�r att leda webben till sin fulla potential, genom att utveckla gemensamma protokoll som bidrar till webbens utveckling och s�krar dess interoperabilitet. W3C �r ett internationellt industri-konsortium som drivs gemensamt av Computer Science and Artificial Intelligence Laboratory (MIT CSAIL) i USA, European Research Consortium for Informatics and Mathematics (ERCIM) med h�gkvarter i Frankrike, och Keio University i Japan. Bland de tj�nster som konsortiet erbjuder finns t.ex. databaser med information om webben, riktat till s�v�l utvecklare som anv�ndare, och olika prototyper och exempeltill�mpningar, som demonstrerar anv�ndandet av ny teknologi. Idag �r n�rmare 400 organisationer medlemmar i konsortiet. Mer information finns p� http://www.w3.org/