OpenVXI提供的是完整的VXML解析服务,同时也提供了有限语言的TTS支持。
VoiceeXtensibleMarkupLanguage(简称VXML)是被用来创建语音对话系统,可以调用语音合成以及语音识别服务,可以用来记录语音录入和连接电话系统。创建VXML语音的主要目的就是用Web开发的理念来开发交互式的语音应用。VXML提供了基于Menu和基于Form的两套框架,整合了语音识别和语音合成两个关键服务,使得语音应用的开发变得更为方便和快捷。
VXML和普通的标记语言一样,需要有浏览器进行解析;还需要提供语音识别和语音合成服务的应用服务器;有时也需要有http服务器提供文档服务;当然,如果需要与电话系统相连,就必须加上VOIP(网络电话)的支持。如下图所示的就是VXML的运行环境:
图1.VXML运行环境
一个企业级应用的系统框架
IVR(interactivevoice-responseservices)也就是自动应答服务,是使用VXML的典型企业级应用。IVR和使用者通过电话,按键(DTMF)互动,如语音订票,语音查询,语音投票等。普通的IVR都是支持VXML的解析和提供了sip协议的支持,通过和ASR(语音识别)应用服务器以及TTS(语音合成)应用服务器的集成,可以实现几乎所有的VXML封装的操作。
企业级的VXML应用需要如下的体系结构,以使用IBMVoiceServer(WVS)为例:
图2.一个VXML具体应用的例子
上图中的IVR事实上就是VXML解析器,通过解析VXML,分发相应的工作给WVS,实现VXML封装的语音识别和语音合成的功能。
评论