公司首页  公司简介  产品园地  客户留言  软件资料下载  发邮件  订阅邮件  招聘人才

                    语 音 互 联 网 平 台

        1.背景

互联网的飞速发展,为用户提供丰富的服务内容的同时,也给各行各业带来了无限的生机。但是,世界上现在有十亿的电话终端,另外,有超过2亿的移动电话已经销售到世界上,从绝对数量上看,个人计算机的数量还是远远低于电话终端的数量,而且由于接入服务和限制,和个人计算机携带的不方便,所以个人计算机用户很难实享用现随时随刻的网上服务。

另外,就人的自身习惯来看,通过言谈的交流,利用听和说是人们更愿意接受的交流和获取信息的方式。

通过语音门户及短信网关还可以收发手机短信,浏览WAP网站内容。

    语音上网将掀起第三次上网浪潮:

你会说话吗?会说话就能上网。这种简单的语音上网方式, 据说是继PCWAP手机上网之后的第三次上网浪潮。

但在未掌握ASRTTS技术前,这只是人们心中的一个概念、一个梦想。

    在使用先进的ASRTTS技术后,便可以开发一个超级语音平台,使IT业的这个梦想变成真实。

繁忙的人们可以离开PC、离开笔记本,只是随手拨通电话,就可以知道当天发生的国际大事,就可以了解同步的股票行情,还可以知道他乡的天气是否合适旅游……通过电话来上网,以“说话”来代替键盘输入,以“语音控制”来代替键盘控制,实现语音上网一直是人类的梦想。而今天,随着语音技术的发展,特别是语音识别技术的突破,语音上网已经离我们越来越近了。

  语音成为第三种上网方式:

  在PC成为传统的上网方式后,手机或者其他手持终端上网正铺天盖地地吸引着人们的注意力,成为目前最热门的话题。在人们还来不及细细消化理解手机上网时,技术的发展又迫不及待地将语音上网推到人们面前。据了解,在美国语音上网已经成为继PC上网、WAP上网之后的第三次浪潮。

  在PC时代,人们需要掌握一些基本的电脑知识、并且具备相关的有线接口才可登录互联网;在WAP时代,通过随身携带的手机,人们可以随时随地接入互联网,在便利性方面大大提高;在语音上网时代,在提供便利性之外,更大的突破应该是将互联网的门槛降低到“零”。你会说话吗?会说话就能上网,你不再需要掌握一些基本的输入方式,你不再需要熟悉小小的键盘。张嘴说话,就是你给系统给互联网下达的指令。从PCWAPVoice,每一次浪潮都把互联网的门槛降低了一大截。

  语音上网是传统电话与互联网相结合的产物,它应用语音识别技术,只要用户按下电话号码,系统就可识别相关的命令,从而给用户提供网站上的信息,包括股票行情、交通状况与流量、天气情况、电影餐厅订票等服务。它通过在PSTN与互联网之间放置中文语音网网关,来实现语音识别和语音合成等,最终对用户实现语音上网。

  以“说话”来控制的电话自动信息系统是银行、电信、证券、运输等行业提高服务质量、增强竞争能力、节省时间的有力武器。语音识别技术在美国已有很长历史,但应用方面基本上是以英文为主,语音互联网在国外已经开始应用。近年来,随着CTI技术的发展,我国香港、台湾及内地等许多CTI领域里的开发商开始致力于中文的语音识别。随着中文语音识别技术发展,语音互联网的概念开始在亚洲逐步成形,并正在逐成为现实。在语音互联网中,用户可以通过电话实现计算机上网的功能。在亚洲,由于Internet的普及程度较低,而无线通信发展却非常快,用语音作为界面来获取信息将极具前途。

  语音互联网和目前我们所使用的文字互联网一样,也涉及网站、上网终端、线路等诸多内容。但不同的是,语音互联网的终端就是电话,线路就是我们天天用的电话网,这也是语音互联网概念一推出就激起千层浪的原因,实现起来似乎太容易了。

  语音门户浮出水面:

  伴随着语音上网概念的出现,作为提供信息服务的语音门户也浮出水面。在目前国内的一些语音上网应用中,主要提供语音电子邮件,用户可以通过电话来收取并且接听自己的电子邮件,同时也可通过说话来发送电子邮件。而在另一个由亚洲语音提供的语音上网服务实验中,北京的用户可以在注册后通过拨号享受语音邮件、个人信息定制、股票行情、生活速递、旅游热线等服务。那如何来定位语音上网用户的信息服务呢?它与手机等手持终端上网的定位是否相差不大呢?

   亚洲在线的总裁廖杰远先生认为,在这两者之间还是有一些差别的。对于语音上网来说,信息服务更加强调与用户的息息相关性。基本上可以分为三类应用:首先,电子邮件是最重要的一项应用。这样,人们在外时,可以抛却无线信道的种种不足之处,仅仅通过PSTN网来进行收发电子邮件。其次,人们可通过语音上网来获取一些实用信息,如交通路况、股票行情等。最后,语音上网的第三大用途是获取个人信息,如地址簿、日程安排等。

   语音门户应该说也是一个很有吸引力的市场,一些新成立的公司跃跃欲试,而一些老牌的ICP为了保持自己的传统优势,自然也不会将这块肥肉让给他人,他们可以在做传统文字网站的同时,开设语音门户来吸引更多的人用电话上网,促进电子商务的发展。已有ICP开始瞄准语音门户,像北京郊区电信局下属的畅捷网苑就非常看好电话上网。那语音门户会不会比它的前辈们幸运一点,可以赚到钱呢?这还是个未知数,但业内人士依然将目光放在了广告身上。也许会由于电话这种沟通方式的不同,语音门户在创收方面会有所作为。

  目前,Intel已经开始投资发展语音识别技术,Intel在中国建立的研究中心的一个重要项目就是语音识别。来自我国台湾地区的言丰科技所开发的Voice Touch交谈式语音识别电话系统已经可以识别英语、普通话和广东话三种语言,而同时国外公司如IBML&H,国内公司如捷通等也都在开展相关的研究。

  语音控制挑战传统键盘输入:

  语音上网是作为计算机上网、手机上网方式的一种补充,而不是竞争关系。在用户没法使用手机或计算机时,就可以用电话来进行语音上网。

  语音互联网作为计算机上网的有效的补充手段,是一个新兴的领域,也是一个非常让人看好的领域。

        提供语音门户服务:

  Qwest通信国际公司已经开始向移动电话用户提供一种新的语音互联网服务——Qwest语音浏览。

  Qwest通信国际公司新推出的这项语音驱动互联网浏览服务,可以向美国西部和中西部8个州的消费者和小型企业提供个人化的时事新闻,体育报道,交通状况,航班信息,股票报价和天气预报。

  Qwest无线集团的总裁彼得·马莱迪说:“‘Qwest语音浏览’不仅允许用户对互联网说话,还允许互联网通过移动电话回话。用户不需要电脑,他们只需简单地用语音询问所需的信息,‘Qwest语音浏览’将在几秒钟内用语音进行回答。”

  “Qwest语音浏览”服务由Qwest通信国际公司和BeVocal公司合作开发。Qwest通信国际公司拥有的光纤网络可以接触到2900万消费者,而BeVocal公司则是一家语音软件,应用程序和服务的开发商。

  为了推广“Qwest语音浏览”服务,从现在到20011月份,Qwest通信国际公司将不向现有用户和新用户收取每月4.95美元的服务费。

        无线语音互联网,AOL先走一步:

        美国在线于日前买下语音浏览软件开发公司Quack.com,并获得该公司语音浏览技术(Voice-browsing),该技术可以让用户只须通过固定电话或手机,通过简单的语音指令搜索网站上的天气、股市、电影和运动等信息,美国在线计划只提供其较受欢迎的网站信息。

      美国在线交互业务部负责人Ted Leonsis表示,获得语音入口技术将是该公司向AOL Anywhere迈进的重要一步,而Quack.com的技术则可帮助美国在线进入非PC领域,估计该语音浏览技术将改变网站内容的结构,并有望成为电子商务的一个新的工具。

      此外美国在线还在向语音识别公司Speechworks International投资,该公司正与ATT合作开发语言识别技术。目前美国在线约有2,300万用户,在取得Quack.com技术后,该公司有望获得更多的用户。

语音互联网使用新标准新技术:

语音互联网利用先进的CTIComputer Telephone Integrated)技术以及开放的VoiceXML工业标准,成为一种新型的网上应用。类似与数据终端(PCPDAWAP Mobile)上网,语音互联网的实现过程中,也是把接入和内容进行了分离,用户拨打一个接入号码(比如是168163)接入到互联网上,但是,提供内容服务的却可以是其他任何一个具体的内容提供商(ICP)。这是对传统声讯服务来说是一个重大的改革,因为接入和内容提供的分离,声讯行业变成是一个开放式的行业,所有传统的ICP都可以按照VoiceXML的标准为声讯提供内容服务,而丰富多样的内容又必然会刺激用户的增加以及服务需求的增长。这些新的技术对于传统Cellcenter也将是一个挑战,它可以由客户自己根据需求更改服务流程,而且流程是标准化的,可以从网上或别处继承下来。最新技术ASRTTS的使用,使得人与机器的交互更接近人与人之间的交互习惯,即用口说、用耳朵听。

语音互联网的实现机理

对于电话之所以能够畅游互联网,"阅读"网上的信息,"点击"网上的连接,是因为电话平台增加了对网上资源进行解释的一个服务模块、对人说话进行识别及对文本内容进行语音合成的模块。为了使大家有一个通用的语音流程描述语言及尽可能的降低互联网上服务器与电话平台之间的通讯量,所以万维网协会(World Wide Web ConsortiumW3C)采用了VoiceXMLVoice Extensible Markup Language)规范1.0版(VoiceXML 1.0)作为工业标准。 VoiceXML为语音和电话应用的开发者、服务提供商和设备制造商提供了一个智能化的APIVoiceXML的标准化将简化Web上具有语音响应服务的个性化界面的创建,使人们能够通过语音和电话访问网站上的信息和服务,像今天通过CGI脚本一样检索中心数据库,访问企业内部网,制造新的语音访问设备。 作为一种标记语言,VoiceXML要能够做到:

1.通过每一文件里指定的多重的交互作用,最小化客户机/服务器之间的交互工作。

2.实现应用开发者与低层的软件和系统平台上的软、硬件细节无关。

3.将用户交互作用的代码(在VoiceXML中)从服务逻辑(CGI 脚本)中分离出来。

4.要使提供的服务能随处可得,要求这些服务能够跨越不同的执行平台。对于内容服务商、工具提供商和平台提供商来说,VoiceXML是一个公共语言。

5.使简单的交互作用非常易于使用,要求所提供的语音界面能支持复杂的对话。

一次服务的过程为:

1 由解释器等待电话用户的接入,如果有电话连接到Vxml文档服务中,平台就会通知解释器,并将相关信息通知解释器;

2 解释器启动解释器核心,解释器核心向文档服务器获取Vxml文档;

3 解释器核心解释文档语义,根据语义和用户发生交互,其中包括通过平台向用户播放语音文件或者播放文本合成语音,获得用户的按键输入或者语音输入;

4 文档结束,解释器核心结束工作。  

     

语音平台采用3W认可的最新语音流程语言——VOICEXML,不但实现了语音流程的个性化,还可以通过简单地编写VOICEXML流程,轻而易举地生成各种各样的语音应用系统,实现平台与业务的分离。如Voice Browser短信信息点播系统股票委托交易个性化定制服务Voice Portal语音电子邮件自动及人工声讯台和各种行业的CallCenter 系统等。

有了VoiceXML作为语音流程语言,就使大家的语音系统(包括语音互联网入口、Internet Callcenter、客户服务中心、声讯系统等)有了一个共同的流程编写标准,并且是与平台无关的,可以相互移植、共享,使多种应用可以共用一个平台。应用现有互联网的技术,可以使不同的被叫号码或主叫号码启用不同的语音流程主页文件,实现个性化服务及类似Internet中虚拟主机、个人主页等的功能。

语音系统与Internet系统的连接,使得我们的语音系统可以方便的将我们的讲话转换成压缩的语音文件,作为Email附件的形式发送到指定的电子邮箱中。同样,我们的语音系统也可以方便的将我们的传真转换成压缩的图像文件,作为Email附件的形式发送到指定的电子邮箱中。反过来,通过Email传送的普通EmailVoice EmaiFax也可以通过电话直接读给人听或直接送到传真机上。

      2. 系统概述 

      2.1.1 系统目的和设计目标

VOICE2001平台能够满足如下的总体要求:

1、强大的伸缩性。系统规模可大可小,平滑过渡,以满足不同行业、不同用户的投资需求。

2、良好的稳定性。稳定性对一个系统来说是非常重要的,系统面世之前,各模块都经过严格调试,具有非常好的稳定性。

3、使用国际标准的VoiceXML做业务描述语言,使业务描述与平台无关,可以由用户自己编写,或利用网上大量的免费VXML文件。

4提供多种接口:应用平台一方面提供与电信网移动网的接口,另一方面要提供与Internet/Intranet的接口,提供与Message Application Service Platform的接口,还要提供其他的联网方式与其他的应用系统如短信、证劵、银行、邮政应用、寻呼等的互连接口。

5、综合的业务功能。VOICE2001 平台能覆盖现有平台的绝大部分功能,包括Cellcenter、增值声讯业务、电信运维各特服业务以及客户服务中心业务等等。各业务相对独立,要方便叠加。当然,从开发周期的分工来看,近期目标和远期目标的范围要有不同,上述的业务功能可分期实现。

6、强大的维护管理功能。原则是维护简便、手段齐全。要充分考虑到用户技术水平可能存在的巨大差异。对一般用户而言,它是一套傻瓜平台,而对于有较高技术水平的用户来说,它却又是可以灵活配置,方便修改的平台。

 

   VOICE2001的设计部分目标包括:

1)    具有智能排队的接入功能,可以根据业务条件进行话务的分配。VOICE2001系统平台透过高带宽的SC语音总线实现资源交换,容量伸缩性强。

2)    提供自动语音、自动传真、语音电子邮件、传真电子邮件的服务,提供二次开发系统。

3)   用户话机通过设置可以是一个普通的电话话机也可以是人工座席,座席上采用的技术为浏览器的技术,可以实现公告信息版、业务向导等功能,并由计算机座席可以控制话机呼叫处理,随着业务的发展,增加相应的软件构件便可以实现目标功能。

4)    电话会议。如用户请求召开会议电话,则由话务员根据用户要求(与会人数)申请会议资源,在用户指定的时间内一一呼通参加会议的成员,形成一个多方通话会议室。

5)    采用开放的分布式数据库,可以实现系统数据的存贮(包括有配置、信息、话单、用户资料等),对数据库的访问可以实现检索或全文检索的功能。

6)    可以实现呼出排队的管理,可以设置自动呼出服务,应用于提醒通知、电话广告、电话调查、电话催交等服务。

7)    在某些重要的服务中,可以提供全程录音的功能,还可以对话务员进行状态监视、监听、服务质量统计、计费等功能。

8)    能够实现邮件的处理系统,为话务员与管理人员、台内人员与用户之间的邮件交流,包括有传真、信函、E-mail等功能。

9)    与外界实现信息互通,包括有语音(传真)传统访问外界数据、人工座席访问外界数据、数据访问的实现专业系统网关完成。

10)       在计费方面,实现ACDIVR/IFR、座席上各业务的统一计费。

11)       维护管理系统有统一的管理安装,不单单硬件设备可以被管理,而且系统中各软件模块也可以被管理。

总之,我们开发的VOICE2001平台是对过去别人各代平台的精华的汇总、它除了继承先前平台的许多突出优点之外,还要衍生出一些新的特性,是一个Internet化、与SMSWAP连接、采用最新技术:(TTSASR)、容量伸缩性大、数据处理能力强、功能齐全、服务手段丰富的综合业务平台。

 

 

 

 

 

 

 

 

 

 

 

2.1.2系统应用

 

2.2 系统总体描述

2.2.1 VOICE2001 Architectural Model

2.2.1.1 Voice Browser

    Voice Browser 解析用Voice XML 语言编写的语音网页文件,而语音网页文件是用来描述语音流程的。它是整个系统的关键。

2.2.1.2 SMS GATEWAY

     SMS GATEWAY与移动局的短信接口和语音系统连接,使系统具有手机短信收发功能。

2.2.1.3 WAP GATEWAY

     WAP GATEWAY用以获取WAP网站的内容,使系统具有浏览WAP网站的功能。

2.2.1.4 IVR/IFR交互式语音/传真响应

交互式语音/传真响应主要负责完成业务流程解释、管理、业务呼叫的处理,提供语音播放,TTS合成,ASRDTMF的接收和发送,传真的接收和发送,EMAIL的接收和发送,信息平台的访问和业务话单的产生,电话会议等。在VOICE2001平台中,每个IVR可支持8E1(240)接入,同时IVR之间通过Scxbus 互联,可以达到资源共享,通过Internet实现信息共享。

IVR内还可以提供以下功能模块:

    软件ACDAutomatic Call Distributed):

ACD部分主要实现用户呼叫处理、入出排队、路由控制、中继合群分群、呼出回复、呼叫转移、呼叫等待等功能。

2.2.1.5 Database Server数据库服务器

完成内部服务数据功能,实现对局数据、话务员数据、用户信息数据、信息数据、话单数据、统计数据的存贮。

2.2.1.6 File Server文件服务器

存放由IVR要播放的语音文件、录音文件或文本文件,存放IFR发送的传真文件和接收到的传真文件。语音文件、录音文件可以是WAVVOXMP3格式,如为MP3格式,则在播放前须先转换成WAVVOX格式。传真文件可以是TIFFJPG格式,发送传真时如传真文件格式为JPG则须先转换成TIFF格式。可以考虑建立常用文件缓冲区,将转换过的文件在此保留一定时间,超过一定时间不用时,将该文件删除。当需要文件转化操作时,先在文件缓冲区查询有无比原文件更新的转换过的文件,如有则立即取用,无须再转换;如无则立即进行转换,并保留在缓冲区中,直到过期删除。

2.2.1.7 CT Server

当有话路接入时,ACD将接入信息转交给CT Server,由CT Server负责通知后台的业务应用服务器,以实现语音与数据的同步。

1 CT Server能够管理多个AGENTS的连接,并向ACD发签入包;当AGENTS CT Server断开连接退出服务时,CT ServerACD发签出包。

2)当呼叫到达、释放、应答等事件由ACD发到CT Server上时,由CT Server把这些消息由构件调用推到AGENTS上,由AGENTS作相应处理。

3CT Server具有维护接口,可以设置启动服务、关闭服务的功能。

4CT Server提供参数设置接口,能够完成能参数设置。

5CT Server可以产生话务员上班、下班的日志记录,呼叫处理的计费记录。

2.2.1.8 Application Server应用服务器

    应用服务器采用HTTP/XML模型开发各种应用程序, 将应用服务作为一个HTTP服务器向客户端(主要是座席端)提供服务,为座席端的调用提供不同的业务服务。在应用服务器中有如下各功能模块:

1)     Predial Server          预拨号服务器

2)     Web Server

3)     Proxy server

4)     DB Access Server       数据访问服务器

5)     Gateway Server         网关服务器

6)     AAA (Authentication And Account) Server认证计费服务器

7)     Exchange Server

8)     Maintain Server        维护服务器

Predial Server(预拔号服务器)

    为了能够在合适的时候及时地通知用户,并减少话务员的拔号时间,VOICE2001平台中设置了专门的预拨号服务器,它不断地扫描呼出数据表中的记录内容,检测符合呼出条件的记录,在出现可以服务的座席或IVR/IFR端口之后,向ACD发送呼叫请求,同时预占用座席或IVR/IFR端口。如果呼出成功,ACD完成对Agent的呼叫或对IVR/IFR的呼叫和连接,  同时从任务表中删除该记录, 如果呼出不成功,把呼叫按重试次数延后,释放预资源,如重呼仍不成功,那么取消呼出调度记录并写呼出失败记录,同时向申请呼出调度的Agent或向维护台发送呼出调度失败消息。

 Predial Server具有维护接口,可以设置启动服务、关闭服务的功能, Predial Server提供参数设置接口,完成参数设置。

DB Access Server( 数据访问服务器 )

数据访问服务器的功能在于为IVR/IFR提供统一的数据访问接口及座席(Agent)数据访问接口。

1 能够区别IVR/IFR数据访问的目的地,是被访问数据源在本地或是应由Gateway Server完成访问和存贮的操作。

2 完成数据访问结果按一定的标准格式返回给调用者。

3 维护每一次调用的DB Access Client的通信连接。

4 具有维护的接口,可以被远端启动和远端关闭服务的功能。

5 具有参数设置的接口,可以远端参数设置,参数设置完成后该模块不需要重新启动。

Gateway Server( 网关服务器 )

网关服务器目的在于实现客户端(包括AgentIVR/IFR )软件与业务的无关性。对于外部数据的处理由网关服务器这一中间件完成,网关服务器在具体实现时能做到:

1 作为中间构件被Agent所调用;

2 IVR/IFR具有统一的数据通信的接口;

3 网关服务器能够管理各个网关的连接情况,当出现故障时,产生告警清除消息;

4 网关服务器与各网关具有统一的接口,即可以做到在新增一个网关时, 该网关向网关服务器登记连接后,按照统一的数据格式通信,而不需要再修改网关服务器的代码;

5 网关服务器能够识别数据源及确定数据发送的目的地址, 即能够对数据地址进行管理。

6 提供配置、启动服务、关闭服务、查询服务(地址)状态的接口。

Web Server

CS-VOICE2001平台应该作为Internet上的一个服务站点,在Internet上提供信息服务、检索、电子邮件咨询服务、基于Chat的聊天频道等服务,Internet用户可以通过163/169接入系统,可以查询系统所提供的各种信息,也可以直接点击页面上的功能按钮,从而与系统的WEB座席话务员通过CHAT等直接交流,得到服务。用户也可以在营业厅中多媒体终端上使用BROWSER界面从WEB服务器上查询到所需的信息。

另一方面话务员的信息查询、业务向导的工作界面的实现都要通过Web Server完成。在功能上Web Server能够实现以下功能:

  1) 完成呼叫功能;

  2)完成数据查询存贮功能;

  3)可以调用AAA Server的构件;

4)Internet用户界面上,信息内容或是订购、查询等都可以设置“Call me”按纽要求话务员回收,通过Internet实现广域呼叫中心功能。

Proxy Server

proxy service web servers中抓取及缓冲VoiceXML(htmlxml) 页面.

Exchange Server

Exchange ServerInternet连接在一起。使用Exchange Server作为中间件是为了实现:

1) 一方面完成话务员与管理人员通过E-mail进行内部沟通,实现办公室自动化话务员的日程安排服务功能、内部工作流服务功能。

2) 另一方面要实现与外界用户之间通过电子邮件进行沟通。

    在实现上当有工作需求时可以通过调用其他应用服务器的构件完成呼叫、应答、传真、语音提示等功能。

AAA Server ( 认证计费服务器 )

    AAA Server认证计费服务器提供如下功能:

1) 提供话务员登记时的认证功能;

2) 提供Agent上实现业务时计费话音收集功能;

3) 提供IVR/IFR帐号用户的身份认证功能;

4) 提供IVR/IFR计费话单收集功能;

5) 提供ACD对帐号用户认证功能的支持;

6) 提供ACD产生的话单的收集功能;

Maintain Server 维护服务器

    维护服务器的功能在于能够实现应用服务器上所有构件的启动、关闭、配置、查询等功能。维护服务器也可以作为构件被客户端调用,这一客户端是提供给维护人员,质量检查人员使用而非话务员使用。

2.2.1.9 Data Gateway数据网关

数据网关对不同数据源的访问提供实现的方法,完成与短信、WAPMessage Application Service Platform、证劵、银行、Internet、寻呼等专业数据库的联网实施。

2.2.1.10 Agent(客户端座席)

Agent(客户端座席)完成:

1)     呼叫控制、拥有虚拟电话机

2)     可以访问信息数据

3)     提供业务向导

4)     E-mail处理与公共网页同步交谈

5)     公告信息版

6)     产生业务话单

2.2.1.11 OA&M

OA&M主要完成对系统各部分的配置、查询、冗余处理、计费话务统计、告警、日志和监听、全程录音的功能,在模块上采用统一的接口和管理的界面