阅读:1749回复:0
语音识别十年痛苦发展 准确度突破95%语音识别技术已被广泛用于手机和蓝牙耳机的通讯上。(Getty Images) 英文语音识别技术历经十年的曲折发展,近年来终于有了重大突破。全球领先的语音识别技术提供商“纽安斯通讯公司”(Nuance Communications)声称,该公司的语音识别软件“龙语音”(Dragon NaturallySpeaking9.5)的最新版本允许您在阅读速度达到每分钟160个单词的情况下,语音记录的文字精确度达到95%,成为有史以来语音识别的最准确版本。 语音识别终于达到既快又准目标 《科学生活》(LiveScience) 最近报导,2007年夏天可留念的不仅是希尔顿酒店王国继承人巴莉丝•希尔顿小姐被监禁的故事,而且还有个人计算机连续语音识别技术的突破,暨1997年夏天推出的“龙语音”软件的第10个周年纪念。 最初,龙语音软件是为打字困难的消费者而设计的。它的想法是,您的阅读速度可以比打字还快。在软件出炉的初期,用户必须花费大约45分钟阅读“龙语音”软件的录音测试,以便“训练” 这个软件,但只有大约75%的准确性,相当于读一个短句都会出现几个大错。而今天,所有权已转手两次的“龙语音”版本9.5,语音训练只需几分钟,其准确度就可达95%,意味着每句只出错一次。该软件现在的主人,位于麻省伯灵顿(Burlington)的纽安斯通讯公司表示,“龙语音”软件今天有更广泛的用途,为家庭和企业用户节省大量时间。 纽安斯通讯公司报告说,目前的销售兴旺。公司发言人斯纯米罗(Chris Strammiello)告诉《科学生活》杂志,直到2004年6月发布了版本8.0,这个软件才大量流向市场,提供的准确度才真正能够被人们接受,这主要归功于算法的改善和更快速的电脑硬件。从那以后,销售额每年增长30%。纽安斯通讯公司的销售额已从2004年的1.3亿美元上升到2005年的2.3 亿美元和2006年的3.9亿美元。精度平均达到95% 使用矫正设备还可达99% 历经10 年,这项技术取得了重大进展。纽安斯通讯公司声称,现在您能对着“龙语音”软件说话的速度已达每分钟160个词。您还能通过声音命令打开和关闭计算机上的其它程序,以及文件和菜单等。总之,该公司称,目前龙语音识别精确度最高能达到99%,平均95%, 成为有史以来最准确的版本。 根据一些使用者的证词,该语音识别软件录下的文字有95%的机会和人们用打字机记录相统文字一样准确。这个软件的主要好处就是能够跟上每分钟140个单词的一般会话速度,三倍于多数人打字的速度。长的单词几乎总是正确,短单词有时好像会出错。 如果使用者利用该软件的矫正设备,既根据您的声音该软件逐步调整自己,几星期后则有可能达到99%的准确性。不过有一个先决条件,就是使用者必须始终如一、清楚地讲话,否则精度可能会受到影响。该软件的个人版本零售价大约为200美元,专业版本大约765美元。 语音识别技术的十年痛苦发展 在过去的十年或更早时期,语音识别的发展几经周折,这门技术由于强制推销几乎两次败落。语音识别领域的先驱之一是“Kurzweill实用智能公司”(Kurzweill Applied Intelligence),1993年公司的二位主管人员因虚构销售被判入狱。 “龙语音”软件的最初卖主“龙系统”(Dragon Systems)在1997年发布了“龙语音”NaturallySpeaking软件之后,没有报告更多的增长。位于比利时的语音识别企业 Lernout & Hauspie (L&H)在于2000年在一次股票交易中出面购买这个苦苦挣扎的企业。几个月后,L&H的销售增长又被揭露为假报告,最终导致破产。 ScanSoft公司在2001年底购买了被破产拍卖的“龙语音”技术,从那以后,通过三次升级持续发展这一技术,与此同时,公司更名为“纽安斯通讯公司”(Nuance Communications)。 目前这个软件有几个版本,从99美元的标准(Standard)版,到199美元的首选(Preferred)版。专业版(Professional)价格更高,从765到899美元。同时,还有要价更高的专门为法律和医疗专业所设的版本。 资料来源:科学生活(LiveScience)、今日美国 >>按这里看更多报导… |
|
|