forcode想看的


forcode看过的


新技术
新趋势
奇思妙想
科学探索
科幻奇幻
资料搜集
网络研究
统计定量
社会学研究
书摘读后感
数码网络
软件评测
数据指标
实用信息
有趣的东西
房地产
网络赚钱
投资创业
新闻评论
网站经营
电影八卦
美景美人
人物朋友
情感回忆梦
forcode生活

2007-03-04

语音识别软件“听力大增” 正日益得到普及




  作者:英国《金融时报》金•托马斯(Kim Thomas)

  如果没有电子邮件,没有PowerPoint或网络,一些人会感到无法工作,而基思•贝雷斯福德(Keith Beresford)的"杀手级应用"软件(killer application)则是一种语音识别软件。
这位专利律师事务所Beresford & Co的高级合伙人表示:"如果没有它,我就不可能在今天的世界里正常行事。" 他的事务所总部位于伦敦。

  语音识别技术正在更多工作场所日益得到普及。这项技术过去曾遭遇沉重压力,用户一直抱怨"训练"这种软件识别他们的语音很难,转换成文字时也不准确。然而,最近开发的软件版本准确度有了大幅提高。有一个迹象反映了这项技术的潜力:美国软件集团Nuance的市场统治地位可能很快面临微软(Microsoft)的威胁。Nuance拥有受欢迎的Dragon Naturally Speaking语音识别软件。

  贝雷斯福德使用语音识别软件已有10年之久,但直到去年Dragon Naturally Speaking 8问世之后,他才感觉可以将这种软件介绍给事务所里的其他同事。他表示,事务所里撰写文件和电子邮件的传统方法速度缓慢。

  "如果你打字速度慢,你可能会把时间浪费在敲击键盘上,或是把电子邮件内容口述在磁带上,让秘书把它打出来。然后你还得检查,而那时,你正在做别的事情。"

  他表示,有了Dragon Naturally Speaking,你就可以立即回复电子邮件,除了口述内容外,甚至可以使用语音指令操控软件。

  其中一个巨大改进是,用户以前说话时只能使用不连贯的语句,但现在他们却可以说得很流畅。这个程序仍然必须经过训练,才能识别用户的语言风格,不过贝雷斯福德发现,只要经过几个小时的训练,以接近正常的语速讲话就能实现近乎完美的准确率。

  不过,他承认,这并非对所有人都如此奏效:他事务所里的两个人使用Dragon Naturally Speaking时效果不佳,因为这种软件对某些类型的声音识别能力较差。

  语音识别软件在医疗和法律行业最受欢迎,因为这些行业历来有口授信件和报告,然后由秘书写出来的习惯。在开放式办公室使用语音识别软件肯定不实用,它是在家工作的人和流动员工理所当然的选择。

  当马克• 丹恩(Mark Dann)两年前创办Eventory(英国一家基于互联网的库存服务公司)时,他决定将尽可能多的工作流程都自动化。他的库存检查员团队没有雇秘书来打库存报告,而是将变动情况报告口述到语音口述机中,然后再把口述机连接到笔记本电脑(有时在汽车后座)或公司总部的台式个人电脑上。

  "真是惊人,"丹恩说道,"五六分钟就能打出相当于25页报告的内容。"他认为,能拿出即时报告使他拥有了极强的竞争优势。

  Dragon Naturally Speaking占据了超过90%的全球市场份额,而其竞争产品、由IBM开发的ViaVoice市场份额还不足10%,后来IBM将这个产品授权给了Nuance。

  不过,这种压倒性优势也许不会维持太久。预计将于今年11月推出的微软新操作系统Windows Vista也含有语音识别软件。

  市场调研公司Ovum首席分析师大卫•布拉德肖(David Bradshaw)说道:"微软认为,语音软件有朝一日将成为电脑界面理所当然的组成部分。"

  微软对平板电脑(tablet PC)的投资支持了他的观点。这种电脑一般不带键盘。就连Nuance生产率解决方案营销经理史蒂文• 斯廷豪特(Steven Steenhaut)也认为,微软将成为"一个很重要的竞争对手",不过他坚持认为,Nuance的软件"比目前的竞争产品都要先进得多"。

  这并非只是营销宣传。一件产品能统领市场这么久,原因之一就在于,语音识别是一种复杂的技术。

  "问题是,英语中有非常大量的单词,你必须尝试以高准确率识别其中的绝大部分,"布拉德肖说,"我们每个人的工作词汇也许最多不过是几千个单词,但是不同的人有不同的工作词汇。"

  这个软件不仅必须识别单个的单词,还要识别语法,以便给这些单词提供一些语言环境。对语音识别软件而言,困难的技术词汇相对比较容易,但是较短的单词却会造成难题。英语中同音异义的词很多:要说出"to"、"two"和"too"之间有什么差别比较棘手,或者,就像英国著名的两幕短喜剧 "TheTwo Ronnies"中一样,很难说出"four candles"与"fork handles"读音的差别。

  微软进入语音识别市场时间相对较短,它能否创造出一个堪与Dragon Naturally Speaking匹敌的产品目前还很难说。来自Vista软件测试版用户的早期报告显示,它表现得还不错。它还有对操作系统购买者免费的优势。即便现在还落在后面,但微软很可能将语音识别软件带给更广泛的用户群。

  不过,布拉德肖还是说得很谨慎。"语音识别软件可能有朝一日会流行,"他说道,"不过,具体是什么时候,我不知道。"

  译者/梁艳梅 徐柳

  (来源:英国《金融时报》中文版)

--
欢迎访问"奇想录",了解最有趣的信息:
http://forcode.blogspot.com

0 条评论:

发表评论

订阅 博文评论 [Atom]

<< 主页

热门文章
============================================================
格兰仕微波炉报价单    英语六级历年真题听力下载    大陆身份证生成器
東方神起的所有反轉劇!!.[含东方剧场](會繼續更新以後的)(已可覲看)
电视剧《靠近你温暖我》全集下载(BT/迅雷/电驴/剧照)
精彩的洞庭湖人鼠大战(4视频+forcode点评)
一百多个电影字幕下载网站,精心收集整理!
(视频)(CCTV10“走进科学”-科幻之旅专题-克隆人 8.14)
国外BT站点和BT种子搜索站(国外完整bt搜索列表)
============================================================
forcode科幻小说《抽水马桶的秘密》正在起点中文网连载
《抽水马桶的秘密》读者评论:
(1)你的书很好看,比大刘,王晋康的创意好太多了,努力吧将来出实体书我一定会买的。(2)很有想象力的作者啊!!估计是看了不少科幻小说的人,希望不要浪费你非凡的想象力。
(3) 读者在自己博客或论坛对《抽水马桶的秘密》的评论。(4)点击此处查看全部的读者评论(18页,1000条以上)
《抽水马桶的秘密》相关帖子:
《远程面包机》提纲|| 《进化论危机》提纲大家一起来设计
抽水马桶是外星人的试管|| 读者推荐超一万票
《抽水马桶的秘密》内容简介:
地球哺乳界正在发生的一次大规模跨物种升级,DNA机制并非人们所想像的那样是决定生命的最终遗传载体,而是类似浏览器这样的转译机制,真正的遗传物质存储在弥漫整个宇宙的光子数据库中,DNA机制实际上是一种设定了进化路径的文明压缩包的解压机制,数十亿年前灭绝的三栖人发明了光子数据库和DNA机制,目的是为了让这个机制最终复活三栖人文明,而人类(裸猿)这一物种在三栖人社会里其实是一种宠物,但是DNA机制似乎出现了点问题,或者说不知道什么原因裸猿突然变得太过聪明了,在播撒了始祖菌(DNA种子)的所有星球,进化路径发展到裸猿阶段,并没有继续演化出最后一步:三栖人,而强大的光子数据库一旦意识到DNA进化机制的这个漏洞,立刻关闭了这些星球对光子数据库的访问权限,这样,这些星球的生态系统都面临着灭绝的危险,因为他们脱离了光子数据库的遗传支持再也无法自然繁殖,只能靠遗传工程来复制现有的基因,或者做些小打小闹的修改,整个宇宙各星球上的基于DNA机制的生态系统都面临崩溃的危险。最终在13世纪,裸猿一族在银河边缘一个不起眼的小星系发现了地球这个由于某种原因至今还刚进化到裸猿初级阶段的星球,为了催熟地球的进化速度,外星裸猿文明开始介入地球的发展,为了防止光子数据库察觉到非地球文明的介入并关闭地球的权限,这种介入始终是暗中进行,因为介入方式的分歧,银河系裸猿文明分裂为两大集团,这两大集团的争斗伴随着人类近现代的发展,于是,文艺复兴开始了、三次科技革命出现了、两次世界大战也来了,直到今天,地球人类为自己的技术进步而沾沾自喜,丝毫不知道技术迅速发展的真正原因以及潜藏的危机。
============================================================
forcode2003年以前的习作:未来的婚姻、远程面包机
forcode朗诵《蜀道难》||forcode的一百多个科幻构思
奇想录:最新奇有趣的新技术和新闻点评|| 订阅“奇想录”