本篇文章1851字,读完约5分钟
据陕西广播电视台“企业品牌故事”栏目介绍,《记者杨晓春》于9月27日正式对外发布了科大讯飞v4.0,开始了离线语音输入时代。 记者了解到,9月11日,科大讯飞正式发布离线语音新技术,并首次应用于新闻输入法等产品。 该技术是企业基于云计算语音听写技术,扩展移动终端语音应用的采用场景,为满足大量客户在无互联网或弱互联网上对语音技术诉求而开发的新型语音识别引擎。 另外,消息输入方式的顾客人数突破9000万人,预计今年第四季度正式进入亿人俱乐部。 / br// h /
那么,什么是脱机语音技术和脱机语音输入呢? 今天和大家一起介绍这个新技术。 离线语音技术无需互联网连接,直接通过本地离线语音包解决,将语音输入识别变为拷贝。 本地离线语音包实际上代替了云服务器的功能,通过专有技术对语音输入拷贝进行语义和语法识别评估,基于语音模型进行分解,得到主谓宾的句法结构,实现长句语音输入和自动标点符号。 语音输入功能并不新鲜,招聘时需要互联网支持。 但是,离线语音输入是在没有互联网和没有流量的情况下,能够成功进行语音拷贝的输入过程的。 能够在移动终端上实现离线语音输入,无疑是语音输入功能的新里程碑。
科大讯飞是我国最大的智能语音技术提供商,占语音产业的80%以上的市场份额。 此次正式发布的离线语音技术,一方面加强了消息输入法等产品的顾客体验,另一方面也提升了产品功能的特点。 虽然面临着与国外大型语音公司的竞争,但国外语音技术在中文听写能力和本土化文案上有明显的短板; 国内也有百度、云知声、腾讯、盛大等网络企业的挑战,但国内竞品主要集中在云简单听写这一细分行业,是一种离不开互联网云计算服务的语音技术, 这与科大讯飞主导的智能语音全领域应用差距很大,且在声纹识别、语音评价、噪声环境语音的语音世界中,科大讯飞语音技术的排他性特征明显。
谷歌离线语音输入常用的中文识别率为30%-40%,科大讯飞离线语音识别率略高于基于语音云的在线语音输入的95% 约90%的离线语音识别率比国内其他语音高
离线语音的识别率不仅受三个因素的影响,也容易受到语音相互传播错误的影响。 思驰首席科学家俞凯表示,如果语音识别精度在85%-95%之间,则语义分解精度在85%-95%之间,最终识别精度只有70%-90%。 因此,目前离线语音技术的识别率90%是极限。
讯飞输入法是中文语音产业龙头科大讯飞推出的输入软件,集语音、手写、拼音、笔画等多种输入方法于一体,相同的界面 消息输入法是世界上第一种基于云计算方法实现的智能语音输入法。 支持普通话、粤语、英语输入,语音识别率超过95%; 最初的自由书写输入模式: 5种手写方法无切换,中英混合手写,准确率超过98%,适用于andriod手机和pad、iphone、itouch、ipad、windows等所有平台
离线语音输入的技术门槛非常高,目前,国外只有谷歌、苹果等为数不多的高科技企业在短时间内就实现了,其他企业由于技术的限制, 结合将技术应用于离线语音技术的技术创新和顾客体验,输入法产品中运用的离线语音输入效果显著。
那么,飞行输入方式的离线语音输入技术的特征在哪里呢?
首先,不上网也可以:国内2g/3g互联网覆盖度不高,互联网质量不稳定,wifi / br// h///br// h /其次,不需要通信量。 国内数据流量费用高昂,采用离线语音技术可以大幅降低成本,消除语音输入流量费用的担忧。
第三,识别率高:离线方式是弹出语音听写技术的第一个典型应用,是国内唯一支持离线语音的输入方式,识别率为90%。
第四,离线语音输入的识别速度首要取决于手机的结构,硬件性能越强,离线识别速度越快,四核a9主流手机的离线语音输入识别速度越快。
目前,离线语音输入已应用于手机输入方式的输入,作为在线语音的补充输入方法,离线语音输入的环境适应范围较广,可以理解为无形的键盘 另外,声纹识别和语音唤醒等可穿戴设备输入是典型的APP应用,前者以客户的声音为打开设备的密码,后者以客户不接触设备的方式启动设备操作,第三是可穿戴辅助输入, 配对手机的可穿戴智能设备可以采用语音输入,无需掏出手机进行采用,即可迅速回复邮件和做笔记。
信息输入方式的离线语音输入技术,是否有地铁、高铁、地下室、电梯、ktv、山顶等互联网和薄弱的互联网环境,或手机
信息输入方式的离线语音输入的正式发表,今后必将推动中国离线语音市场的迅速发展。 【记者杨晓春】
来源:陕西广播电视台《企业品牌故事》栏
来源:企业信息港
标题:“讯飞离线语音技术:开启输入法新变革”
地址:http://www.quanhenglawyer.com/qyzx/5288.html