语音识别服务软件 V3.017 TS-8611R软件

TS-8611R   TS-8671R软件 产品图.jpg

基本参数:

1.支持中文普通话、英文、中英文混合。中文普通话引擎支持中文中夹带英文单词、简单的英文语句,基本可以达到中国人日常生活的要求。中英文混合引擎可在中文和英文语境下自由切换。支持选购其他语种和方言识别。支持的语种包括:日语、韩语、俄语、法语、西班牙语、泰语、德语、越南语、阿拉伯语、保加利亚语、印地语、意大利语12种国家语言。支持的方言包括:四川话、粤语、上海话、合肥话、长沙话、闽南话、南京话、台湾话、山东话、天津话、苏州话、东北话、武汉话、河南话、客家话、陕西话、太原话、彝语、南昌话、贵州话、河北话、云南话、皖北话、甘肃话、宁夏话25种方言。

2.目前实时语音转写支持 pcm、wav、speex、speex-wb、opus 等音频编解码算法。非实时转写只支持 mp3、wav、wma、mp4、avi、pcm、m4a 格式音频。目前音频采样率仅支持 16K,其他采样率可以通过服务转换成 16K 进而实现转写功能。

3.通过对音频流做实时语音识别,可实现“边说话边同步输出文字”的效果。会话初始化成功之后便可持续的调用接口,向服务器发送音频,获取识别结果。在发送音频时,为了与引擎保持帧同步,需将引擎切分为固定大小的段来发送,且需要有一定的等待时间,保证每秒的流量与引擎的采样率一致,例如引擎为 16k 16bit,每次发送 1280 大小音频段,那么每次应该等待40ms。

4.普通话准确率最高可达98%(清晰标准普通话中文语音实时转写效果,准确率和普通话标准度,清晰度有关);粤语转写正确率≥90%(安静环境下,需选购方言包。粤语为港版粤语,转写文字为繁体中文);用顶尖语音转写技术,实时语音转写速度≤200毫秒,可实现10分钟完成1小时的音频识别。

5.语音转写私有云支持对识别结果语句智能预测其对话语境,提供智能断句和标点符号的预测,同时也支持数字规整和替换列表能力。

6.数万小时声学模型训练数据,显著提升个性化识别;软件提供1路识别能力。

7.基于人工智能技术开发的,面向各行业客户提供的一款语音转写产品。该产品为客户提供整套语音转写方案,帮助客户快速将音频转换为文本。产品针对长语音场景做了多项核心技术优化,在远场、噪音环境下的识别率大幅提升,技术业界领先。产品提供异步文件转写、实时语音转写两个核心功能,满足客户的不同需求。录音文件识别,支持客户将音频文件上传识别成文字;实时语音识别,支持客户上传音频流,获得识别后的文字流结果。

8.支持多个会议的召开,并支持多个会议同时进行转写(选配)。

网站内容仅供参考,本公司保留最终解释权!