首页>产品中心

语音识别服务软件 V3.017 TS-8611R软件

基本参数：

1.支持中文普通话、英文、中英文混合。中文普通话引擎支持中文中夹带英文单词、简单的英文语句，基本可以达到中国人日常生活的要求。中英文混合引擎可在中文和英文语境下自由切换。支持选购其他语种和方言识别。支持的语种包括：日语、韩语、俄语、法语、西班牙语、泰语、德语、越南语、阿拉伯语、保加利亚语、印地语、意大利语12种国家语言。支持的方言包括：四川话、粤语、上海话、合肥话、长沙话、闽南话、南京话、台湾话、山东话、天津话、苏州话、东北话、武汉话、河南话、客家话、陕西话、太原话、彝语、南昌话、贵州话、河北话、云南话、皖北话、甘肃话、宁夏话25种方言。

2.目前实时语音转写支持 pcm、wav、speex、speex-wb、opus 等音频编解码算法。非实时转写只支持 mp3、wav、wma、mp4、avi、pcm、m4a 格式音频。目前音频采样率仅支持 16K，其他采样率可以通过服务转换成 16K 进而实现转写功能。

3.通过对音频流做实时语音识别，可实现“边说话边同步输出文字”的效果。会话初始化成功之后便可持续的调用接口，向服务器发送音频，获取识别结果。在发送音频时，为了与引擎保持帧同步，需将引擎切分为固定大小的段来发送，且需要有一定的等待时间，保证每秒的流量与引擎的采样率一致，例如引擎为 16k 16bit，每次发送 1280 大小音频段，那么每次应该等待40ms。

4.普通话准确率最高可达98%（清晰标准普通话中文语音实时转写效果，准确率和普通话标准度，清晰度有关）；粤语转写正确率≥90%（安静环境下，需选购方言包。粤语为港版粤语，转写文字为繁体中文）;用顶尖语音转写技术，实时语音转写速度≤200毫秒，可实现10分钟完成1小时的音频识别。

5.语音转写私有云支持对识别结果语句智能预测其对话语境，提供智能断句和标点符号的预测，同时也支持数字规整和替换列表能力。

6.数万小时声学模型训练数据，显著提升个性化识别；软件提供1路识别能力。

7.基于人工智能技术开发的，面向各行业客户提供的一款语音转写产品。该产品为客户提供整套语音转写方案，帮助客户快速将音频转换为文本。产品针对长语音场景做了多项核心技术优化，在远场、噪音环境下的识别率大幅提升，技术业界领先。产品提供异步文件转写、实时语音转写两个核心功能，满足客户的不同需求。录音文件识别，支持客户将音频文件上传识别成文字；实时语音识别，支持客户上传音频流，获得识别后的文字流结果。

8.支持多个会议的召开，并支持多个会议同时进行转写（选配）。

网站内容仅供参考,本公司保留最终解释权!

转载请注明出处https://www.itc-pa.cn/pro/index/art/11371.html

项目咨询获取详细信息