流程图
流程拆解
WAKEUP 唤醒
- 通过唤醒词唤醒语音助手以开始语音识别,涉及唤醒率、误唤醒率。
- 传统唤醒
唤醒设备,待设备反馈后输入话术,如:“HeySiri” - “在的” - “我要听王力宏”
- OneShot
唤醒词和话术一起输入,如:“HeySiri,我要听王力宏”
- ZeroShot
无需唤醒词,直接输入指令,如:“我要听王力宏”
ASR 语音识别
- 将Speech输入转换为Text的技术
PROCESSOR 预处理
- 预判
对于高频且无异议的query可以直接下发command,无需NLU理解等 - 纠错
可以对ASR的结果进行纠正
NLU 自然语言理解
- NLU提取query特征,并分发到各个Domain
INTENT 意图
- 经过NLU处理,收集分析各个Domain的给出的intent、置信度、slot。判决用户真正的意图。
COMMAND 指令
- 语音助手根据识别后的intent选择对应的Domain执行命令
评论 (0)