语音助手的交互流程浅析
标签搜索

语音助手的交互流程浅析

Pop.Kite
2023-02-13 / 0 评论 / 141 阅读 / 正在检测是否收录...

流程图
processor.png

流程拆解

WAKEUP 唤醒

  • 通过唤醒词唤醒语音助手以开始语音识别,涉及唤醒率、误唤醒率。
  • 传统唤醒
唤醒设备,待设备反馈后输入话术,如:“HeySiri” - “在的” - “我要听王力宏”
  • OneShot
唤醒词和话术一起输入,如:“HeySiri,我要听王力宏”
  • ZeroShot
无需唤醒词,直接输入指令,如:“我要听王力宏”

ASR 语音识别

  • 将Speech输入转换为Text的技术

PROCESSOR 预处理

  • 预判
    对于高频且无异议的query可以直接下发command,无需NLU理解等
  • 纠错
    可以对ASR的结果进行纠正

NLU 自然语言理解

  • NLU提取query特征,并分发到各个Domain

INTENT 意图

  • 经过NLU处理,收集分析各个Domain的给出的intent、置信度、slot。判决用户真正的意图。

COMMAND 指令

  • 语音助手根据识别后的intent选择对应的Domain执行命令
0

评论 (0)

取消