
智能语音助手总共有2次人类的互动,一个唤醒,一个表达意图,两个行为之后,等待AI反馈。也就是,用户说话后的下一秒,智能语音助手要同时进行处理,识别+理解+界面查询+反馈四个阶段,整个过程都是用户等待状态。智能语音助手解决方案的全双工(FullDuplex)是一个通信传输的术语。通讯使数据可以同时向两个方向传送,并在两种情况下进入监听,一种是利用唤醒词,完成唤醒/打断动作。二是AI判断业务没完,对其进行引导式询问,然后进入监听状态。确认用户当前所说的是否有给出的指令,能够过滤掉干扰信息,如无效的停顿、语气助词等,再作出反应。全双工所说的“瞬时双向”表演,更接近人与人之间的自然对话,提升互动体验。
智能语音助手解决方案前、后端共同协作,添加一些语音播报,模态框提示,渐隐消失提示,动画效果,以管理用户的等待体验。但也有一些无屏音箱需要利用等待、载入、成功等光效表现来管理用户的等待体验过程。因此,智能语音助手解决方案在响应速度/流畅度这一维度上,不同情况的处理方式不同,最好是适合的。
智能语音助手解决方案拥有丰富的互动形式。在智能语音助手解决方案中,每种交互形式的存在都有它所依赖的场景。
智能语音助手解决方案点击,语音,手势,点头摇头,面部识别,声纹,指纹验证等,都算在内。
这个部分真的不用多说了,除了脑机接口之外,基本上都玩过了,体验过的都会觉得它有趣。
智能语音助手解决方案评价点的交互式形式丰富度,已经解释过了,在未来,肯定是多模式交互,以适应多种业务场景。智能语音助手解决方案要尽可能多地使用智能硬件,将工作经验转化为日常生活,培养敏感性。弄清这些交互方式、元件连接方式背后的技术实现原理。






