当你在智能音箱面前提问时,你会得到一个令人困惑的答案使用过智能音箱或其他语音助手的朋友对这一场景并不陌生如果你怀疑自己被削减了智商税,你可能会问为什么智能音箱宗莎答非所问它能变得聪明吗要回答这个问题,首先要了解智能音箱对语音的理解对于机器而言,语音文本图片视频等信息属于非结构化数据,无法直接理解结构化数据是机器能够理解和反馈的东西简单理解两者之间的区别和关系非结构化数据相当于编写一段文本的word文档,而结构化数据是excel文档,总结了这段文本当我们向智能音箱提问时,智能音箱首先将语音转换为文本,然后理解并反馈文本的结构化数据,然后将文本转换为语音输出答案这三个过程对应于三种技术,其中ASR