隐匿在语音识别背后的智能音箱之战( 二 )


  • 语言模型
一般采用链式法则把一个语句的概率拆解成每个单词的概率乘积形式 , 然后通过语料库来训练和学习词之间的条件概率 , 从而估计出词序列的可能性 , 最终给出该语句的语言模型得分 。
  • 搜索算法
对给定的特征向量和假设词序列 , 计算声学模型得分和语言模型得分 , 将综合分数最高的词序作为识别结果 。
对话系统结构对话系统(Dialogue System)是指可以通过文本 , 语音 , 图像等自然的沟通方式自动的与人类交流的计算机系统 。
一个典型的任务型对话系统包含下图所示的三个部分:对话理解 , 策略学习和对话生成 。
隐匿在语音识别背后的智能音箱之战文章插图
具体来说对于用户的输入 , 先通过语义理解单元进行编码 , 通过对话状态跟踪模块生成当前对话状态编码:根据当前的对话状态 , 系统选择需要执行的任务(由策略学习模块决定)最后通过自然语言生成 , 返回用户可以理解表达形式(如文本 , 语言 , 图片等)由于任务型的对话系统需要完成一些特定任务 , 因此处理的信息领域往往闭合的 。
对于非任务型的对话系统来说 , 其更注重用户之间的沟通 , 对话的多样性以及用户的参与度比较重要 , 因此这类对话系统更多采用一些生成模型(如Sqs2Seq模型)或者根据当前内容从语料库中选择合适的问答语句 。 这类问答系统对应的信息领域往往是开放的 。
对于智能音箱 , 其实在生活中很大的一个应用场景是老年人的使用 。 智能手机操作系统普遍较为繁琐 , 智能音箱只需要老人语音输入指令即可使用智能设备 , 能够很好的提升老年人生活质量 , 对于不在家的年轻人 , 带有屏幕的智能音箱还能远程视频与家中老人互动 , 增加沟通 。
科技 , 让世界更美好!
《百面深度学习》本书由Hulu的近30位算法研究员和算法工程师共同编写完成 , 专门针对深度学习领域 , 是《百面机器学习:算法工程师带你去面试》的延伸 。 全书内容大致分为两个部分:
  • 第一部分介绍经典的深度学习算法和模型 , 包括卷积神经网络、循环神经网络、图神经网络、生成模型、生成式对抗网络、强化学习、元学习、自动化机器学习等;
  • 第二部分介绍深度学习在一些领域的应用 , 包括计算机视觉、自然语言处理、推荐系统、计算广告、视频处理、计算机听觉、自动驾驶等 。
本书仍然采用知识点问答的形式来组织内容 , 每个问题都给出了难度级和相关知识点 , 以督促读者进行自我检查和主动思考 。 书中每个章节精心筛选了对应领域的不同方面、不同层次上的问题 , 相互搭配 , 展示深度学习的“百面”精彩 , 让不同读者都能找到合适的内容 。
本书适合相关专业的在校学生检查和加强对所学知识点的掌握程度 , 求职者快速复习和补充相关的深度学习知识 , 以及算法工程师作为工具书随时参阅 。 此外 , 非相关专业、但对人工智能或深度学习感兴趣的研究人员 , 也可以通过本书大致了解一些热门的人工智能应用、深度学习模型背后的核心算法及其思想 。


推荐阅读