搜狗|搜狗夺食科大讯飞语音识别
_原题为 搜狗夺食科大讯飞语音识别
文章图片
配图来自Canva
随着AI技术的跨越式发展 , 智能产品逐渐渗透在日常生活的各个领域 。 不过 , 智能产品的开发 , 还是需要建立在AI技术进步的基础上 。 而AI技术的进步 , 则能够方便智能产品推进商业化 。
在语音识别领域 , 代表语音技术圈领先水平的INTERSPEECH为促进语音识别技术的进步 , 举办了2020届语音识别挑战赛 。 在今年举办的INTERSPEECH 2020 DNS挑战赛中 , 搜狗以4.01的MOS评分夺得冠军 。
AI降噪技术取得的喜人成绩 , 让搜狗在语音识别技术的商业化推进中有了更足的底气 。 在推出S1录音笔产品中 , 搜狗就将AI降噪技术应用其中 , 并获得了不错的用户评价 。
不过 , 同样身居AI录音笔市场的科大讯飞也在不断发力 , 和搜狗展开竞争 。 与此同时 , 搜狗在AI商业化方面 , 也受到来自产品以及商业模式两方面的挑战 。 而在这场竞争中 , 搜狗和科大讯飞谁能够胜出 , 还有待市场考量 。
DNS夺冠 , 醉翁之意不在酒
作为语音领域尖端组织之一 , INTERSPEECH一直代表着国际语音技术领先水平 , 并在全球范围内拥有极大影响力 。 而DNS挑战作为INTERSPEECH2020的竞赛主题之一 , 其比赛结果就代表了企业在业界的语音识别技术最高水平 。
据悉 , 今年举办的DNS挑战主要以MOS评分作为语音技术评价标准 , 考核内容为微软官方提供的500h数据集语音识别 。 最终 , 搜狗以4.00的MOS评分超过亚马逊 , 夺得RT(实时降噪)技术赛道桂冠;而在NRT(非实时降噪)赛道 , 搜狗也已3.90的MOS评分位居第二 , 成绩喜人 。
RT、NRT技术赛道的亮眼成绩 , 也让致力于AI技术研发的搜狗略感欣慰 。 作为语音赛道早期的入局者 , 搜狗一直围绕语音技术展开产品创新和技术探索 , 并凭借着多年积累的优势在业界居于领先地位 , 而这次DNS挑战夺冠 , 也正是其在语音识别领域多年积累下强劲实力的体现 。
除了获得业界AI技术认可之外 , 语音识别赛道取得的亮眼成就 , 对搜狗AI技术的商业化推进也有重大意义 。 搜狗在AI领域多年深耕 , 研发投入超过数亿美元 , 曾让其面临了巨大的财务压力 。 而这次AI降噪技术夺冠 , 必然对其推进AI商业化进程、降低自身财务压力大有裨益 。
目前智能语音市场 , 对AI降噪技术的应用还比较有限 , 仅应用在语音通话等简单场景 。 在市场技术应用场景有限的情况下 , 搜狗率先变革创新 , 将AI降噪技术应用在AI录音笔上 。
趁热打铁 , 力推AI录音笔
虽然AI降噪技术夺得冠军 , 但这并不是搜狗的最终目的 。 而搜狗在AI领域持续投入技术研发 , 最终还是要将技术成果商业化 。
语音识别技术的商业化落地 , 对持续亏损的搜狗来说刻不容缓 。 搜狗近日发布的财报显示 , 2020年第二季度共亏损0.085亿美元 , 搜狗解释主要是搜索引擎、AI技术持续研发的投入所致 。 研发的持续投入 , 自然让搜狗承压 , 而抓住有限的变现渠道、摆脱亏损境况就成了搜狗必须要做的事 。
事实上 , 搜狗早就在加紧AI技术的商业化落地 。 今年举办的“同舟共记”发布会上 , 搜狗发布了最新的S1、E1两款具有AI降噪功能的录音笔 , 并使用了pureVoice人工智能降噪算法、clairVoice8麦阵列算法 。 通过其领先的AI降噪技术 , 搜狗的S1、E1录音笔可以做到过滤4万余种真实噪音 , 还能在嘈杂的环境高度并准确还原人声 。
凭借着强大的AI降噪技术实力 , 搜狗的S1、C1、C1Pro产品受到用户追捧 , 首发8小时就已售出5000台 。 而在罗永浩直播中 , 搜狗的S1录音笔也有不错的表现 。 在吹风机的强力干扰下 , S1录音笔也能将现场录音清晰还原 , 其强大的语音还原能力受到了老罗和直播间网友的好评 。
S1录音笔取得的亮眼成绩 , 多少对搜狗承受的财务压力有所缓解 。 不过 , 搜狗的录音笔虽然有AI降噪技术的优势 , 但同时也面临着变现模式单一、产品同质化的问题 。
商业化之殇
搜狗在AI产品商业化推进中 , 首先遇到的是变现模式单一的难题 。
AI技术高额的研发投入 , 始终让搜狗处于亏损的状态 , 而AI降噪技术的应用也仅限于录音笔产品 。 这样的情况下 , 搜狗为了扭亏为盈 , 在语音转录应用上开启了会员收费模式 。 例如 , 用户在知乎平台爆出搜狗的S1录音笔 , 购买后赠送一年会员(198元/年) , 但在会员时间结束后 , 转写文字功能需要收费才能使用 。
和市场上主打转写功能终身免费的产品相比 , 搜狗的会员收费模式自然备受用户诟病 。 而在众多产品主打免费转录的情况下 , 用户自然不愿意为搜狗的收费会员买单 。
此外 , 录音笔市场产品同质化的问题也比较严重 。 例如搜狗的S1产品 , 和科大讯的SR501录音笔相比并没有明显差异 。 例如 , 在外观结构设计上 , SR501、S1录音笔都使用了2+6麦克风阵列 , 能在多场景模式下清晰收音;语音识别方面 , SR501、S1都支持10种以上语言识别功能 , 且在中文方言转写方面势均力敌 。
推荐阅读
- 科大讯飞|科大讯飞上半年净利润同比增长36.28%,20%营收用于研发
- 论文|中科大学术委员会回应“情侣送礼研究”博士论文:不评价好坏
- 办学|武大、华科大在同一校园办学,将正式入驻国家网安基地网络安全学院
- 消息资讯|港科大MBA学生故事 | Alexis Zhou: 不断创造新鲜感,对人生全力以赴
- 科大讯飞|工作效率提不上去?不妨试试科大讯飞录音笔!
- 大学|屋顶蹭网男孩666分考入电子科大!他的这句话让网友狂赞
- 行李|电子科大学生搬宿舍,行李“坐滑梯”下楼
- 南科大|2572名南科大2020级新生今日报到
- 电子科大|在屋顶蹭网上课的男孩以666分考入电子科大
- 电子科大|“嗖”一下就下楼!电子科大用神器帮同学搬宿舍