欧易

欧易(OKX)

国内用户最喜爱的合约交易所

火币

火币(HTX )

全球知名的比特币交易所

币安

币安(Binance)

全球用户最多的交易所

Siri、小度和小冰它们是怎么做到和你相谈甚欢的

时间:2023-02-05 17:16:48 | 浏览:40

来源:科技日报视觉中国你知道小冰吗?你呼叫过小度吗?你和小娜互动过吗?你使用过Siri吗?如果都没有,那你就out了。它们都是当下很火爆的智能语音机器人,很多人都和它们聊过天。日前,美国投资机构Mangrove Capital Partne

来源:科技日报

视觉中国

你知道小冰吗?你呼叫过小度吗?你和小娜互动过吗?你使用过Siri吗?如果都没有,那你就out了。它们都是当下很火爆的智能语音机器人,很多人都和它们聊过天。

日前,美国投资机构Mangrove Capital Partners发布了2019年《语音技术报告》。报告分析了语音助理服务的日益普及,并预测苹果2020年将推出Siri操作系统。那么,究竟什么是语音技术?它有哪些应用?语音操作系统又是什么?为此,记者采访了相关专家。

通过纯语音信息实现与机器交互

与图像识别、机器学习一样,智能语音是人工智能的一个分支。在人工智能异常火热的当下,从Siri到小度,从小冰到小娜,智能语音正在融入人们的生活之中。

所谓智能语音技术,就是研究人与计算机直接以自然语音的方式进行有效沟通的各种理论和方法,涉及语音识别、内容理解、对话问答等。一般来说,智能语音就是利用计算机对语音信息进行自动处理和识别的技术。

“从引擎模块的角度讲,智能语音技术包括语音前端处理(含语音增强)、语音识别、语音合成、语义理解对话管理和声纹识别等模块。其中,语音识别就是将语音信息通过计算机自动处理转化成文字的过程,也叫语音转写,它包括语音分段、端点检测、特征提取、解码以及后处理等过程。”中国科学院声学研究所(以下简称中科院声学所)研究员赵庆卫告诉科技日报记者。

目前,智能语音技术主要应用于智能家居、虚拟助手、可穿戴设备、智能车载、智能客服、智能医疗、陪伴机器人等方面。所谓虚拟助手,就是智能语音助手,它的核心在于人类通过纯语音信息实现与机器的交互,让智能机器“助手”帮忙完成指派的任务。

在赵庆卫看来,语音操作系统是一个比较大胆的设想,基于语音的人机交互有很大的发展潜力,所以不少互联网企业都看好这个方向。目前,亚马逊已经打造了一个智能语音云平台(Alexa),平台上有各种智能语音应用(8万种技能),在这个平台上,用户可以通过语音发出一系列指令,比如购物、搜索、听音乐、讲故事等。

智能语音技术的前世今生

事实上,智能语音技术的研究起源于20世纪50年代。1952年,美国贝尔实验室制造了一台6英尺高的自动数字识别机“Audrey”,它可以识别数字0—9的发音,且准确度高达90%以上。并且它对熟人的精准度高,而对陌生人则偏低。1958年,中科院电子所的声学研究室利用电子管实现了10个元音的识别。“由于那时计算能力很弱,智能语音只能做一些特别简单的字母或数字的识别。”赵庆卫说道。

20世纪60年代到70年代初,语音识别的研究取得了一定进展。“此时,智能语音技术开始形成系统的框架,提出了基于线性预测编码(LPC)技术的特征提取方法和动态时间规整(DTW)技术,并且使用模板匹配的方法做一些简单的语音识别(小词汇量、特定人、孤立词)”。

从20世纪70年代中期到80年代,语音识别的框架有了突破,统计模型逐步取代模板匹配的方法,隐含马尔科夫模型成为语音识别系统的基础模型。同时,也采用高斯混合模型作为声学模型的主要建模方法,连接词识别和中等词汇量连续语音识别得到了较大发展。

“到90年代的时候,基础的神经网络语音识别模型已经提出。但当时神经网络语音识别模型之所以没能取得较大的突破,主要是因为当时服务器的计算能力不够强以及训练语音数据的量不够多。”赵庆卫说,90年代时的神经网络语音识别模型没能替代传统方法,此时智能语音技术还是以隐含马尔科夫模型和高斯混合模型为基本框架。

从20世纪90年代到21世纪初,非特定人、大词汇量、连续语音识别系统的研究成为国际语音界研究方向的主流。1997年,IBM首个听写产品Via Voice问世,用户只要对着话筒说出想要输入的文字,系统就会自动识别并输出文字。

2002年,中科院自动化所推出了“天语”中文语音系列产品——Pattek ASR;2005年,中科院声学所推出国内第一个自主研发的电信级语音识别平台,首次实现了国产语音识别软件的规模应用,在中国移动23个省的增值业务上线应用,占据了国内80%市场份额,使美国公司对中国语音识别市场的垄断成为历史。

深度神经网络框架成为主流

2010年,随着服务器的计算能力大幅提高(受益于GPU的应用)和训练语音数据的大幅度增加(受益于移动互联网和云计算的发展),微软基于深度神经网络的语音识别研究取得较大进展,“识别错误率相对下降20%以上”。此后,深度神经网络的建模优势被许多国际和国内知名语音研究机构所验证,业界开始认识到基于深度神经网络的建模框架比原来的框架识别效果明显要好,“现在大家基本都采用了基于深度神经网络的建模框架。”赵庆卫说道。

最近几年,基于深度神经网络的语音识别技术也进行了持续的迭代,从基础的深度神经网络发展到延时神经网络(TDNN)、双向长短时记忆(BLSTM)以及卷积神经网络(CNN)等;近年来,基于端到端架构(End-to-End)的语音识别系统正在被语音识别的学术界和工业界深入研究,一些系统也已经上线,中科院声学所将其最新研究成果实际应用于中国移动通信集团和中国电信集团的客服热线,智能技术直接服务了数以亿计的客户。

据了解,中科院声学所长期致力于语音识别核心技术研究。针对实时语音识别的需求,研究人员提出一种基于混合神经网络(延时神经网络+输出投影门循环单元)的低延时声学建模技术,可处理长时信息,网络结构简洁,计算速度快,易于并行化训练。该模型结构已作为一种新型的回馈神经网络结构被国际主流语音识别开源软件Kaldi采纳。在非实时语音识别方面,提出基于BLSTM-E(双向长短时记忆扩展)的深度神经网络结构,提升了现有主流BLSTM的性能,并解决了序列化训练条件下LSTM(长短时记忆网络)对不同长度语音输入的鲁棒性差的问题。(陆成宽)

相关资讯

小度发布新款超大屏平板,唤醒不用再说“小度小度”了

记者|崔鹏11月1日晚间,小度科技发布了首款15.6英寸超大屏产品“添添自由屏”,该平板具备全域免唤醒交互功能,官方售价2799元。在这款产品上,用户不再需要说出传统的唤醒词“小度小度”并等待回应,而是能在不同场景下直接下达命令,如“小度

小度添添自由屏发布:首创全域免唤醒技术,无需再喊“小度小度”

IT之家 11 月 1 日消息,今天,小度举行“添添新品发布会”,推出年度新品 ——「添添自由屏」,采用全球首创全域免唤醒交互技术,无需再喊“小度小度”,让交互更加方便、快捷。据官方介绍,添添自由屏搭载 15.6 英寸“超大屏幕”,专门搭配

"小度,小度,我想看甄嬛传!"能看电视的小度在家1S上手实测

随着智能家居概念的蓬勃生起,被誉为智能家居入口的智能音箱也逐渐崭露头角,成为市场上炽手可热的产品,国内的音箱品牌也是争相角逐,竞争激烈。前段时间百度推出新产品小度在家1S,这款音箱是国内首款智能视频音箱小度在家的进化版,具有强大的交互升级,

马上评丨小度小度,你能保护我的隐私吗?

澎湃首席评论员 李勤余7月1日,辽宁本溪的羊女士在民宿房间里玩智能音箱时发现,上方的摄像头拍到很多住客的隐私视频。羊女士表示,这个智能音箱有看护模式,捕捉到了六七段自己和朋友在房间内走动的视频,下面还有很多陌生人的隐私视频。针对“女子称民宿

智能音箱还能这样用,小度小度给我儿子打个电话

最近家里装修,孩子去爷爷奶奶家住了,很是想念。给老人打电话和开视频是一件成本极高的事情。所以我买了一个智能音箱。小度智能音箱play,较以前的产品来说,音质有大幅度提升,最关键的是,可以绑定电话,让家里的老人,通过语音操作,直接给我打电话了

小度音箱怎么选?一图秒懂,小度智能音箱全对比

创作立场声明:智能家居资深用户,只作对比,不作推荐!每个产品都有它对应的需求和场景,请理性选择符合自己需求的产品。大家好,我是不鲸方上次分享了一图秒懂,智能家居主流通信协议WiFi、蓝牙、ZigBee这次给大家分享9款小度智能音箱(无屏版)

智能音箱体验评测:小度在家1S和小度大金刚,哪个更适合你?

文|锌刻度记者 吴新1.除了能够通过红外控制传统普通家电外,小度大金刚还能够控制市场上主流的WI-FI智能设备,是名副其实的万能遥控器。2.现在200元以下的智能音箱应该是种群最大的市场,小度不仅与百度后台内容可以通用,而且做到了很好的用品

对话小度科技CEO景鲲:小度的目标并不是立刻赚钱

记者 | 崔鹏在今年的百度世界大会上,百度集团副总裁、百度智能生活事业群组(SLG)总经理、小度科技CEO景鲲宣布推出小度4K巨屏电视V86。在先后发布智能旋转屏和智能耳机之后,百度正式进入智能电视领域。“我之前说过,我们的野心不止那么一

当小度超越小度

小度已经不是原来的小度了。 在今年百度世界大会上,小度科技再度带来了一大批产品更新,其中不仅包括TWS耳机、词典笔、添添智能旋转屏等多款硬件新品,还有备受业内关注的86寸巨屏电视,杀入大屏这一红海赛道。 小度此举既向产业进一步展示了自己的硬

小辣椒发布智能音箱S1,取名小度,你叫百度怎么想?

4月26日,在联通众筹6.0展会上,小辣椒携人工智能新品智能音箱S1亮相,震撼全场。它到底带给大家哪些惊喜呢?小辣椒智能音箱S1于今日正式发布,不如我们一起来了解一下。智能音箱S1采用圆柱形设计,机身精致小巧,流畅触感,纯白色的时尚外形可融

谁是最强大屏智能音箱?天猫精灵CC10与小度在家X8全面对比评测

最近这几年智能音箱成为了智能硬件领域的宠儿,不少互联网大企业都推出了自家的主打产品,其中最受人关注的就要数天猫精灵与小度音箱了。天猫精灵是基于阿里巴巴人工智能实验室开发的智能语音助手,已连续数个季度领跑国内销量,而小度音箱由于冠名了不少热门

四大智能音箱功能解析:小度人性化满满,天猫精灵应用协调不到位

动动嘴就能控制家电,不用开手机就能为你讲解天气状况,想听音乐只要说一句话就可以……放在以前这些“梦幻”般的体验很难实现,但是有了智能音箱之后这一切都变得简单了。据有关机构统计显示,2017年全球智能音箱销量就已经突破了3000万台,逐渐成为

天猫精灵与小度音箱的中场战事:百度景鲲与阿里浅雪的正面PK

2017年7月,正是国内智能音箱战火烧得最旺之时,全民为之疯狂。随着亚马逊Echo在海外市场爆红,国内智能音箱热潮也汹涌而至,上百家企业争相涌入,京东、小米、联想、科大讯飞、喜马拉雅、云知声、出门问问等各路玩家疯狂扎堆涌入,瞬间杀成一片新红

百元智能音箱哪家强?小爱音箱mini、天猫精灵方糖、小度音箱对比

随后科技的发展,现在我们生活中的家电变得越来越智能,如今很多产品都接入了互联网,万物互联嘛,利用大数据可以为我们来更好的服务,随之也都开始管他们叫做"智能家居"。无论是我们家中的电视、洗衣机、空调乃至音箱,都纷纷称之以为智能家居产品。今天我

大屏智能音箱该买谁?天猫精灵CC10PK小度智能音箱开箱评测

一、前言 近年来智能音箱发展非常迅速,尤其是带屏幕的智能音箱。它即可听歌、看电影、又能做智能相册、还能辅导孩子功课,讲故事陪伴孩子睡觉。由于疫情的关系,楼主上一年级的儿子已经在家呆了快3个月了。什么时候上课还遥遥无期。目前使用的是之前购买的

友情链接

网址导航 SEO域名抢注宝宝起名网妈妈知道币圈架子鼓培训网希腊旅游网巴中今日新闻网雅安新闻头条网福建旅游网冰岛旅游官网悉尼旅游网凡拓数创股票路特斯纯电超跑户外露营地官网若尔盖草原旅游网儿童玩具批发资讯网三星电脑评测网二手车资讯网英菲尼迪轿车网
物联网技术交流网-智能物联网综合管理平台、全屋智能家居十大品牌、天猫精灵智能家居控制系统、云端物联网管理平台、智能家居品牌排行、物联网龙头企业排名、国内十大物联网平台、小米智能家居代理加盟、华为全屋智能家居加盟费、中国十大智能家居公司排名。
物联网技术交流网 hehuijia.cn ©2022-2028版权所有