_客客新闻网-今日头条热点新闻资讯站

来自科技 1970-01-01 08:00 的文章

“当人们彻底解放了双手之后，就会有神奇的事情发生。”声智科技战略合伙人兼CSO李智勇告诉融中财经。

2014年，亚马逊发布Echo后，国内掀起一阵智能音箱的热潮，它与Siri最大的不同就在于，解决了远场语音交互问题。所谓远场智能语音，简单来讲，当我们坐在客厅沙发上的时候，对着某项家居产品说出一句指令（播放一首歌），就能让电视或机顶盒做出反应。

“Echo出来之后，中国各类科技公司开始对这类智能产品纷纷做出新的期待，大家都不明白未来的智能生活会什么样子，但都明白这是新的趋势，就像当年iphone出现时一样！”

成立于2016年的声智科技，专注声学和人工智能的融合创新，主要提供SoundAI Azero智能操作系统和服务，以及深度结合应用场景的人工智能技术和产品解决方案。像腾讯王者荣耀机器人、小米小爱音箱、天猫精灵魔盒、百度智能音箱、华为荣耀YOYO音箱、联想MINI系列、360智能摄像头、360儿童故事机和陪伴机器人、小米小沐智能马桶盖等多款市场大热产品，均搭载了声智科技SoundAI Azero智能操作系统。

当音箱、机顶盒、机器人等设备越来越频繁地出现在我们的日常生活中，加入语音交互技术后，我们只要“动动嘴”就可以控制一切，不管是音乐电影等内容娱乐，还是开启或关闭控制等基础操作，小巧的智能设备们在生活中越来越多的被利用着，而舒适自然的用户体验，便成为想要挖掘这一市场的科技企业目标。

赛道拥挤、竞争惨烈

智能语音技术的研究是以语音识别技术为开端，可以追溯到20世纪50年代。而伴随近几年人工智能产业的持续火热，以及大量资本进入，在智能语音赛道上不仅诞生了大批明星企业，市场规模也在急剧扩大。相关数据统计显示，2017年全球智能语音市场规模达到110.3亿美元，同比增长30%。2018年，仅中国智能语音市场规模就突破100亿元。

现在，我们看到的市场上绝大多数消费类电子设备，几乎都加上了语音功能，涉及到基础操控、内容选择、游戏办公等众多场景，而机器想要实现智能，首要问题就是要听懂人所说的话。

从智能语音交互的应用场景来看，其主要在两个维度率先实现落地，一个是以智能音箱为核心的智能家居市场持续快速发展，二是正面临产业互联网转型的传统行业，如金融、电力、电信等售前、售后服务中也在更多使用语音交互技术。

按照美国市场调研分析公司Cnanalys报告，全球智能音箱安装总数将从2018年的1.14亿部增长到2019年的2.079亿部，增幅达到82.4%。随着移动互联网、智能家居、汽车、医疗、教育等领域的应用带动，预计2019年中国智能语音市场规模将突破200亿元。也正是因为市场如此巨大，竞争才十分激烈。

只有全栈技术不行，还要有规模化产品验证

从2011年Siri横空出世，各大公司加入语音助手阵列，到亚马逊发布Echo，打响以智能音箱为代表的语音交互硬件时代第一枪，如今的市场已经被各大厂商的智能语音产品和语音操作平台所占据，而对用户而言，交互体验始终才是首要的选择标准。

“我们经常听到一些‘可怕’的新闻报道，某种智能音箱半夜突然响起、自己说话放起歌曲等情景，这些都是与语音交互相关技术有密切联系的。”

李智勇对融中财经介绍，整体语音交互技术链条上包括有五个关键的技术点——唤醒、麦克风阵列、远场语音识别、自然语言处理以及语音合成技术（TTS）。不同的点难度不同。对唤醒来讲，必须解决唤醒率，降低误唤醒率；而麦克风阵列需要不同的硬件匹配对应的环境。如果一个点解决不好，体验就不会好。“把体验和服务做到极致，是我们要做的事情。”

截至目前，声智科技自主研发的SoundAI Azero智能操作系统已经广泛落地于智能家居、汽车、安防、教育、医疗等行业，并经过了数十亿次人机交互真实场景的规模验证，可为家居、办公、车载、可穿戴等20+场景和设备提供高效的人机交互和智能决策能力，并默认集成了信息查询、影音娱乐、IOT控制等200+项常用技能与服务。

以360小水滴智能摄像机为例，声智科技为其提供了消费级智能安防解决方案，包括双工通话，语音识别，婴儿哭声识别，异常声音检测等技术，赋予了智能摄像机双工通话和声音监控能力。小米生态链产品“小沐”智能马桶盖搭载了声智科技为其定制的“在线+离线”融合的远场唤醒识别合二为一的语音交互技术。

再比如，声智为“坚果”智能投影仪提供的远场语音降噪、识别、唤醒技术，搭配4麦麦克风阵列，在家居噪声环境下依然可以实现无障碍唤醒，一句“坚果坚果”可在5m范围内实现呼叫并下达指令，语音直接搜索影音资源、生活资讯等内容，控制暂停、播放、快进快退等功能，更可以语音切换正投、背投两种投影方式，真正实现人声远程自由操作。

整体来讲，从最初选择智能音箱，帮助像小米（音箱）这类企业生产行业的标杆性产品，到后来将语音交互产品品类扩大、场景扩充，再把单独的语音技术集合成完整系统。声智科技正在构建并打造自己技术特色的服务和壁垒。

李智勇称，面对激烈的市场竞争和角逐，我们必须有过硬的技术，但并不是说有全栈技术就好，还要经过大规模的产品验证；此外，创新企业还必须要明确自己擅长的技术特点究竟是什么。“因为客户多，产品品类多，有些需要数据驱动的东西，如果没有数据识别率会很低。声智对复杂的声学环境处理更加擅长，而且我们有针对场景的数据处理能力。”

专注系统化和平台化，连接产业上下游

从2018年上半年开始，国内数家语音技术创业公司陆续推出了AI语音专用芯片。云知声发布面向物联网领域AI系列芯片UniOne以及第一代“雨燕”；出门问问在北京也发布AI语音芯片模组问芯Mobvoi A1；随后Rokid在杭州发布AI语音专用芯片KAMINO18。

但声智对于芯片的态度却是：“AI芯片解决特定产品问题，而通用芯片解决通用问题。这属于不同人选择做不同的事。声智科技的路线类似于亚马逊，不同的设备接进来要有不同的协议，不同的技能开发也有不同的协议，我们的原则是在设备端往简单了做，而其他更多复杂的东西搬到云上。”李智勇对融中财经强调。

有人认为，目前“端”上的计算量是不足的，为了解决AIoT问题所以需要专用芯片，这在某些场景下是成立的。比如视觉识别，有时候带宽不够，传输量不够，尤其是实时的3D数据，需要端上处理部分数据。但在声智，云端已经可以实现基本的数据处理。

比如，要求播放刘德华的歌，歌单里可能20首歌，下一首的维护是在端上还是在云上？我们就会把这些东西都放在云上，设备端搜到下一首的时候，只负责播放，我们认为更多的东西应该是放在云上。“声智科技要做中国版的Alexa。”

除此之外，当市场上众多人工智能领域独角兽纷纷做起产业投资，企图扩展生态时，声智科技的选择再一次显得“另类”。

“本质上讲，声智科技有很好的技术，接下来要做的是系统化和平台化。我们希望服务更多厂商，但这距离生态化还很远。”李智勇告诉融中财经，声智科技还是一家创业公司，创业公司的资源、人力都是有限的，企业如果想把服务做到极致就必须特别专注，不可能面面俱到。

“我们定位是以技术为主的平台服务商，未来，我们上游要链接各类设备厂商，比如手机、平板、音箱以及白色家电、电视盒子、机器人、VR/AR等设备，下游要连接的则是像歌曲、相声、天气预报、新闻等通用内容厂商，涵盖各种生活化智能场景。这是很难的一条路，但我们必须这么做。平台必须是连接两端，他们有产品，我们有的则是技术和服务。”

升级的老设备，才是未来更大的市场

从遥控按键到触屏控制再到语音交互，事实上改变的并不仅仅是人们的控制方式，而是在重新构建人和机器的全新关系。谈到这两年的市场变化，李智勇称，主要体现在两方面。

首先，从用户角度来看，人们对于语音交互的接受度越来越高，交互次数和轮次也越来越多，这是用户习惯改变的过程。“从技术到产品再到体验是一种循环。从行业来看，第一个循环是音箱打造的，从用户知道这个东西到习惯的建立，之后产品品类进一步扩宽，致使用户体验越来越好，这是体验循环放大的一个过程。”

其次，从产品端看，语音交互产品的创新，一类是新设备的出现，包括智能音箱、VR/AR等，增速最快的就是智能音箱和airpod耳机，两者都是语音交互驱动的。而另一类是基于老设备的升级创新，语音作为新的功能被加进去之后出现的“新物种”，比如智能灯、智能马桶、智能手办，而这才是一个新的巨大市场，增长曲线更加明显。

“与此同时，5G时代的到来，也让很多东西变成现实”李智勇告诉融中财经。

“移动互联网发展到当下阶段，红利渐渐消失，在这种时间节点上，从业者其实是痛苦的，因为产品想要获得新的快速增长很难。任何事物发展到一定阶段，一定会有新的东西来打破原有的平衡。而很多人现在迷茫的是，这个新东西到底是什么？特别哲学地讲，我们相信，这个世界是持续往前的，不是静止不动的。”

上市是自然结果，先把技术和服务做扎实

天眼查显示，2018年12月，声智科技完成2亿人民币B轮融资，由毅达资本领投，峰瑞资本、正居资本跟投，这也是声智科技四次融资中金额最大的一次。2016年12月，声智曾完成1600万Pre-A轮；2017年10月完成近亿元A轮融资，而公司成立之初便获得过峰瑞资本的天使投资。

对于投资方选择，“我们最关注的其实是战略认同，投资人认可我们正在做的这件事的未来价值”。当问到新一轮的融资时，李智勇也透露，除了双方对市场的认知匹配为第一优先级外，声智科技坚持关注国内资本市场。

“对未来上市而言，声智科技还是会优先选择国内上市，比如科创板。”

上市是企业发展到一定阶段的自然结果。“但对我们而言，现在首要任务是把技术和服务做扎实，一定程度上，上市是一个自然结果。不能反过来讲，为了上市我们要做什么特别的事情。坦率讲，市场和行业要向前走，必须有人真真实实解决一些问题”。