来自 科技 1970-01-01 08:00 的文章

“当人们彻底解放了双手之后,就会有神奇的事情发生。”声智科技战略合伙人兼CSO李智勇告诉融中财经。

2014年,亚马逊发布Echo后,国内掀起一阵智能音箱的热潮,它与Siri最大的不同就在于,解决了远场语音交互问题。所谓远场智能语音,简单来讲,当我们坐在客厅沙发上的时候,对着某项家居产品说出一句指令(播放一首歌),就能让电视或机顶盒做出反应。

“Echo出来之后,中国各类科技公司开始对这类智能产品纷纷做出新的期待,大家都不明白未来的智能生活会什么样子,但都明白这是新的趋势,就像当年iphone出现时一样!”

成立于2016年的声智科技,专注声学和人工智能的融合创新,主要提供SoundAI Azero智能操作系统和服务,以及深度结合应用场景的人工智能技术和产品解决方案。像腾讯王者荣耀机器人、小米小爱音箱、天猫精灵魔盒、百度智能音箱、华为荣耀YOYO音箱、联想MINI系列、360智能摄像头、360儿童故事机和陪伴机器人、小米小沐智能马桶盖等多款市场大热产品,均搭载了声智科技SoundAI Azero智能操作系统。

当音箱、机顶盒、机器人等设备越来越频繁地出现在我们的日常生活中,加入语音交互技术后,我们只要“动动嘴”就可以控制一切,不管是音乐电影等内容娱乐,还是开启或关闭控制等基础操作,小巧的智能设备们在生活中越来越多的被利用着,而舒适自然的用户体验,便成为想要挖掘这一市场的科技企业目标。

赛道拥挤、竞争惨烈

智能语音技术的研究是以语音识别技术为开端,可以追溯到20世纪50年代。而伴随近几年人工智能产业的持续火热,以及大量资本进入,在智能语音赛道上不仅诞生了大批明星企业,市场规模也在急剧扩大。相关数据统计显示,2017年全球智能语音市场规模达到110.3亿美元,同比增长30%。2018年,仅中国智能语音市场规模就突破100亿元。

现在,我们看到的市场上绝大多数消费类电子设备,几乎都加上了语音功能,涉及到基础操控、内容选择、游戏办公等众多场景,而机器想要实现智能,首要问题就是要听懂人所说的话。

从智能语音交互的应用场景来看,其主要在两个维度率先实现落地,一个是以智能音箱为核心的智能家居市场持续快速发展,二是正面临产业互联网转型的传统行业,如金融、电力、电信等售前、售后服务中也在更多使用语音交互技术。

按照美国市场调研分析公司Cnanalys报告,全球智能音箱安装总数将从2018年的1.14亿部增长到2019年的2.079亿部,增幅达到82.4%。随着移动互联网、智能家居、汽车、医疗、教育等领域的应用带动,预计2019年中国智能语音市场规模将突破200亿元。也正是因为市场如此巨大,竞争才十分激烈。

只有全栈技术不行,还要有规模化产品验证

从2011年Siri横空出世,各大公司加入语音助手阵列,到亚马逊发布Echo,打响以智能音箱为代表的语音交互硬件时代第一枪,如今的市场已经被各大厂商的智能语音产品和语音操作平台所占据,而对用户而言,交互体验始终才是首要的选择标准。

“我们经常听到一些‘可怕’的新闻报道,某种智能音箱半夜突然响起、自己说话放起歌曲等情景,这些都是与语音交互相关技术有密切联系的。”

李智勇对融中财经介绍,整体语音交互技术链条上包括有五个关键的技术点——唤醒、麦克风阵列、远场语音识别、自然语言处理以及语音合成技术(TTS)。不同的点难度不同。对唤醒来讲,必须解决唤醒率,降低误唤醒率;而麦克风阵列需要不同的硬件匹配对应的环境。如果一个点解决不好,体验就不会好。“把体验和服务做到极致,是我们要做的事情。”

截至目前,声智科技自主研发的SoundAI Azero智能操作系统已经广泛落地于智能家居、汽车、安防、教育、医疗等行业,并经过了数十亿次人机交互真实场景的规模验证,可为家居、办公、车载、可穿戴等20+场景和设备提供高效的人机交互和智能决策能力,并默认集成了信息查询、影音娱乐、IOT控制等200+项常用技能与服务。

以360小水滴智能摄像机为例,声智科技为其提供了消费级智能安防解决方案,包括双工通话,语音识别,婴儿哭声识别,异常声音检测等技术,赋予了智能摄像机双工通话和声音监控能力。小米生态链产品“小沐”智能马桶盖搭载了声智科技为其定制的“在线+离线”融合的远场唤醒识别合二为一的语音交互技术。

再比如,声智为“坚果”智能投影仪提供的远场语音降噪、识别、唤醒技术,搭配4麦麦克风阵列,在家居噪声环境下依然可以实现无障碍唤醒,一句“坚果坚果”可在5m范围内实现呼叫并下达指令,语音直接搜索影音资源、生活资讯等内容,控制暂停、播放、快进快退等功能,更可以语音切换正投、背投两种投影方式,真正实现人声远程自由操作。

整体来讲,从最初选择智能音箱,帮助像小米(音箱)这类企业生产行业的标杆性产品,到后来将语音交互产品品类扩大、场景扩充,再把单独的语音技术集合成完整系统。声智科技正在构建并打造自己技术特色的服务和壁垒。

李智勇称,面对激烈的市场竞争和角逐,我们必须有过硬的技术,但并不是说有全栈技术就好,还要经过大规模的产品验证;此外,创新企业还必须要明确自己擅长的技术特点究竟是什么。“因为客户多,产品品类多,有些需要数据驱动的东西,如果没有数据识别率会很低。声智对复杂的声学环境处理更加擅长,而且我们有针对场景的数据处理能力。”

专注系统化和平台化,连接产业上下游

从2018年上半年开始,国内数家语音技术创业公司陆续推出了AI语音专用芯片。云知声发布面向物联网领域AI系列芯片UniOne以及第一代“雨燕”;出门问问在北京也发布AI语音芯片模组问芯Mobvoi A1;随后Rokid在杭州发布AI语音专用芯片KAMINO18。

但声智对于芯片的态度却是:“AI芯片解决特定产品问题,而通用芯片解决通用问题。这属于不同人选择做不同的事。声智科技的路线类似于亚马逊,不同的设备接进来要有不同的协议,不同的技能开发也有不同的协议,我们的原则是在设备端往简单了做,而其他更多复杂的东西搬到云上。”李智勇对融中财经强调。

有人认为,目前“端”上的计算量是不足的,为了解决AIoT问题所以需要专用芯片,这在某些场景下是成立的。比如视觉识别,有时候带宽不够,传输量不够,尤其是实时的3D数据,需要端上处理部分数据。但在声智,云端已经可以实现基本的数据处理。

比如,要求播放刘德华的歌,歌单里可能20首歌,下一首的维护是在端上还是在云上?我们就会把这些东西都放在云上,设备端搜到下一首的时候,只负责播放,我们认为更多的东西应该是放在云上。“声智科技要做中国版的Alexa。”

除此之外,当市场上众多人工智能领域独角兽纷纷做起产业投资,企图扩展生态时,声智科技的选择再一次显得“另类”。

“本质上讲,声智科技有很好的技术,接下来要做的是系统化和平台化。我们希望服务更多厂商,但这距离生态化还很远。”李智勇告诉融中财经,声智科技还是一家创业公司,创业公司的资源、人力都是有限的,企业如果想把服务做到极致就必须特别专注,不可能面面俱到。

“我们定位是以技术为主的平台服务商,未来,我们上游要链接各类设备厂商,比如手机、平板、音箱以及白色家电、电视盒子、机器人、VR/AR等设备,下游要连接的则是像歌曲、相声、天气预报、新闻等通用内容厂商,涵盖各种生活化智能场景。这是很难的一条路,但我们必须这么做。平台必须是连接两端,他们有产品,我们有的则是技术和服务。”

升级的老设备,才是未来更大的市场

从遥控按键到触屏控制再到语音交互,事实上改变的并不仅仅是人们的控制方式,而是在重新构建人和机器的全新关系。谈到这两年的市场变化,李智勇称,主要体现在两方面。

首先,从用户角度来看,人们对于语音交互的接受度越来越高,交互次数和轮次也越来越多,这是用户习惯改变的过程。“从技术到产品再到体验是一种循环。从行业来看,第一个循环是音箱打造的,从用户知道这个东西到习惯的建立,之后产品品类进一步扩宽,致使用户体验越来越好,这是体验循环放大的一个过程。”

其次,从产品端看,语音交互产品的创新,一类是新设备的出现,包括智能音箱、VR/AR等,增速最快的就是智能音箱和airpod耳机,两者都是语音交互驱动的。而另一类是基于老设备的升级创新,语音作为新的功能被加进去之后出现的“新物种”,比如智能灯、智能马桶、智能手办,而这才是一个新的巨大市场,增长曲线更加明显。

“与此同时,5G时代的到来,也让很多东西变成现实”李智勇告诉融中财经。

“移动互联网发展到当下阶段,红利渐渐消失,在这种时间节点上,从业者其实是痛苦的,因为产品想要获得新的快速增长很难。任何事物发展到一定阶段,一定会有新的东西来打破原有的平衡。而很多人现在迷茫的是,这个新东西到底是什么?特别哲学地讲,我们相信,这个世界是持续往前的,不是静止不动的。”

上市是自然结果,先把技术和服务做扎实

天眼查显示,2018年12月,声智科技完成2亿人民币B轮融资,由毅达资本领投,峰瑞资本、正居资本跟投,这也是声智科技四次融资中金额最大的一次。2016年12月,声智曾完成1600万Pre-A轮;2017年10月完成近亿元A轮融资,而公司成立之初便获得过峰瑞资本的天使投资。

对于投资方选择,“我们最关注的其实是战略认同,投资人认可我们正在做的这件事的未来价值”。当问到新一轮的融资时,李智勇也透露,除了双方对市场的认知匹配为第一优先级外,声智科技坚持关注国内资本市场。

“对未来上市而言,声智科技还是会优先选择国内上市,比如科创板。”

上市是企业发展到一定阶段的自然结果。“但对我们而言,现在首要任务是把技术和服务做扎实,一定程度上,上市是一个自然结果。不能反过来讲,为了上市我们要做什么特别的事情。坦率讲,市场和行业要向前走,必须有人真真实实解决一些问题”。

热门文章