云知声联合创始人李霄寒:云知声 AIoT 芯片如何加速产品智能化的步伐

近日,云知声宣布在其物联网 AI 芯片 UniOne 系列的第一款芯片——“雨燕”上,实现了智能音箱和智能家居的全栈语音交互解决方案,并将该方案开源。

在智能音箱和智能家居这个赛道上,去年还在巨头的引领下一片“百箱争鸣”场面,今年恐怕已经升级到“方案齐放”了,互联网平台商、语音技术软硬件服务商、内容和云服务商、芯片商,都纷纷推出了支持设备智能化升级的方案。

对于很多产品厂商和开发者们来说,那些秀肌肉的 Demo 解决方案看的也不少了,云知声即将发布的这个智能音箱和智能家居的开源方案,是真开源还是伪开源?开源后的技术支持是否能跟上?开发者的工作量有多大?方案性价比是否有诱惑力?是否真的可以加速智能产品量产出货?

我们把这些疑问带给了云知声联合创始人、芯片负责人李霄寒博士,他饶有兴趣的为我们做了一一解答(把如上的疑问一一怼了回去)。交谈中,他传递出了很多对于行业的观察,对客户需求的揣摩,以及云知声多年来在行业市场的探索。

yun2018091001

△ 云知声联合创始人、芯片负责人李霄寒博士

撇弃对这一开源方案进行范式化的介绍,我们提取了交谈中的精华内容,整理成十问的形式,分享给大家。如果希望系统了解这一开源方案,可以点击此处报名参加 9 月 12 日在深圳举办的交流会。

1 语音大平台纷纷开放,二次开发却依然很难,AIoT 落地为什么会有这么多挑战?

早在去年 BAT 纷纷推出 AI 开放平台的时候,深圳湾曾采访了多家方案商,了解他们对于平台赋能和 AI 落地的看法。普遍的意见是,很多 AI 方案看起来很美好,落地却并不轻松。

对于 AIoT 落地的挑战,李霄寒做了一番总结:

首先,不像手机,物联网智能终端设备的产品形态碎片化,机器人、音箱、家居产品等等,产品形态异常丰富,通用方案很难做到全品类的适配。其次,物联网行业供应链过于分散,整合是一件费时耗力的事情。而即便是做到了整合,「攒」出来的产品体验又有诸多不可控,二次开发的技术支持跟不上……

尽管市面上有不少 AI 开放平台和方案商,但可定制、体验好、出货快的 AIoT 方案仍然是稀缺资源。

2 既然掌握核心 AI 技术,闭源可以做好的事情,为什么还要推开源方案?

云知声现有的基于硬件模组的 IVM 的整体解决方案已经足够可以支持好客户,为什么还要推出开源方案呢?

李霄寒认为,闭源的方案可控制,有时候可以做的更好。但一方面 AI 原厂不可能服务到所有垂直场景下的头部客户,更不可能服务到那些长尾客户。因此,需要用开源的方式支持他们做二次开发,从而帮助他们以较低的成本实现和闭源方案一样的效果。

此外,“我们希望拥抱更多的合作伙伴,让他们和我们一起,推动设备智能化。而开源恰恰是帮助他们。”

3 源代码开放会到什么程度?

开源后,云知声的核心技术被固化到雨燕 SoC 上,核心之外的能力开放出来,包括与产品相关的部分(云端能力、手机 APP、上层应用、PCBA 等),从而最大程度的帮助合作伙伴去服务更多的长尾客户。

云知声希望尽可能多的开源,既能保证相关技术水准和产品体验,又能够给方案商和合作伙伴以最大的自由度去定制他们的产品。合作伙伴可以基于雨燕的开源方案,修改源代码、命令词、配置、交互逻辑、甚至可以用自己的云、账号系统,以适应自己产品的需求。

yun2018091002

△ 云知声的开源合作模式

虽然开源后将为平台方带来不少潜在客户,其中有可能发展出几个出货量大的客户,做专门支持,“但这并不是云知声做开源方案的根本目的。”李霄寒说,雨燕的开源方案还是为了赋能各领域的合作伙伴,解决各领域的头部客户和长尾客户的 AI 定制化需求而推出的。

同时,云知声的开源方案又是有限度的开源。与硬件有紧密关系的引擎技术并不会全部开源,因为这部分的技术还是有门槛的,文档更新包和 bug 响应需要的技术维护成本很高,客户很难有能力去更新所有的内容,这反而会造成长尾客户很难被支持的问题。但是相应引擎可以通过各种方式包括 OTA 的方式升级,以保持方案指标的先进性。

4 如果只是代码层面的支持,那么语音引擎原厂的 SDK 是不是就足够了?

面向智能产品厂商实现 AI 落地,将牵涉到软件、硬件、系统、芯片等非常多的环节,需要量产化的结构经验、需要对系统做优化、还要在价格和性能平衡的基础上做通用芯片和硬件平台的选型。

同时,物联网芯片、产品形态、使用场景、硬件平台,都是碎片化,很难用一揽子的软件来解决这个问题。用户需求也是多样化的,有的要求成本低,有的要求功耗低,对各种芯片规格的要求差异化非常大。这些都不可能单单从软件层面提升算力来解决。

李霄寒认为,引擎原厂没有足够的硬件、系统和产品经验,没有相应产品的量产落地经验,是无法高效支撑合作伙伴的。“仅提供 SDK 层面的适配和支持,其实对自己的合作伙伴,自己的团队,都是不负责任的。最终大家做了很多合作,可能只是一场热闹,而无法做到量产出货。”

5 开源方案和原有 IVM 整体解决方案有何不同?

云知声面向智能家居行业客户的 IVM 整体解决方案是被领域头部客户量产验证过的,客户反馈意见非常好的方案。云知声希望在确保原有方案质量的前提下,以更有市场竞争力的价格推广到更大的市场,为此采用的技术策略是:

将 IVM 在智能家居和智能音箱场景中积累的经验和参数,融入到自有 AI 芯片 UniOne 的设计中,然后通过芯片把关键部分进行优化,再将芯片之上的全栈语音交互技术进行开源。

yun2018091003

△ 雨燕 SoC 架构

相同之处在于,用的都是同样的技术,“云知声用什么技术支持到客户,云知声的合作伙伴就可以用什么技术支持到他们的客户,不会“内外有别”。”李霄寒说。

6 都在谈全栈,其实基础智能技术都差不多,云知声对全栈的定义是怎样的?

一个普遍的共识是,经过了一年多的市场教育,智能产品厂商和开发者对于各家平台开放的软硬件“标配”已经非常熟悉。所谓的“全栈式语音交互解决方案”可能在技术文档上,看样子都差不多。

然而,技术上的“全栈”是不完备的。在谈到对于“全栈式”的理解时,李霄寒这样认为。“当你面向客户时,并不是拥有技术全栈能力就可以了,客户需要的是方案落地的能力。这就好像是,考生拿着各方面测评数据都很高的试卷,客户可能并不会买单,客户需要的是你能帮他们的产品实现这些数据。”

在云知声看来,全栈不仅包括技术能力,还包括方案能力和落地能力。企业要有地推的服务能力(为客户提供面对面技术支持的能力),要有相应的云端服务对接能力,还要有量产经验。

yun2018091004

△ 云知声的全栈能力

7 开源方案的价格和竞争力如何?

“价格肯定是非常有竞争力的。”李霄寒直接回答。

当供应商比较碎片化的时候,SoC、PCBA、语音引擎、云端解决方案,每一家供应商都会有利润空间的考虑,加在一起的成本,是包含几家的利润空间的。云知声把这些都整合到一起,作为单一的 Turnkey 方案输出,但利润诉求控制在最低,让上下游所有人因此而受益。

从方案本身而言,云知声提供的开源方案的是一个 Turnkey 方案,也就是从最底层到最上层,从芯片端到云端,从 AI 算法引擎到应用程序,都是已经集成完毕的,是一个性能更强大、成本更低、完成度更高、而且具备可定制化能力的方案,在市场上是非常有竞争力的。

8 这个开源方案适用于哪些行业用户?

物联网领域的产品形态是相当丰富的,家电、平板、机器人、扫地机器人…使用场景以及对 AI 的需求也大都不同。光靠一家是很难覆盖所有的行业和领域,需要和合作伙伴一起配合。

而云知声以往在家电领域积累的行业用户,也可以逐步平滑的升级到新的基于雨燕 SoC 的开源方案上来。

9 智能产品厂商在做方案选型时,主要评估标准是什么?

李霄寒给出了三点建议:

从产品的角度,看这个方案是否能满足产品形态、性能、功耗、成本等方面的要求;

看方案商的支持能力,技术支持是否跟的上;

看方案商是否证明过自己,是否有支持客户成功量产落地的经验。

10 在 toB 攻坚战中,如何选择目标市场和目标客户?

李霄寒将云知声行业市场的战略布局简单的概括为:“合纵连横”。

面对市场上方案同质化的现象,云知声通过开放能力,让更多的合作伙伴可以快速拥有云知声的方案能力和服务客户的能力,可以根据各自客户的需求,通过修改源代码做定制化的开发,以满足不同市场和产品的需求。

结语

2012 年成立的云知声,一直致力于将人与机器的语音交互能力,逐步封装成可以调用的产品,并且落地到大众消费的场景中。在过去的几年里,云知声一直在行业一线,为客户做一定的定制化开发,并将积累的全栈方案的能力,逐渐硬件化、芯片化。

今年 5 月发布的首款 AI 芯片,标志着云知声已经把 AI 技术产品标准化。

如今,云知声又把这套标准化的 AI 技术开源,让它具备可定制能力。对于智能产品厂商和开发者而言,这个基于雨燕 SoC 的可定制化开源方案,值得期待。

未经允许不得转载:数智网 » 云知声联合创始人李霄寒:云知声 AIoT 芯片如何加速产品智能化的步伐

分享到: