1 月 13 日,小聆 AI v2.0 正式发布!这一次升级,并非简单的功能叠加,而是一次面向真实应用场景的系统进化——让大模型的能力,真正“好用、可控、可规模化”,走进更多终端设备。

从「能用」到「好用」小聆 AI,正在成为大模型语音交互的基础设施

小聆 AI 是一款面向大模型语音交互打造的平台,通过可视化、低门槛的方式,让大模型能力更高效地赋能到海量终端设备中,帮助合作伙伴打造真正有差异化的产品体验。自发布以来,小聆 AI 已成熟应用于 AI 玩具、陪伴机器人、AI 闹钟 等多类型产品,并在真实用户环境中持续打磨能力。而这一次 v2.0 的升级,核心只有一个关键词:【真实场景】基于真实交互中遇到的问题,v2.0 对能力进行了系统级重构,带来了三大核心能力升级。

三大核心能力升级

面向真实交互,解决真实问题

一、自定义热词让垂直领域语音问答,真正“可信”

在实际语音交互中,专业术语、新词、人名、组织名往往是识别“重灾区”。比如网络新梗“爱你老己”,被识别成“爱你老几”,上下文再怎么追问,也很难纠正;在医疗、健康等专业场景中,专业词汇一旦识别错误,直接影响体验甚至可信度。

小聆 AI 2.0 全新上线自定义热词能力:

支持上传 专业知识文档 到知识库,配置1秒生效

支持 产品级 / 用户级配置,灵活适配不同使用场景

通过热词能力,整体识别准确率从 79% 提升至 95%。

在专业问答的实际应用场景中,小聆 AI 2.0 实现了两点关键突破:

专业词语准确识别:语音交互场景下,专业词汇精准识别才能保证问答效果。

可信的问答交互:能依托专业的知识库进行回复,信息不足不“瞎编”。

真实应用场景升级:垂类领域专业问答

例如在医疗健康场景中,通过预设药物名称热词,用户询问药物用量时,精准匹配专业名词,能有效避免错误识别,有效降低交互风险;在教育场景中,专业课程名、学科术语、人物与事件名称可被纳入热词库,帮助 AI 准确理解学生提问,提升学习辅导与知识问答的准确性;在工业或企业应用中,通过预置设备型号、工艺参数、操作指令等热词,语音交互可稳定应用于巡检、运维与流程查询等环节。

这让语音不再仅限于日常生活的交流,而是具备进入更多专业垂直场景的能力,成为可信、可扩展的交互入口。

自定义唤醒词1 分钟,免费打造IP专属的 AI 称呼

在传统语音方案中,唤醒词的定制往往意味着周期长、成本高、门槛高。常规定制通常需要 2–3 个月的训练周期,并伴随较高的模型训练与适配成本,这让很多希望打造“品牌专属 AI 体验”的产品,止步于想法。

小聆 AI 2.0 对唤醒词能力进行了系统升级:通过独家算法,支持 1 分钟免费生成自定义唤醒词,准确率可达 93%,显著高于行业平均水平。品牌方与开发者可以快速为产品、IP 或角色打造专属称呼,而无需承担传统定制带来的高成本与长周期。

真实应用场景升级:IP 陪伴机器人

在 IP 陪伴机器人、智能玩具等场景中,自定义唤醒词成为构建沉浸式体验的关键入口。例如用户可以直接使用“曼波曼波”“贾维斯”“迪迦”等角色名称进行唤醒,每一次呼唤都更像是在与具体角色对话,而非与一个通用语音助手交流。

结合 声音复刻能力,唤醒与应答音色高度贴合角色设定;再配合 角色知识库,系统可在对话中持续保持角色人设与世界观一致性。在真实使用中,这类设备不再只是“能对话”,而是具备持续陪伴属性的角色型 AI 交互体。

多模态绘图模型所言即所得,让创意被即时理解

多模态生成并不只是“画一张图”,更重要的是是否真正理解用户表达的意图。在实际交互中,用户往往通过非常简短、模糊的语言描述自己的想法,这对模型的语义理解与主体一致性提出了更高要求。

小聆 AI 2.0 全面升级多模态绘图能力:

所言即所得:超强主体一致性,秒级生图;

一句话实现精准修图百变风格库:专业风格触手可及;一句话生成高品质感的图像

真实应用场景升级:儿童陪伴与内容创作儿童语音打印机

在儿童陪伴与教育类场景中,多模态绘图能力被广泛应用于理解与表达的辅助。当孩子用“天马行空”的语言描述想法时,系统可以即时将语言转化为图像,帮助孩子理解抽象概念、词语含义或故事情节,使学习过程更加直观、有参与感,寓教于乐。

配合独家人声滤噪算法,系统可通过声纹识别儿童身份,在交互过程中自动过滤其他人声干扰,确保生成内容始终围绕当前用户,维持沉浸式体验。在内容创作类设备或互动终端中,多模态绘图则成为一种低门槛的创作工具,让用户无需复杂操作,仅通过语言即可完成高质量内容生成。

云端芯,一体化加速落地

从能力到方案,一步到位

一、小聆AI 2.0 | 开放灵活的整体方案架构

支持接入第三方大模型,灵活可选。

内置多类信源、工具与语音能力。为不同场景快速构建差异化体验。

Arcs-mini 开发套件 | 开箱即用的AI硬件支持

搭载聆思新一代六合一高性能芯片——ARCS系列。

开箱即用,出厂默认对接小聆AI 2.0。

LSPlatform | 完备的智能硬件管理平台

小聆AI 已支持云端自定义编排,开发者可灵活做二次开发或切换第三方模型。

支持MCP形式快速对接企业内部服务。

支持Token / license计费模式,请求数据、账单明细,一目了然。

小聆 AI 小程序 | 友好完善的产品体验

支持AI 能力:声音复刻、声纹识别、长期记忆、用户画像构建、人声滤噪、热词配置、自定义唤醒词等。

提供API接口和源码二次开发。

免责声明:凡注明为其它来源的信息均转自其它平台,目的在于传递更多信息,并不代表本站观点及立场。若有侵权或异议请联系我们处理。

相关推荐