清听声

行业动态
您当前所在的位置:首页 >> 清听动态 >> 行业动态

从GUI到AUI:清听声学如何用声音重塑人机交互

日期:2026-04-02 15:39:26 发布者:本站

  在计算机发展的每一个阶段,人机交互方式的变化,往往决定了技术演进的方向!

  早期计算机依赖命令行(CLI),用户需通过复杂指令与机器沟通。随后,图形用户界面(GUI)的出现,让人们通过窗口、图标和菜单完成操作,极大降低技术门槛。几十年来,GUI 一直是智能终端最核心的人机交互方式。

  但随着人工智能与空间计算时代的到来,这一模式正在迎来新的变化。

  当设备数量越来越多、屏幕越来越分散、计算能力越来越强,人机交互重心正在从“视觉界面”转向“自然交互”,在这样的时代背景下,一种新的交互范式正在出现——AUI(Audio User Interface,声学用户界面)。


1.jpg


  AUI概念由清听声学率先提出。它不是简单的语音控制升级,而是代表一种以声音为核心媒介的人机交互方式,通过全球领先的定向声技术与AI无感拾音技术,让设备精准发声、准确聆听,并围绕声音完成交互闭环。

  如果说 GUI 是“用眼睛操作设备”,那么 AUI 则是让声音成为新的交互入口。


  AUI的三大交互变革

  AUI的核心是:让声音像光线一样可控,让交互像对话一样自然。

  在GUI时代,声音是附属品,是提示音、是背景音乐、是嘈杂环境里的干扰项。在AUI框架下,声音则成为主界面,它具备空间指向性、内容私密性、交互双向性三大特征。


从GUI到AUI:清听声学如何用声音重塑人机交互


  从点击界面,到指向声场

  借助定向声场技术,AUI让声音拥有“空间指向性”,声音不再是无差别扩散的背景噪音,而是精准抵达特定用户的私密指令,实现“指哪响哪,谁需谁听”。

  从看屏操作,到听场交互

  AUI解放用户双眼,在AUI构建的场景中,声音承载了位置、距离、身份等信息,人机交互从“视觉独占”转向“多模态感知”,让交互回归人类本能,即倾听与对话。

  从设备界面,到空间界面

  GUI是封闭的,而AUI是开放的,它将整个物理空间转化为交互界面,无论是公共自助服务机上私密的语音交互,还是公共场所的隔声降噪,AUI让声音与公共环境和谐共存。


3.jpg


  AUI的核心技术引擎

  AUI的真正突破,在于构建“说”和“听”的完整闭环。清听声学的核心技术布局不止于发声,更延伸至空间互语音交互,通过定向发声+AI无感拾音双定向语音交互方案,构成AUI的引擎架构。

  定向发声技术,解决“听得清”的问题,通过对发声方向和角度的动态控制,创建专属的个人声场和空间音效,确保声音仅在特定区域内传播,这意味着在一个开放空间中,声音可以被定向到特定的人群或目标区域,而不影响周围的其他人或设备。例如,在公共服务终端,客户可以清楚地听到机器的提示音,而不受周围噪音干扰。

  AI无感拾音技术,则解决“说的清”和“听得懂”的问题,通过多个内置MEMS麦克风,精准捕捉人声,搭载AI算法,有效实现AI回声消除和噪音抑制等功能,声音传输更清晰保真;采用高效的音频处理技术,实现超低延时性能,确保语音实时清晰传输,让每一次沟通都更加自然流畅且无重音干扰。


清听声学双定向语音交互方案


  在 GUI 时代,交互围绕“屏幕界面”展开,而在 AUI 时代,交互开始进入真实空间。通过将定向发声与定向拾音结合,清听声学创造性地提供一种无干扰、高效且精准的音频交互解决方案,形成“说与听”完整、私密且高效的交互闭环。在AUI框架下,用户无需学习界面逻辑,无需适应设备特性,只需以最自然的语音方式表达意图,系统即可在专属声场内完成精准响应,不仅提升使用体验,还最大程度减少环境噪音干扰,适应日益复杂的现代工作与生活环境。


  AUI的产业实践

  从 GUI 到 AUI,并不是实验室里的概念演进,而是一种正在发生的产业实践。GUI 解决的是“如何操作设备”,而 AUI 关注的是“人与设备如何自然沟通”。清听声学基于定向发声+定向拾音双定向语音交互方案,已在多个真实场景中实现 AUI 的规模化应用。

  自助服务终端

  在银行、政务大厅、医院挂号等自助服务场景,清听声学定向发声技术将操作指引与语音播报精准锁定用户,邻位办理者互不干扰,开放式大厅也可获得私密交互体验。搭载AI语音助手交互终端,通过定向拾音技术精准捕捉用户指令,即使在背景嘈杂环境,系统仍能清晰识别、即时响应,用户无需俯身凑近、无需刻意提高音量重复指令,即可自然完成业务办理。


自助服务终端集成清听声学定向发声技术示意图


  博物馆与科技馆

  在博物馆或科技馆等展览空间,清听声学定向发声技术能够将展品解说精准地传递至特定位置,而不影响其他游客的参观体验,搭载AI 数字人的交互大屏,通过定向拾音技术可在游客与数字人之间实现高效对话,避免背景噪音干扰,有效提升互动体验。


展览馆的清听声学定向发声技术示意图


  开放式办公场景

  在开放式办公环境中,噪音往往成为员工专注工作和沟通的障碍。清听声学定向发声技术能够精准传递语音信息,减少办公室内不同工位之间的声音干扰;同时,定向拾音技术能够确保语音指令或会议记录的准确捕捉,提升工作及沟通效率。


开放式办公场景应用定向发声示意图


  AUI的提出者,为什么是清听声学?

  从 GUI 到 AUI,并不是简单的技术升级,而是一种交互范式的演进。然而,提出新的交互范式,需要的不仅是概念,更需要长期技术积累与产业实践的支撑。

  清听声学成立于2015年,是中国科学院声学研究所产业化平台,国家级专精特新“小巨人”企业、国家高新技术企业。十余年来,公司始终专注于定向声学技术创新,并推动其从实验室走向大规模商业应用。


清听声学定义AI声学全链生态


  截至目前,清听声学已完成定向声技术的三次关键技术迭代,累计拥有450+项知识产权与250+项核心技术专利,并建成全球首条聚音屏柔性中试产线。从定向声技术发明、产品工程化,到规模化商业落地,清听声学构建完整的技术体系与产业能力。


清听声学研发生产基地


  当行业仍然围绕屏幕参数和触控体验展开竞争时,清听声学已经率先完成显示技术与声学技术的深度融合——让屏幕不仅可以“看见”,更可以“发声”。这不是功能叠加,而是交互结构的重构。

  正是基于这一持续的技术创新与产业实践,清听声学率先提出AUI(声学用户界面) 概念,这是一种对未来人机交互形态的前瞻判断。当交互从“屏幕界面”走向“空间声场”,AUI 正在成为连接人与智能世界的重要入口。

  AUI的提出,是技术突破的水到渠成,更是清听声学对产业未来的先行布局。


一键拨号 一键导航