从GUI到AUI：清听声学如何用声音重塑人机交互-行业动态-清听声学科技-定向音频&声学创新应用领军者

从GUI到AUI：清听声学如何用声音重塑人机交互

日期：2026-04-02 15:39:26 发布者：本站

返回列表

　　在计算机发展的每一个阶段，人机交互方式的变化，往往决定了技术演进的方向！

　　早期计算机依赖命令行（CLI），用户需通过复杂指令与机器沟通。随后，图形用户界面（GUI）的出现，让人们通过窗口、图标和菜单完成操作，极大降低技术门槛。几十年来，GUI 一直是智能终端最核心的人机交互方式。

　　但随着人工智能与空间计算时代的到来，这一模式正在迎来新的变化。

　　当设备数量越来越多、屏幕越来越分散、计算能力越来越强，人机交互重心正在从“视觉界面”转向“自然交互”，在这样的时代背景下，一种新的交互范式正在出现——AUI（Audio User Interface，声学用户界面）。

　　AUI概念由清听声学率先提出。它不是简单的语音控制升级，而是代表一种以声音为核心媒介的人机交互方式，通过全球领先的定向声技术与AI无感拾音技术，让设备精准发声、准确聆听，并围绕声音完成交互闭环。

　　如果说 GUI 是“用眼睛操作设备”，那么 AUI 则是让声音成为新的交互入口。

　　AUI的三大交互变革

　　AUI的核心是：让声音像光线一样可控，让交互像对话一样自然。

　　在GUI时代，声音是附属品，是提示音、是背景音乐、是嘈杂环境里的干扰项。在AUI框架下，声音则成为主界面，它具备空间指向性、内容私密性、交互双向性三大特征。

从GUI到AUI：清听声学如何用声音重塑人机交互

　　从点击界面，到指向声场

　　借助定向声场技术，AUI让声音拥有“空间指向性”，声音不再是无差别扩散的背景噪音，而是精准抵达特定用户的私密指令，实现“指哪响哪，谁需谁听”。

　　从看屏操作，到听场交互

　　AUI解放用户双眼，在AUI构建的场景中，声音承载了位置、距离、身份等信息，人机交互从“视觉独占”转向“多模态感知”，让交互回归人类本能，即倾听与对话。

　　从设备界面，到空间界面

　　GUI是封闭的，而AUI是开放的，它将整个物理空间转化为交互界面，无论是公共自助服务机上私密的语音交互，还是公共场所的隔声降噪，AUI让声音与公共环境和谐共存。

　　AUI的核心技术引擎

　　AUI的真正突破，在于构建“说”和“听”的完整闭环。清听声学的核心技术布局不止于发声，更延伸至空间互语音交互，通过定向发声+AI无感拾音双定向语音交互方案，构成AUI的引擎架构。

　　定向发声技术，解决“听得清”的问题，通过对发声方向和角度的动态控制，创建专属的个人声场和空间音效，确保声音仅在特定区域内传播，这意味着在一个开放空间中，声音可以被定向到特定的人群或目标区域，而不影响周围的其他人或设备。例如，在公共服务终端，客户可以清楚地听到机器的提示音，而不受周围噪音干扰。

　　AI无感拾音技术，则解决“说的清”和“听得懂”的问题，通过多个内置MEMS麦克风，精准捕捉人声，搭载AI算法，有效实现AI回声消除和噪音抑制等功能，声音传输更清晰保真；采用高效的音频处理技术，实现超低延时性能，确保语音实时清晰传输，让每一次沟通都更加自然流畅且无重音干扰。

清听声学双定向语音交互方案

　　在 GUI 时代，交互围绕“屏幕界面”展开，而在 AUI 时代，交互开始进入真实空间。通过将定向发声与定向拾音结合，清听声学创造性地提供一种无干扰、高效且精准的音频交互解决方案，形成“说与听”完整、私密且高效的交互闭环。在AUI框架下，用户无需学习界面逻辑，无需适应设备特性，只需以最自然的语音方式表达意图，系统即可在专属声场内完成精准响应，不仅提升使用体验，还最大程度减少环境噪音干扰，适应日益复杂的现代工作与生活环境。

　　AUI的产业实践

　　从 GUI 到 AUI，并不是实验室里的概念演进，而是一种正在发生的产业实践。GUI 解决的是“如何操作设备”，而 AUI 关注的是“人与设备如何自然沟通”。清听声学基于定向发声+定向拾音双定向语音交互方案，已在多个真实场景中实现 AUI 的规模化应用。

　　自助服务终端

　　在银行、政务大厅、医院挂号等自助服务场景，清听声学定向发声技术将操作指引与语音播报精准锁定用户，邻位办理者互不干扰，开放式大厅也可获得私密交互体验。搭载AI语音助手交互终端，通过定向拾音技术精准捕捉用户指令，即使在背景嘈杂环境，系统仍能清晰识别、即时响应，用户无需俯身凑近、无需刻意提高音量重复指令，即可自然完成业务办理。

自助服务终端集成清听声学定向发声技术示意图

　　博物馆与科技馆

　　在博物馆或科技馆等展览空间，清听声学定向发声技术能够将展品解说精准地传递至特定位置，而不影响其他游客的参观体验，搭载AI 数字人的交互大屏，通过定向拾音技术可在游客与数字人之间实现高效对话，避免背景噪音干扰，有效提升互动体验。

展览馆的清听声学定向发声技术示意图

　　开放式办公场景

　　在开放式办公环境中，噪音往往成为员工专注工作和沟通的障碍。清听声学定向发声技术能够精准传递语音信息，减少办公室内不同工位之间的声音干扰；同时，定向拾音技术能够确保语音指令或会议记录的准确捕捉，提升工作及沟通效率。

开放式办公场景应用定向发声示意图

　　AUI的提出者，为什么是清听声学？

　　从 GUI 到 AUI，并不是简单的技术升级，而是一种交互范式的演进。然而，提出新的交互范式，需要的不仅是概念，更需要长期技术积累与产业实践的支撑。

　　清听声学成立于2015年，是中国科学院声学研究所产业化平台，国家级专精特新“小巨人”企业、国家高新技术企业。十余年来，公司始终专注于定向声学技术创新，并推动其从实验室走向大规模商业应用。

清听声学定义AI声学全链生态

　　截至目前，清听声学已完成定向声技术的三次关键技术迭代，累计拥有450+项知识产权与250+项核心技术专利，并建成全球首条聚音屏柔性中试产线。从定向声技术发明、产品工程化，到规模化商业落地，清听声学构建完整的技术体系与产业能力。

清听声学研发生产基地

　　当行业仍然围绕屏幕参数和触控体验展开竞争时，清听声学已经率先完成显示技术与声学技术的深度融合——让屏幕不仅可以“看见”，更可以“发声”。这不是功能叠加，而是交互结构的重构。

　　正是基于这一持续的技术创新与产业实践，清听声学率先提出AUI（声学用户界面）概念，这是一种对未来人机交互形态的前瞻判断。当交互从“屏幕界面”走向“空间声场”，AUI 正在成为连接人与智能世界的重要入口。

　　AUI的提出，是技术突破的水到渠成，更是清听声学对产业未来的先行布局。