科大讯飞:AI大模型时代,如何让智能更懂人心?

在生成式人工智能席卷全球的浪潮中,国内AI领域正经历着从性能比拼到应用落地的深刻转变。在这场变革中,智能硬件,尤其是具身机器人产品,以其独特的方式融入了人们的日常生活,展现了人机共生的未来图景。

众所周知,AI如同一位高智商的“偏科生”,在理性逻辑方面表现出色,但在情商方面却显得力不从心。传统的语音交互技术,尽管在复杂环境下已实现了较高的识别率,但一次失败的体验就足以让用户心生退意。科大讯飞,作为中国人工智能产业的先行者,深谙此道。在语音技术领域深耕二十余年后,科大讯飞于6月12日的智能交互产品升级发布会上,推出了AIUI、机器人超脑、虚拟数字人和讯飞星辰四大全面升级的开发平台。

全新的AIUI平台,以讯飞星火大模型为引擎,实现了技术上的飞跃。发布会上亮相的全双工拟人交互方案,不仅能在嘈杂环境中精准捕捉指令,还赋予了硬件产品情绪识别、创意生成与深度语义理解等类人多模态能力。这一方案的应用,使得智能音箱等消费级智能语音交互产品,在多人场景中能够屏蔽非人声环境音,准确识别指令,并在用户迟疑、等待时主动延长拾音,提供更高效、更具温度的智能体验。

而在智能眼镜产品上,科大讯飞展示了最新的“三麦阵列降噪”方案,专为户外移动场景设计。在清晰收音的基础上,智能眼镜能够在大模型能力的加持下,在实时翻译、专业导游、健康助理等多重角色间无缝切换,仿佛一位同行的真人伙伴。

面对儿童陪伴成长的场景,科大讯飞推出了儿童专属交互方案。这一方案针对幼儿发音模糊、叠字代替正常词汇等特征进行强化训练,实现了逻辑跳跃、音字不准的识别,以及情绪信号与认知逻辑的匹配。这使得智能玩具与孩子的对话更像玩伴间的亲密互动,而非简单的发号施令。

除了消费级场景,科大讯飞同样关注产业侧的赋能。在具身智能机器人赛道上,讯飞机器人超脑平台成为了众多机器人客户的共同选择。宇树G1机器人在发布会上的表现令人惊艳,它挥舞着金属手臂,欢快地跟观众打招呼,背后的奥秘正是讯飞机器人超脑平台上的“智能语音背包”。这一方案无需改造硬体,即插即用,为机器人提供了即时的语音交互能力。

讯飞机器人超脑平台不仅为机器人提供了能听会说、能理解会行动的中枢系统,还构建了“端-云协同”的AI架构。在端侧,平台提供多模态降噪、人脸识别等本地感知与计算能力;在云端,则依托语音大模型与具身智能技术,实现类人化交互与复杂任务理解。这一架构的应用,使得机器人在工厂巡检、服务机器人等领域展现出了强大的能力。

科大讯飞还推出了虚拟人交互平台和星辰Agent智能体构建平台。虚拟人交互平台依托领先的多模态感知与生成技术,实现了数字人构建的“极简革命”。用户只需输入一句录音、上传一张图片,即可生成专属的数字分身。而星辰Agent平台则是一站式的大模型精调与智能体构建平台,广泛兼容业界主流的开源大模型,助力企业高效构建专属大模型和智能应用。

依托这些平台,科大讯飞在AI大模型落地场景上取得了显著成果。在C端市场上,科大讯飞覆盖了11个核心赛道,推出了27款AI应用;在To B和To G市场上,更是领跑同行,累计中标项目超130个,总金额突破14亿元。科大讯飞以星火大模型为核心,将各项语音智能技术融会贯通,构建起了一棵代表人机智能交互的生态大树。

文章采集于互联网