设为首页
收藏本站
请登录
立即注册
论坛首页
BBS
充值赞助
申请提现
提现排行榜
排行榜
Ranklist
友链申请
搜索
本版
文章
帖子
群组
用户
请
登录
后使用快捷导航
没有账号?
立即注册
友情链接
当前位置:
»
论坛首页
›
YOLO图像识别
›
前言资讯
›
研究者受启发 模拟听觉处理过程提升AI语音识别能力 ...
收藏
0
回复
研究者受启发 模拟听觉处理过程提升AI语音识别能力
IP属地:
香港
82
0
脆脆鲨
2023-9-21 14:14:06
|
显示全部楼层
|
阅读模式
【CNMO新闻】将特定的一段声音从繁杂的大环境中分离出来是十分复杂的,但是在人类的下位听觉通路中,我们就可以将某些单一声源从背景中分离出来,并可在空间中定位声源位置。受到以上神经生理学过程的启发,研究人员发表了一篇关于通过声源定位和自动语音识别等声音识别组件测试面部特征影响的设计方案。
人工智能语音识别能力
研究者指出,人体的躯干、头部和耳廓会吸收和反弹声波并改变声音的频率。当声波到达耳蜗和柯替氏器时,后者会因声波震动产生神经讯号。然后这些神经讯号会通过听觉神经系统被传送到耳蜗神经核,耳蜗核随后将信息分别传送到判断音源方向的上橄榄体和定位音源位置的外侧上橄榄体上。最后,两股信息再被汇总到大脑的下丘核。
为了用算法模拟这一神经过程,研究者们设计了一种机器学习架构来处理两款机器人听到的声音。为了测试系统的表现,研究者们用Soundman建立了SSL和ASR基准线。研究团队发现来自SSL的数据可以帮助调整机器头颅的姿态以及选择适合的渠道向ASR系统提供信息,从而提高语音识别准确率。动态SSL实验的结果显示机器学习系统可以处理不同种类的回声,这些研究成果是此前静态SSL成果的延伸。
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
返回列表
发新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
脆脆鲨
管理员
关注
4885
主题
0
粉丝
0
关注
这家伙很懒,什么都没留下!
OCR文字识别工具和文件整合包
2024-8-28
Topaz Video AI v3.4.4 人工智能视频画质增强和修复软件
2024-8-28
VITS_fast_finetune 语音模型一键训练整合包
2024-8-28
Stable Diffusion整合包v4.9发布!解压即用 防爆显存 三分钟入门AI绘画 ☆更新 ☆训练
2024-8-28
Yolo_v8轻量版全套工具及易模块和例子支持CPU CUDA10 11
2024-8-28
发新帖
24小时热帖
Topaz Video AI v3.4.4 人工智能视频画质增
2024-08-28
VITS_fast_finetune 语音模型一键训练整合
2024-08-28
Stable Diffusion整合包v4.9发布!解压即用
2024-08-28
Yolo_v8轻量版全套工具及易模块和例子支持C
2024-08-28
AI再显神通!将大脑信号转为语音 准确率最
2023-09-20
Copyright © 2001-2025
Discuz Team.
Powered by
Discuz!
X3.5
|
网站地图