设为首页
收藏本站
请登录
立即注册
论坛首页
BBS
充值赞助
申请提现
提现排行榜
排行榜
Ranklist
友链申请
搜索
本版
文章
帖子
群组
用户
请
登录
后使用快捷导航
没有账号?
立即注册
友情链接
当前位置:
»
论坛首页
›
YOLO图像识别
›
前言资讯
›
AI好声音竟是假唱?脸书用高科技实现声音完美转换 ...
收藏
0
回复
AI好声音竟是假唱?脸书用高科技实现声音完美转换
IP属地:
香港
77
0
脆脆鲨
2023-9-23 04:19:39
|
显示全部楼层
|
阅读模式
【CNMO新闻】Facebook AI Research和特拉维夫大学的科学家合作创造了一个人工智能系统,能够在5到30分钟的时间内将一个歌手的声音转换为另一个歌手的声音。更神奇的是,由于这些科学家采用了创新的训练方案和数据增强技术,该系统是无监督的,这意味着它能够执行未分类、未注释数据的转换。
人工智能
该系统建立在WaveNet上,这是一种谷歌开发的自动编码器,可以根据录音波形生成模型。它采用了反向翻译技术,将一个歌手的声音转换为另一个歌手的声音。如果它与原始样本不匹配,就将其翻译回来并调整进行下一次尝试。这种方式甚至可以在背景音乐存在的情况下执行声音的转换。
在实验中,科学家们使用了两个公开的数据集,斯坦福大学的移动表演数字档案馆(DAMP)语料库和新加坡国立大学的成语和口语语料库(NUS-48E),其中包含各种歌手演唱的歌曲。他们随机选择了一些歌手的歌曲进行训练,并且在训练的基础上,让人工智能系统完成了音频的替换。然后,他们让人类评论员以1-5的等级判断所产生的声音与目标歌声的相似性,并使用涉及分类系统的自动测试来更客观地评估样本的质量。“导师”们最后给出的平均得分约为4分(被认为是优质),而自动测试发现所生成样本的识别准确度几乎与重建样本的识别准确度一样高。
版权所有,未经许可不得转载
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
返回列表
发新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
脆脆鲨
管理员
关注
4885
主题
0
粉丝
0
关注
这家伙很懒,什么都没留下!
OCR文字识别工具和文件整合包
2024-8-28
Topaz Video AI v3.4.4 人工智能视频画质增强和修复软件
2024-8-28
VITS_fast_finetune 语音模型一键训练整合包
2024-8-28
Stable Diffusion整合包v4.9发布!解压即用 防爆显存 三分钟入门AI绘画 ☆更新 ☆训练
2024-8-28
Yolo_v8轻量版全套工具及易模块和例子支持CPU CUDA10 11
2024-8-28
发新帖
24小时热帖
Topaz Video AI v3.4.4 人工智能视频画质增
2024-08-28
VITS_fast_finetune 语音模型一键训练整合
2024-08-28
Stable Diffusion整合包v4.9发布!解压即用
2024-08-28
Yolo_v8轻量版全套工具及易模块和例子支持C
2024-08-28
AI再显神通!将大脑信号转为语音 准确率最
2023-09-20
Copyright © 2001-2025
Discuz Team.
Powered by
Discuz!
X3.5
|
网站地图