小米开源覆盖600多语言的语音克隆TTS模型OmniVoice | PANews

小米开源覆盖600多语言的语音克隆TTS模型OmniVoice

PANews 5月7日消息，小米AI实验室推出多语言语音克隆TTS模型OmniVoice，采用单一双向Transformer极简架构，支持646种语言语音合成，在中英文场景的合成质量和推理速度优于主流模型。该模型基于约58万小时、50个开源数据集训练，对低资源语种使用动态上采样策略，在24种与102种语言测试中语音相似度和可懂度超越多款商用系统，部分指标接近甚至优于真实语音。OmniVoice支持跨语言语音克隆、自定义音色、带噪参考音频适配、副语言控制和发音纠错，并已在Github和Huggingface等平台开源训练、推理代码及模型权重。

分享至：

作者：PA一线

本内容只为提供市场信息，不构成投资建议。

关注PANews官方账号，一起穿越牛熊

PANews微信群

Telegram交流群

Telegram资讯频道

推荐阅读

PA一线

29分钟前

谷歌翻译的竞争对手DeepL宣布裁员四分之一以重组AI业务

华尔街日报

34分钟前

Polymarket调查：67%的利润流向了0.1%的账户，普通人真的没机会

PA一线

48分钟前

华尔街传统金融机构密集发布高薪加密岗位，要求兼具TradFi与加密经验

PA一线

1小时前

Core Scientific一季度出售2385枚BTC，套现2.083亿美元

PA一线

1小时前

一新建钱包从Binance提取2500枚BTC，价值约2.02亿美元

PA一线

2小时前

分析：Kalshi预测美国非农数据表现并未优于经济学家

相关专题

x402协议：智能体支付新标准

x402协议旨在通过区块链技术解决AI Agent经济中的核心支付困境，为AI Agent之间的高频、小额交易提供自主、低成本的链上支付解决方案。

29篇文章

加密名人档案室

比特币诞生十余年，出现许多早期玩家、技术极客、创业者、投资人，他们一定程度上推动了整个行业的发展。本专题用于记录这些加密名人，帮助大家了解行业历史。

38篇文章

Pioneer‘s View：加密名人专访

加密名人独家专访，分享独特的观察与见解

144篇文章

热搜:比特币以太坊稳定币预测市场特朗普 RWA USDT DeFi AI 美联储主席

热门文章

中国 Web3 创业，有哪些好路子？

22亿美元新基金背后的秘密，a16z crypto四位合伙人解析加密货币进化论

OpenTrade 融资1700万美元扩张稳定币收益基础设施

纳指标普再创新高：谁掌握了存储和芯片，谁就掌握了2026

华尔街日报

从被迫退出到重新掌舵，Telegram六年后重返TON主场

行业要闻

市场热点

精选读物

PANews APP

24小时追踪区块链行业资讯，行业深度文章解析。

下载 PANews App

App Store Google Play

伊朗指定两条航道供船只通行霍尔木兹海峡

PANews 快讯28分钟前