SadTalkerSadTalker是一款基于AI的生成式对话头像应用,能够通过静态图像和音频输入,自动生成具有自然面部表情和唇形同步的逼真说话视频。02150AI音频# AI音频# SadTalker
rvc变声器RVC变声器是一款基于检索式语音转换(Retrieval-based Voice Conversion)技术的AI应用,能够通过少量参考音频快速学习并实时模拟目标声音,实现高保真、低延迟的语音转换。01200AI音频# AI音频# rvc变声器
riffusion基于官网信息,riffusion 是一款利用稳定扩散模型,将音乐片段转化为可视化频谱图,并允许用户通过文本或音频提示实时生成、混合和探索声音的 AI 应用。02350AI音频# AI音频# riffusion
Qwen3-TTSQwen3-TTS是一款由阿里云Qwen团队开发的开源语音生成模型系列,支持稳定、富有表现力的流式语音生成、自由语音设计以及生动的语音克隆功能。01400AI音频# AI音频# Qwen3-TTS
Qwen2-AudioQwen2-Audio是一款能够接受多种音频信号输入,并通过语音或文本进行交互的大规模音频-语言模型,支持语音聊天与音频分析两种模式。01450AI音频# AI音频# Qwen2-Audio
Qwen2.5Qwen2.5作为Qwen2系列的最新升级,在语言理解、多语言处理、数学推理和代码生成等任务上展现出更强的性能,并支持从0.5B到72B的多种参数规模,适用于从边缘设备到云端部署的各类应用场景。02000AI音频# AI音频# Qwen2.5
novita aiNovita AI 是一个一站式 AI 原生云平台,通过统一的 API 提供 200+ 模型、按需 GPU 和安全的 Agent 沙箱,让开发者无需管理基础设施即可快速构建和扩展生产级 AI 应用。02000AI音频# AI音频# novita ai
nimbleNimble是一款集成了多模态AI功能(包括图像生成、AI搜索、语音交互等)的智能助手应用,旨在通过自然对话方式为用户提供便捷的创作、查询与生活辅助服务。01750AI音频# AI音频# nimble
Narration BoxNarration Box是一款基于先进AI技术的多功能文本转语音工具,支持多种语言、声音和情感表达,适用于内容创作、教育和无障碍应用。01300AI音频# AI音频# Narration Box