▎项目功能:AI 视频配音/翻译工具
▎项目介绍:一个智能视频多语言AI配音和翻译工具,它融合了 YouDub-webui 的灵感,并在此基础上进行了拓展和优化。
致力于提供更加多样化和高质量的配音选择,通过集成 Linly-Talker 的数字人对口型技术,为用户带来更加自然的多语言视频体验。
▎项目地址:点击打开
▎项目功能:变声框架
▎项目介绍:一个基于 VITS 开发的变声框架,主要特点包括简单易用的网页界面、对少量数据的高效训练、以及支持实时变声等功能。
它采用了先进的技术来实现音色转换,能够在较低的硬件要求下提供高质量的输出。
用户可以通过预训练模型和相关工具快速实现人声和伴奏分离,同时支持多种加速模式和硬件平台。
▎项目地址:点击打开
▎网站功能:文本转语音
▎网站介绍:一个基于 VQ-GAN 和 Llama、VITS,由 Fish Audio 开发的文本转语音模型。
提供了多语言支持和高质量的语音合成,支持中文、日文和英文三种语言的合成。
特别是基于一些知名游戏角色的声音,如《原神》、《崩坏:星穹铁道》和《碧蓝档案》。
▎网站网址:点击打开
▎项目功能:视频/音频翻译
▎项目介绍:一个简单易用的全自动视频(音频)识别、翻译工具,快速识别声音并翻译生成字幕文件,然后将翻译后的字幕与原视频合并,生成翻译后的视频。
主要基于 OpenAI 开发的 Whisper 来识别声音和 LLMs 辅助翻译字幕 ,利用 Streamlit 搭建快速使用的 WebUI 界面,以及 FFmpeg 来实现字幕与视频的合并。
▎项目特点:
▎项目地址:点击打开