#GitHub #TTS
🗣 ChatTTS - 对话式高可控的语音合成模型
▎项目功能:文本转语音模型
▎项目介绍:一款专门为对话场景设计的文本转语音模型,例如LLM助手对话任务,支持英文和中文两种语言。
最大的模型使用了 10 万小时以上的中英文数据进行训练。在 HuggingFace 中开源的版本为 4 万小时训练且未 SFT 的版本。
▎项目亮点:
⏺ 对话式 TTS:
⏺ 细粒度控制:
⏺ 更好的韵律:
▎相关推荐:
🔵 ChatTTS_colab - 基于 ChatTTS ,支持音色抽卡、长音频生成和分角色朗读
🔵 ChatTTS-Forge - 提供了完善的 ChatTTS 封装,包括 API WebUI Playground
▎项目地址:点击打开
▎项目功能:文本转语音模型
▎项目介绍:一款专门为对话场景设计的文本转语音模型,例如LLM助手对话任务,支持英文和中文两种语言。
最大的模型使用了 10 万小时以上的中英文数据进行训练。在 HuggingFace 中开源的版本为 4 万小时训练且未 SFT 的版本。
❗ 使用需知
🔴 为了限制 ChatTTS 的使用,我们在 4w 小时模型的训练过程中添加了少量额外的高频噪音,并用 mp3 格式尽可能压低了音质,以防不法分子用于潜在的犯罪可能。同时我们在内部训练了检测模型,并计划在未来开放。
▎项目亮点:
ChatTTS针对对话式任务进行了优化,实现了自然流畅的语音合成,同时支持多说话人。
该模型能够预测和控制细粒度的韵律特征,包括笑声、停顿和插入词等。
ChatTTS在韵律方面超越大部分开源TTS模型。同时提供预训练模型,支持进一步研究。
▎相关推荐:
▎项目地址:点击打开
▎项目功能:虚拟换衣
▎项目介绍:一个先进的虚拟试穿(VTON)技术项目,利用潜在扩散模型(LDM)来生成逼真且可控的虚拟服饰试穿图像。
OOTDiffusion 采用潜在扩散模型技术,可以生成和融合高质量的服装图像。
它支持半身及全身两种模型模式,并允许用户根据不同的性别与体型进行相应调整,以确保试穿效果的自然真实。
▎相关推荐:
▎项目地址:点击打开
▎网站功能:HTML 模板下载
▎网站介绍:一个免费 HTML 模板下载网站,提供 1500+ 免费 HTML 模板下载,适用于网站、登录页面、博客、投资组合、电子商务和仪表板。
模板都提供详细介绍,并可直接一键打包下载,所有模板对个人和商业项目都是免费的。
▎网站网址:点击打开
▎项目功能:链接缩短
▎项目介绍:一个开源链接缩短器,100% 在 Cloudflare 上运行,支持链接分析监控、自定义弹头、设计过期时间等功能。
▎相关推荐:
▎项目地址:点击打开
▎网站功能:AI 音乐生成
▎网站介绍:一个利用人工智能技术创建音乐的平台,用户可以注册免费账号,通过该平台创作不同主题的歌曲。
Suno 提供生成旋律、歌词和完整曲目的工具,使得音乐创作变得更加容易和普及。
网站还提供丰富的资源库和一个社区,用户可以在其中探索和分享音乐创作,也可以当一个音乐播放器用,听听别人的创作。
▎相关推荐:
▎网站网址:点击打开
▎网站功能:金价查询
▎网站介绍:一个实时的黄金价格查询网站,提供国内金价、金店品牌、国际金价、香港金价、银行金价信息,单位为盎司和克。
还提供 24 小时内的黄金价格走势图,黄金价格开盘价、最高价、最低价和收盘价,黄金价格的日线图、周线图和月线图,并支持选择不同的货币单位。
▎网站网址:点击打开
#脚本 #解析 #开源 #Telegram
🔧 Telegram Media Downloader - 电报媒体下载脚本
▎脚本功能:电报媒体下载
▎脚本平台:#Tampermonkey
▎脚本介绍:一个电报媒体下载脚本,允许用户从禁用下载和限制保存内容的私人频道下载 Telegram 网络应用程序上的图像、GIF 和视频。
此脚本仅适用于 Telegram Webapp,对于允许保存内容的频道和聊天,此脚本将不起作用。
对于禁用下载和限制保存内容的频道和聊天,此脚本将重新添加图像、GIF 和视频的下载按钮。
▎脚本安装:点击安装
▎脚本功能:电报媒体下载
▎脚本平台:#Tampermonkey
▎脚本介绍:一个电报媒体下载脚本,允许用户从禁用下载和限制保存内容的私人频道下载 Telegram 网络应用程序上的图像、GIF 和视频。
此脚本仅适用于 Telegram Webapp,对于允许保存内容的频道和聊天,此脚本将不起作用。
对于禁用下载和限制保存内容的频道和聊天,此脚本将重新添加图像、GIF 和视频的下载按钮。
▎脚本安装:点击安装