實時Galgame - 動漫角色 語音生成+圖片生成
文字轉語音
看到B站推薦的視頻,想了解到2025年10月最新文字轉語言技術,并本地部署跑下
實時Galgame成了! IndexTTS2接入酒館SillyTavern實時語音,角色語音情感控制,兼容酒館API調用,B站開源最強AI語音模型
技術棧: SillyTavern(酒館)+index TTS 2
1. SillyTavern(酒館)
官方網址
教程地址:
【AI女友】酒館Silly Tavern視頻教程(一)下載與搭建
本地部署后:
SillyTavern自動生圖插件
2. index TTS 2
官方網址
本地部署后:
實際應用(pdf書籍文章朗讀)
最近在讀計算機相關pdf書籍,想用 pdf+OCR+TTS2 實現pdf 文字朗讀功能。
實現思路:
-
pdf + Umi-OCR 進行圖像的文字識別。 或者不用圖像識別,下載書籍epub文件,直接復制文字。(圖像識別可能有錯別字)
-
將識別的文件添加到剪切板。
-
復制到TTS2 中進行語音生成。
有各種工具,可以優化這一流程,后續可以將實現思路和效果發視頻,集思廣益讓網友提出建議。
比如將跑出來的案例配動漫AI圖+計算機書籍文章朗讀 上傳B站,測試不同的效果,讓網友看看效果。
3. Index-TTS-2.0 整合包
4. 音色和各種情感下載
5.YouDub AI翻譯配音
實際效果視頻
【中配】快速平方根倒數:雷神之錘3的經典算法解析 - Nemean
其他相關
Deepseek API 注冊網址:
Gemini API
https://aistudio.google.com/app/api-keys
https://gemini.google.com/app

浙公網安備 33010602011771號