VoiceStudio MCP Server
未知
ContentVoiceCraft-MCP-Server 是一个 MCP 服务器,可以与 Claude 等 AI 助手协作,将文本转换为高质量的语音,使用 Kokoro 的语音合成技术生成自然且富有表现力的声音。
主要功能
- 🎯 处理来自 AI 助手的文本朗读请求
- 🌏 支持日语和英语的自然语音合成
- 🔊 提供文本朗读和对话语音生成
- ⚙️ 自定义语音速度、音调等选项
- 🧠 自动语言检测功能
快速开始
前提条件
- Python 3.8+
- uv 包管理器
- Kokoro 语音合成引擎(真实模式下需要)
安装
# 克隆仓库
git clone https://github.com/yourusername/VoiceStudio-MCP-Server.git
cd VoiceStudio-MCP-Server
# 安装 uv(如果未安装)
# macOS/Linux
curl -sSf https://astral.sh/uv/install.sh | sh
# Windows
powershell -c "irm https://astral.sh/uv/install.ps1 | iex"
# 设置环境并安装依赖
make setup
# 配置环境变量
cp .env.example .env
# 编辑 .env 文件添加必要配置
启动服务器
# 基本启动
make run
# 带参数启动
uv run src.main --host 127.0.0.1 --port 8080 --debug
# 模拟模式启动
MOCK_TTS=true make run
使用方法
从 Claude 等 AI 助手发送如下提示:
- "用日语读这段内容"
- "用英语进行对话"
- "将以下文本转为语音:你好,世界"
AI 助手会通过 MCP 协议向服务器发送请求并生成语音。
语音定制选项
- 速度调整 (0.5 - 2.0)
- 音调调整 (-10.0 - 10.0)
- 选择声音类型(取决于可用的 Kokoro 声模)
开发者命令
# 运行测试
make test
# 格式化代码
make format
# 检查代码规范
make lint
# 清理缓存和构建文件
make clean
MCP 协议集成
在 AI 助手设置中添加 ContentVoiceCraft-MCP-Server 作为 MCP 服务器,即可启用文本朗读功能。
许可证
该项目在 MIT 许可证 下发布。