高性能语音识别MCP服务器
基于Faster Whisper的高性能语音识别MCP服务器,提供高效的音频转录功能。
快速入门
安装
- 克隆或下载此仓库。
- 创建并激活虚拟环境(推荐)。
- 安装依赖: pip install -r requirements.txt
根据CUDA版本安装PyTorch,例如:
- CUDA 12.6: pip install torch==2.6.0 torchvision==0.21.0 torchaudio==2.6.0 --index-url https://download.pytorch.org/whl/cu126
启动
- Windows运行
start_server.bat
。 - 其他平台运行: python whisper_server.py
测试方法
- 使用MCP Inspector快速测试: mcp dev whisper_server.py
- 命令行直接调用: mcp run whisper_server.py
主要功能
- 音频文件转录
- 批量处理加速
- 多模型支持(tiny到large-v3)
- 输出格式:VTT、SRT、JSON