高性能语音识别MCP服务器

基于Faster Whisper的高性能语音识别MCP服务器，提供高效的音频转录功能。

快速入门

安装

克隆或下载此仓库。
创建并激活虚拟环境（推荐）。
安装依赖： pip install -r requirements.txt

根据CUDA版本安装PyTorch，例如：

CUDA 12.6: pip install torch==2.6.0 torchvision==0.21.0 torchaudio==2.6.0 --index-url https://download.pytorch.org/whl/cu126

启动

Windows运行 start_server.bat。
其他平台运行： python whisper_server.py

测试方法

使用MCP Inspector快速测试： mcp dev whisper_server.py
命令行直接调用： mcp run whisper_server.py

主要功能

音频文件转录
批量处理加速
多模型支持（tiny到large-v3）
输出格式：VTT、SRT、JSON