高性能语音识别MCP服务器

高性能语音识别MCP服务器

基于Faster Whisper的高性能语音识别MCP服务器,提供高效的音频转录功能。

快速入门

安装

  1. 克隆或下载此仓库。
  2. 创建并激活虚拟环境(推荐)。
  3. 安装依赖: pip install -r requirements.txt

根据CUDA版本安装PyTorch,例如:

启动

  • Windows运行 start_server.bat
  • 其他平台运行: python whisper_server.py

测试方法

  1. 使用MCP Inspector快速测试: mcp dev whisper_server.py
  2. 命令行直接调用: mcp run whisper_server.py

主要功能

  • 音频文件转录
  • 批量处理加速
  • 多模型支持(tiny到large-v3)
  • 输出格式:VTT、SRT、JSON