Gemini 图像生成服务器

Gemini 图像生成服务器

基于 Google Gemini 模型的 AI 图像生成与编辑服务器,支持文本生成图像及未来扩展的图像编辑功能。

快速入门

前置条件

  • Python 3.11+
  • Google AI API 密钥(Gemini)
  • 支持 MCP 协议的应用程序(如 Claude Desktop)

安装

  1. 克隆仓库: git clone https://github.com/qhdrl12/mcp-server-gemini-image-generator.git cd mcp-server-gemini-image-generator

  2. 创建虚拟环境并安装依赖: python -m venv .venv source .venv/bin/activate pip install -e .

  3. 配置环境变量: cp .env.example .env 编辑 .env 文件,添加您的 Gemini API 密钥和输出路径: GEMINI_API_KEY="your-api-key" OUTPUT_IMAGE_PATH="/path/to/save/images"

使用

启动服务后,通过以下命令生成或编辑图像:

  • 文本生成图像:generate_image_from_text(prompt)
  • 图像转换(Base64):transform_image_from_encoded(encoded_image, prompt)
  • 图像转换(文件):transform_image_from_file(image_file_path, prompt)

更多示例请参考 README。