Gemini 图像生成服务器
基于 Google Gemini 模型的 AI 图像生成与编辑服务器,支持文本生成图像及未来扩展的图像编辑功能。
快速入门
前置条件
- Python 3.11+
- Google AI API 密钥(Gemini)
- 支持 MCP 协议的应用程序(如 Claude Desktop)
安装
-
克隆仓库: git clone https://github.com/qhdrl12/mcp-server-gemini-image-generator.git cd mcp-server-gemini-image-generator
-
创建虚拟环境并安装依赖: python -m venv .venv source .venv/bin/activate pip install -e .
-
配置环境变量: cp .env.example .env 编辑
.env
文件,添加您的 Gemini API 密钥和输出路径: GEMINI_API_KEY="your-api-key" OUTPUT_IMAGE_PATH="/path/to/save/images"
使用
启动服务后,通过以下命令生成或编辑图像:
- 文本生成图像:
generate_image_from_text(prompt)
- 图像转换(Base64):
transform_image_from_encoded(encoded_image, prompt)
- 图像转换(文件):
transform_image_from_file(image_file_path, prompt)
更多示例请参考 README。