feat(image): support grok-2-image image and gpt-4o-image (#4767)

* feat(image): support grok image * feat: add gpt-4o-image * feat: 添加 gpt-image-1 到生成图像模型列表
2025-12-24 18:50:56 +08:00 · 2025-04-24 17:26:15 +08:00 · 2025-04-24 17:26:15 +08:00 · 4d06af69a6
commit 4d06af69a6
parent 7d69c1274b
6 changed files with 58 additions and 1 deletions
--- a/src/renderer/src/config/models.ts
+++ b/src/renderer/src/config/models.ts
@ -2145,7 +2145,13 @@ export const TEXT_TO_IMAGES_MODELS_SUPPORT_IMAGE_ENHANCEMENT = [
  'stabilityai/stable-diffusion-xl-base-1.0'
 ]

-export const GENERATE_IMAGE_MODELS = ['gemini-2.0-flash-exp-image-generation', 'gemini-2.0-flash-exp']
+export const GENERATE_IMAGE_MODELS = [
+  'gemini-2.0-flash-exp-image-generation',
+  'gemini-2.0-flash-exp',
+  'grok-2-image-1212',
+  'gpt-4o-image',
+  'gpt-image-1'
+]

 export const GEMINI_SEARCH_MODELS = [
  'gemini-2.0-flash',
--- a/src/renderer/src/providers/AiProvider/AnthropicProvider.ts
+++ b/src/renderer/src/providers/AiProvider/AnthropicProvider.ts
@ -507,6 +507,10 @@ export default class AnthropicProvider extends BaseProvider {
    return []
  }

+  public async generateImageByChat(): Promise<void> {
+    throw new Error('Method not implemented.')
+  }
+
  /**
   * Generate suggestions
   * @returns The suggestions
--- a/src/renderer/src/providers/AiProvider/BaseProvider.ts
+++ b/src/renderer/src/providers/AiProvider/BaseProvider.ts
@ -39,6 +39,7 @@ export default abstract class BaseProvider {
  abstract check(model: Model): Promise<{ valid: boolean; error: Error | null }>
  abstract models(): Promise<OpenAI.Models.Model[]>
  abstract generateImage(params: GenerateImageParams): Promise<string[]>
+  abstract generateImageByChat({ messages, assistant, onChunk, onFilterMessages }: CompletionsParams): Promise<void>
  abstract getEmbeddingDimensions(model: Model): Promise<number>

  public getBaseURL(): string {
--- a/src/renderer/src/providers/AiProvider/GeminiProvider.ts
+++ b/src/renderer/src/providers/AiProvider/GeminiProvider.ts
@ -718,4 +718,8 @@ export default class GeminiProvider extends BaseProvider {
    })
    return data.embeddings?.[0]?.values?.length || 0
  }
+
+  public generateImageByChat(): Promise<void> {
+    throw new Error('Method not implemented.')
+  }
 }
--- a/src/renderer/src/providers/AiProvider/OpenAIProvider.ts
+++ b/src/renderer/src/providers/AiProvider/OpenAIProvider.ts
@ -307,6 +307,10 @@ export default class OpenAIProvider extends BaseProvider {
   * @returns The completions
   */
  async completions({ messages, assistant, mcpTools, onChunk, onFilterMessages }: CompletionsParams): Promise<void> {
+    if (assistant.enableGenerateImage) {
+      await this.generateImageByChat({ messages, assistant, onChunk } as CompletionsParams)
+      return
+    }
    const defaultModel = getDefaultModel()
    const model = assistant.model || defaultModel
    const { contextCount, maxTokens, streamOutput } = getAssistantSettings(assistant)
@ -893,4 +897,33 @@ export default class OpenAIProvider extends BaseProvider {
    const { token } = await window.api.copilot.getToken(defaultHeaders)
    this.sdk.apiKey = token
  }
+
+  public async generateImageByChat({ messages, assistant, onChunk }: CompletionsParams): Promise<void> {
+    const defaultModel = getDefaultModel()
+    const model = assistant.model || defaultModel
+    const lastUserMessage = messages.findLast((m) => m.role === 'user')
+    const { abortController, signalPromise } = this.createAbortController(lastUserMessage?.id, true)
+    const { signal } = abortController
+    const response = await this.sdk.images.generate(
+      {
+        model: model.id,
+        prompt: lastUserMessage?.content || ''
+      },
+      {
+        signal
+      }
+    )
+
+    await signalPromise?.promise?.catch((error) => {
+      throw error
+    })
+
+    return onChunk({
+      text: '',
+      generateImage: {
+        type: 'url',
+        images: response.data.map((item) => item.url).filter((url): url is string => url !== undefined)
+      }
+    })
+  }
 }
--- a/src/renderer/src/providers/AiProvider/index.ts
+++ b/src/renderer/src/providers/AiProvider/index.ts
@ -109,6 +109,15 @@ export default class AiProvider {
    return this.sdk.generateImage(params)
  }

+  public async generateImageByChat({
+    messages,
+    assistant,
+    onChunk,
+    onFilterMessages
+  }: CompletionsParams): Promise<void> {
+    return this.sdk.generateImageByChat({ messages, assistant, onChunk, onFilterMessages })
+  }
+
  public async getEmbeddingDimensions(model: Model): Promise<number> {
    return this.sdk.getEmbeddingDimensions(model)
  }