From 058ea072656bab51d161cd6e9ce551876a81f605 Mon Sep 17 00:00:00 2001
From: fullex <0xfullex@gmail.com>
Date: Mon, 12 May 2025 12:42:55 +0800
Subject: [PATCH 01/50] chore: remove bufferutil dependency from package.json
 and yarn.lock

---
 package.json |  1 -
 yarn.lock    | 22 ----------------------
 2 files changed, 23 deletions(-)

diff --git a/package.json b/package.json
index 8c6cab3f29..306312cda3 100644
--- a/package.json
+++ b/package.json
@@ -76,7 +76,6 @@
     "adm-zip": "^0.5.16",
     "archiver": "^7.0.1",
     "async-mutex": "^0.5.0",
-    "bufferutil": "^4.0.9",
     "color": "^5.0.0",
     "diff": "^7.0.0",
     "docx": "^9.0.2",
diff --git a/yarn.lock b/yarn.lock
index ab86ce3037..05068932fd 100644
--- a/yarn.lock
+++ b/yarn.lock
@@ -4400,7 +4400,6 @@ __metadata:
     axios: "npm:^1.7.3"
     babel-plugin-styled-components: "npm:^2.1.4"
     browser-image-compression: "npm:^2.0.2"
-    bufferutil: "npm:^4.0.9"
     color: "npm:^5.0.0"
     dayjs: "npm:^1.11.11"
     dexie: "npm:^4.0.8"
@@ -5323,16 +5322,6 @@ __metadata:
   languageName: node
   linkType: hard
 
-"bufferutil@npm:^4.0.9":
-  version: 4.0.9
-  resolution: "bufferutil@npm:4.0.9"
-  dependencies:
-    node-gyp: "npm:latest"
-    node-gyp-build: "npm:^4.3.0"
-  checksum: 10c0/f8a93279fc9bdcf32b42eba97edc672b39ca0fe5c55a8596099886cffc76ea9dd78e0f6f51ecee3b5ee06d2d564aa587036b5d4ea39b8b5ac797262a363cdf7d
-  languageName: node
-  linkType: hard
-
 "builder-util-runtime@npm:9.3.2":
   version: 9.3.2
   resolution: "builder-util-runtime@npm:9.3.2"
@@ -12621,17 +12610,6 @@ __metadata:
   languageName: node
   linkType: hard
 
-"node-gyp-build@npm:^4.3.0":
-  version: 4.8.4
-  resolution: "node-gyp-build@npm:4.8.4"
-  bin:
-    node-gyp-build: bin.js
-    node-gyp-build-optional: optional.js
-    node-gyp-build-test: build-test.js
-  checksum: 10c0/444e189907ece2081fe60e75368784f7782cfddb554b60123743dfb89509df89f1f29c03bbfa16b3a3e0be3f48799a4783f487da6203245fa5bed239ba7407e1
-  languageName: node
-  linkType: hard
-
 "node-gyp@npm:^9.1.0":
   version: 9.4.1
   resolution: "node-gyp@npm:9.4.1"

From 932cd84d3b51a1572cc6049e1ff3bd51ad2ea291 Mon Sep 17 00:00:00 2001
From: jwcrystal <121911854+jwcrystal@users.noreply.github.com>
Date: Mon, 12 May 2025 14:55:23 +0800
Subject: [PATCH 02/50] fix: fix the formating error on qwen3 (#5899)

fix(ModelMessageService): fix the formating error on qwen3
---
 src/renderer/src/services/ModelMessageService.ts | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/src/renderer/src/services/ModelMessageService.ts b/src/renderer/src/services/ModelMessageService.ts
index 4e9c1d5729..b48543ea19 100644
--- a/src/renderer/src/services/ModelMessageService.ts
+++ b/src/renderer/src/services/ModelMessageService.ts
@@ -57,7 +57,7 @@ export function processPostsuffixQwen3Model(
     } else {
       // 思考模式未启用，添加 postsuffix
       if (!content.endsWith(postsuffix)) {
-        return content + postsuffix
+        return content + ' ' + postsuffix
       }
     }
   } else if (Array.isArray(content)) {

From 2782744a859002513ec4327362e77845ec9c32bf Mon Sep 17 00:00:00 2001
From: Wang Jiyuan <59059173+EurFelux@users.noreply.github.com>
Date: Mon, 12 May 2025 18:19:03 +0800
Subject: [PATCH 03/50] feat: minimize token usage when testing model (#5905)

---
 src/renderer/src/providers/AiProvider/AnthropicProvider.ts    | 2 +-
 src/renderer/src/providers/AiProvider/GeminiProvider.ts       | 4 ++--
 .../src/providers/AiProvider/OpenAICompatibleProvider.ts      | 3 +++
 src/renderer/src/providers/AiProvider/OpenAIProvider.ts       | 4 +++-
 4 files changed, 9 insertions(+), 4 deletions(-)

diff --git a/src/renderer/src/providers/AiProvider/AnthropicProvider.ts b/src/renderer/src/providers/AiProvider/AnthropicProvider.ts
index 3f2929bdd0..c7cc3b37ed 100644
--- a/src/renderer/src/providers/AiProvider/AnthropicProvider.ts
+++ b/src/renderer/src/providers/AiProvider/AnthropicProvider.ts
@@ -678,7 +678,7 @@ export default class AnthropicProvider extends BaseProvider {
     const body = {
       model: model.id,
       messages: [{ role: 'user' as const, content: 'hi' }],
-      max_tokens: 100,
+      max_tokens: 2, // api文档写的 x>1
       stream
     }
 
diff --git a/src/renderer/src/providers/AiProvider/GeminiProvider.ts b/src/renderer/src/providers/AiProvider/GeminiProvider.ts
index 0a49ebe573..e45dc134bd 100644
--- a/src/renderer/src/providers/AiProvider/GeminiProvider.ts
+++ b/src/renderer/src/providers/AiProvider/GeminiProvider.ts
@@ -916,7 +916,7 @@ export default class GeminiProvider extends BaseProvider {
           model: model.id,
           contents: [{ role: 'user', parts: [{ text: 'hi' }] }],
           config: {
-            maxOutputTokens: 100
+            maxOutputTokens: 1
           }
         })
         if (isEmpty(result.text)) {
@@ -927,7 +927,7 @@ export default class GeminiProvider extends BaseProvider {
           model: model.id,
           contents: [{ role: 'user', parts: [{ text: 'hi' }] }],
           config: {
-            maxOutputTokens: 100
+            maxOutputTokens: 1
           }
         })
         // 等待整个流式响应结束
diff --git a/src/renderer/src/providers/AiProvider/OpenAICompatibleProvider.ts b/src/renderer/src/providers/AiProvider/OpenAICompatibleProvider.ts
index 54df45ed98..33675a0885 100644
--- a/src/renderer/src/providers/AiProvider/OpenAICompatibleProvider.ts
+++ b/src/renderer/src/providers/AiProvider/OpenAICompatibleProvider.ts
@@ -1112,6 +1112,9 @@ export default class OpenAICompatibleProvider extends BaseOpenAiProvider {
     const body = {
       model: model.id,
       messages: [{ role: 'user', content: 'hi' }],
+      max_completion_tokens: 1, // openAI
+      max_tokens: 1, // openAI deprecated 但大部分OpenAI兼容的提供商继续用这个头
+      enable_thinking: false, // qwen3
       stream
     }
 
diff --git a/src/renderer/src/providers/AiProvider/OpenAIProvider.ts b/src/renderer/src/providers/AiProvider/OpenAIProvider.ts
index 154b1a7357..122f87888d 100644
--- a/src/renderer/src/providers/AiProvider/OpenAIProvider.ts
+++ b/src/renderer/src/providers/AiProvider/OpenAIProvider.ts
@@ -1026,6 +1026,7 @@ export abstract class BaseOpenAiProvider extends BaseProvider {
       const response = await this.sdk.responses.create({
         model: model.id,
         input: [{ role: 'user', content: 'hi' }],
+        max_output_tokens: 1,
         stream: true
       })
       let hasContent = false
@@ -1042,7 +1043,8 @@ export abstract class BaseOpenAiProvider extends BaseProvider {
       const response = await this.sdk.responses.create({
         model: model.id,
         input: [{ role: 'user', content: 'hi' }],
-        stream: false
+        stream: false,
+        max_output_tokens: 1
       })
       if (!response.output_text) {
         throw new Error('Empty response')

From 5f3ef42826ac45d412e682ef332e3bd5dce1acda Mon Sep 17 00:00:00 2001
From: suyao <sy20010504@gmail.com>
Date: Mon, 12 May 2025 18:14:19 +0800
Subject: [PATCH 04/50] fix: move start_time_millsec initialization to onChunk
 for accurate timing

---
 src/renderer/src/providers/AiProvider/AnthropicProvider.ts      | 2 +-
 src/renderer/src/providers/AiProvider/GeminiProvider.ts         | 2 +-
 .../src/providers/AiProvider/OpenAICompatibleProvider.ts        | 2 +-
 src/renderer/src/providers/AiProvider/OpenAIProvider.ts         | 2 +-
 4 files changed, 4 insertions(+), 4 deletions(-)

diff --git a/src/renderer/src/providers/AiProvider/AnthropicProvider.ts b/src/renderer/src/providers/AiProvider/AnthropicProvider.ts
index c7cc3b37ed..79e7207e72 100644
--- a/src/renderer/src/providers/AiProvider/AnthropicProvider.ts
+++ b/src/renderer/src/providers/AiProvider/AnthropicProvider.ts
@@ -290,7 +290,6 @@ export default class AnthropicProvider extends BaseProvider {
 
     const processStream = async (body: MessageCreateParamsNonStreaming, idx: number) => {
       let time_first_token_millsec = 0
-      const start_time_millsec = new Date().getTime()
 
       if (!streamOutput) {
         const message = await this.sdk.messages.create({ ...body, stream: false })
@@ -484,6 +483,7 @@ export default class AnthropicProvider extends BaseProvider {
       })
     }
     onChunk({ type: ChunkType.LLM_RESPONSE_CREATED })
+    const start_time_millsec = new Date().getTime()
     await processStream(body, 0).finally(cleanup)
   }
 
diff --git a/src/renderer/src/providers/AiProvider/GeminiProvider.ts b/src/renderer/src/providers/AiProvider/GeminiProvider.ts
index e45dc134bd..be7707c4d2 100644
--- a/src/renderer/src/providers/AiProvider/GeminiProvider.ts
+++ b/src/renderer/src/providers/AiProvider/GeminiProvider.ts
@@ -500,7 +500,6 @@ export default class GeminiProvider extends BaseProvider {
 
       let functionCalls: FunctionCall[] = []
       let time_first_token_millsec = 0
-      const start_time_millsec = new Date().getTime()
 
       if (stream instanceof GenerateContentResponse) {
         let content = ''
@@ -647,6 +646,7 @@ export default class GeminiProvider extends BaseProvider {
     }
 
     onChunk({ type: ChunkType.LLM_RESPONSE_CREATED })
+    const start_time_millsec = new Date().getTime()
     const userMessagesStream = await chat.sendMessageStream({
       message: messageContents as PartUnion,
       config: {
diff --git a/src/renderer/src/providers/AiProvider/OpenAICompatibleProvider.ts b/src/renderer/src/providers/AiProvider/OpenAICompatibleProvider.ts
index 33675a0885..057a1e3e06 100644
--- a/src/renderer/src/providers/AiProvider/OpenAICompatibleProvider.ts
+++ b/src/renderer/src/providers/AiProvider/OpenAICompatibleProvider.ts
@@ -518,7 +518,6 @@ export default class OpenAICompatibleProvider extends BaseOpenAiProvider {
     const processStream = async (stream: any, idx: number) => {
       const toolCalls: ChatCompletionMessageToolCall[] = []
       let time_first_token_millsec = 0
-      const start_time_millsec = new Date().getTime()
 
       // Handle non-streaming case (already returns early, no change needed here)
       if (!isSupportStreamOutput()) {
@@ -831,6 +830,7 @@ export default class OpenAICompatibleProvider extends BaseOpenAiProvider {
     reqMessages = processReqMessages(model, reqMessages)
     // 等待接口返回流
     onChunk({ type: ChunkType.LLM_RESPONSE_CREATED })
+    const start_time_millsec = new Date().getTime()
     const stream = await this.sdk.chat.completions
       // @ts-ignore key is not typed
       .create(
diff --git a/src/renderer/src/providers/AiProvider/OpenAIProvider.ts b/src/renderer/src/providers/AiProvider/OpenAIProvider.ts
index 122f87888d..51f61136b3 100644
--- a/src/renderer/src/providers/AiProvider/OpenAIProvider.ts
+++ b/src/renderer/src/providers/AiProvider/OpenAIProvider.ts
@@ -567,7 +567,6 @@ export abstract class BaseOpenAiProvider extends BaseProvider {
     ) => {
       const toolCalls: OpenAI.Responses.ResponseFunctionToolCall[] = []
       let time_first_token_millsec = 0
-      const start_time_millsec = new Date().getTime()
 
       if (!streamOutput) {
         const nonStream = stream as OpenAI.Responses.Response
@@ -785,6 +784,7 @@ export abstract class BaseOpenAiProvider extends BaseProvider {
     }
 
     onChunk({ type: ChunkType.LLM_RESPONSE_CREATED })
+    const start_time_millsec = new Date().getTime()
     const stream = await this.sdk.responses.create(
       {
         model: model.id,

From dd5229d5bae56e29a0c8a9fdf1c9c798335e75c2 Mon Sep 17 00:00:00 2001
From: Chen Tao <70054568+eeee0717@users.noreply.github.com>
Date: Mon, 12 May 2025 20:32:28 +0800
Subject: [PATCH 05/50] feat(knowledge): adjust default top-n to 10 (#5919)

---
 src/main/reranker/BaseReranker.ts                               | 2 +-
 .../src/pages/knowledge/components/KnowledgeSettingsPopup.tsx   | 2 +-
 2 files changed, 2 insertions(+), 2 deletions(-)

diff --git a/src/main/reranker/BaseReranker.ts b/src/main/reranker/BaseReranker.ts
index 5a8bd6ee2a..a88d0883ae 100644
--- a/src/main/reranker/BaseReranker.ts
+++ b/src/main/reranker/BaseReranker.ts
@@ -38,7 +38,7 @@ export default abstract class BaseReranker {
   protected getRerankRequestBody(query: string, searchResults: ExtractChunkData[]) {
     const provider = this.base.rerankModelProvider
     const documents = searchResults.map((doc) => doc.pageContent)
-    const topN = this.base.topN || 5
+    const topN = this.base.topN || 10
 
     if (provider === 'voyageai') {
       return {
diff --git a/src/renderer/src/pages/knowledge/components/KnowledgeSettingsPopup.tsx b/src/renderer/src/pages/knowledge/components/KnowledgeSettingsPopup.tsx
index bf318fb265..f409990094 100644
--- a/src/renderer/src/pages/knowledge/components/KnowledgeSettingsPopup.tsx
+++ b/src/renderer/src/pages/knowledge/components/KnowledgeSettingsPopup.tsx
@@ -291,7 +291,7 @@ const PopupContainer: React.FC<Props> = ({ base: _base, resolve }) => {
             rules={[
               {
                 validator(_, value) {
-                  if (value && (value < 0 || value > 10)) {
+                  if (value && (value < 0 || value > 30)) {
                     return Promise.reject(new Error(t('knowledge.topN_too_large_or_small')))
                   }
                   return Promise.resolve()

From 0a2d0ec4a8261d9f8555f19af760a28398ab60a5 Mon Sep 17 00:00:00 2001
From: one <wangan.cs@gmail.com>
Date: Mon, 12 May 2025 20:43:45 +0800
Subject: [PATCH 06/50] refactor: SelectModelPopup pinning (#5855)

* refactor: focus the hovered item when toggling a pinned model

* refactor: focus the selected item after loading pinned models

* refactor: update sticky group after loading pinned models

* fix: rapidly update sticky group

* refactor: defer lastscrolloffset

* refactor: rename updateOnListChange to focusOnListChange for clarity

* refactor: increaset overscan count

* refactor: use startTransition instead of deferred value

* refactor: add guard, clean up code

* refactor: simplify cleanup logic

* refactor: remove unnecessary dep on  pinnedModels

* fix: flicker on searching

* refactor: simplify tag tooltips, prevent tooltips in SelectModelPopup
---
 src/renderer/src/components/CustomTag.tsx     |  15 +-
 .../src/components/ModelTagsWithLabel.tsx     |  22 ++-
 .../Popups/SelectModelPopup/hook.ts           |   5 +-
 .../Popups/SelectModelPopup/popup.tsx         | 138 ++++++++++--------
 .../Popups/SelectModelPopup/reducer.ts        |   9 +-
 .../Popups/SelectModelPopup/types.ts          |   3 +-
 6 files changed, 103 insertions(+), 89 deletions(-)

diff --git a/src/renderer/src/components/CustomTag.tsx b/src/renderer/src/components/CustomTag.tsx
index 76334ae6cb..c875ba01a4 100644
--- a/src/renderer/src/components/CustomTag.tsx
+++ b/src/renderer/src/components/CustomTag.tsx
@@ -1,6 +1,6 @@
 import { CloseOutlined } from '@ant-design/icons'
 import { Tooltip } from 'antd'
-import { FC, memo } from 'react'
+import { FC, memo, useMemo } from 'react'
 import styled from 'styled-components'
 
 interface CustomTagProps {
@@ -14,13 +14,22 @@ interface CustomTagProps {
 }
 
 const CustomTag: FC<CustomTagProps> = ({ children, icon, color, size = 12, tooltip, closable = false, onClose }) => {
-  return (
-    <Tooltip title={tooltip} placement="top">
+  const tagContent = useMemo(
+    () => (
       <Tag $color={color} $size={size} $closable={closable}>
         {icon && icon} {children}
         {closable && <CloseIcon $size={size} $color={color} onClick={onClose} />}
       </Tag>
+    ),
+    [children, closable, color, icon, onClose, size]
+  )
+
+  return tooltip ? (
+    <Tooltip title={tooltip} placement="top" mouseEnterDelay={0.3}>
+      {tagContent}
     </Tooltip>
+  ) : (
+    tagContent
   )
 }
 
diff --git a/src/renderer/src/components/ModelTagsWithLabel.tsx b/src/renderer/src/components/ModelTagsWithLabel.tsx
index 9e5feb45b0..86a04dd454 100644
--- a/src/renderer/src/components/ModelTagsWithLabel.tsx
+++ b/src/renderer/src/components/ModelTagsWithLabel.tsx
@@ -23,6 +23,7 @@ interface ModelTagsProps {
   showToolsCalling?: boolean
   size?: number
   showLabel?: boolean
+  showTooltip?: boolean
   style?: React.CSSProperties
 }
 
@@ -33,6 +34,7 @@ const ModelTagsWithLabel: FC<ModelTagsProps> = ({
   showToolsCalling = true,
   size = 12,
   showLabel = true,
+  showTooltip = true,
   style
 }) => {
   const { t } = useTranslation()
@@ -73,7 +75,7 @@ const ModelTagsWithLabel: FC<ModelTagsProps> = ({
           size={size}
           color="#00b96b"
           icon={<EyeOutlined style={{ fontSize: size }} />}
-          tooltip={t('models.type.vision')}>
+          tooltip={showTooltip ? t('models.type.vision') : undefined}>
           {shouldShowLabel ? t('models.type.vision') : ''}
         </CustomTag>
       )}
@@ -82,7 +84,7 @@ const ModelTagsWithLabel: FC<ModelTagsProps> = ({
           size={size}
           color="#1677ff"
           icon={<GlobalOutlined style={{ fontSize: size }} />}
-          tooltip={t('models.type.websearch')}>
+          tooltip={showTooltip ? t('models.type.websearch') : undefined}>
           {shouldShowLabel ? t('models.type.websearch') : ''}
         </CustomTag>
       )}
@@ -91,7 +93,7 @@ const ModelTagsWithLabel: FC<ModelTagsProps> = ({
           size={size}
           color="#6372bd"
           icon={<i className="iconfont icon-thinking" />}
-          tooltip={t('models.type.reasoning')}>
+          tooltip={showTooltip ? t('models.type.reasoning') : undefined}>
           {shouldShowLabel ? t('models.type.reasoning') : ''}
         </CustomTag>
       )}
@@ -100,19 +102,13 @@ const ModelTagsWithLabel: FC<ModelTagsProps> = ({
           size={size}
           color="#f18737"
           icon={<ToolOutlined style={{ fontSize: size }} />}
-          tooltip={t('models.type.function_calling')}>
+          tooltip={showTooltip ? t('models.type.function_calling') : undefined}>
           {shouldShowLabel ? t('models.type.function_calling') : ''}
         </CustomTag>
       )}
-      {isEmbeddingModel(model) && (
-        <CustomTag size={size} color="#FFA500" icon={t('models.type.embedding')} tooltip={t('models.type.embedding')} />
-      )}
-      {showFree && isFreeModel(model) && (
-        <CustomTag size={size} color="#7cb305" icon={t('models.type.free')} tooltip={t('models.type.free')} />
-      )}
-      {isRerankModel(model) && (
-        <CustomTag size={size} color="#6495ED" icon={t('models.type.rerank')} tooltip={t('models.type.rerank')} />
-      )}
+      {isEmbeddingModel(model) && <CustomTag size={size} color="#FFA500" icon={t('models.type.embedding')} />}
+      {showFree && isFreeModel(model) && <CustomTag size={size} color="#7cb305" icon={t('models.type.free')} />}
+      {isRerankModel(model) && <CustomTag size={size} color="#6495ED" icon={t('models.type.rerank')} />}
     </Container>
   )
 }
diff --git a/src/renderer/src/components/Popups/SelectModelPopup/hook.ts b/src/renderer/src/components/Popups/SelectModelPopup/hook.ts
index 93441acb21..4a8206df69 100644
--- a/src/renderer/src/components/Popups/SelectModelPopup/hook.ts
+++ b/src/renderer/src/components/Popups/SelectModelPopup/hook.ts
@@ -21,9 +21,8 @@ export function useScrollState() {
       focusPage: (modelItems: FlatListItem[], currentIndex: number, step: number) =>
         dispatch({ type: 'FOCUS_PAGE', payload: { modelItems, currentIndex, step } }),
       searchChanged: (searchText: string) => dispatch({ type: 'SEARCH_CHANGED', payload: { searchText } }),
-      updateOnListChange: (modelItems: FlatListItem[]) =>
-        dispatch({ type: 'UPDATE_ON_LIST_CHANGE', payload: { modelItems } }),
-      initScroll: () => dispatch({ type: 'INIT_SCROLL' })
+      focusOnListChange: (modelItems: FlatListItem[]) =>
+        dispatch({ type: 'FOCUS_ON_LIST_CHANGE', payload: { modelItems } })
     }),
     []
   )
diff --git a/src/renderer/src/components/Popups/SelectModelPopup/popup.tsx b/src/renderer/src/components/Popups/SelectModelPopup/popup.tsx
index febf768189..558b254ae0 100644
--- a/src/renderer/src/components/Popups/SelectModelPopup/popup.tsx
+++ b/src/renderer/src/components/Popups/SelectModelPopup/popup.tsx
@@ -11,7 +11,16 @@ import { classNames } from '@renderer/utils/style'
 import { Avatar, Divider, Empty, Input, InputRef, Modal } from 'antd'
 import { first, sortBy } from 'lodash'
 import { Search } from 'lucide-react'
-import { useCallback, useDeferredValue, useEffect, useMemo, useRef, useState } from 'react'
+import {
+  startTransition,
+  useCallback,
+  useDeferredValue,
+  useEffect,
+  useLayoutEffect,
+  useMemo,
+  useRef,
+  useState
+} from 'react'
 import React from 'react'
 import { useTranslation } from 'react-i18next'
 import { FixedSizeList } from 'react-window'
@@ -34,7 +43,7 @@ interface Props extends PopupParams {
 const PopupContainer: React.FC<Props> = ({ model, resolve }) => {
   const { t } = useTranslation()
   const { providers } = useProviders()
-  const { pinnedModels, togglePinnedModel, loading: loadingPinnedModels } = usePinnedModels()
+  const { pinnedModels, togglePinnedModel, loading } = usePinnedModels()
   const [open, setOpen] = useState(true)
   const inputRef = useRef<InputRef>(null)
   const listRef = useRef<FixedSizeList>(null)
@@ -49,29 +58,40 @@ const PopupContainer: React.FC<Props> = ({ model, resolve }) => {
     focusedItemKey,
     scrollTrigger,
     lastScrollOffset,
-    stickyGroup: _stickyGroup,
+    stickyGroup,
     isMouseOver,
-    setFocusedItemKey,
+    setFocusedItemKey: _setFocusedItemKey,
     setScrollTrigger,
-    setLastScrollOffset,
-    setStickyGroup,
+    setLastScrollOffset: _setLastScrollOffset,
+    setStickyGroup: _setStickyGroup,
     setIsMouseOver,
     focusNextItem,
     focusPage,
     searchChanged,
-    updateOnListChange,
-    initScroll
+    focusOnListChange
   } = useScrollState()
 
-  const stickyGroup = useDeferredValue(_stickyGroup)
   const firstGroupRef = useRef<FlatListItem | null>(null)
 
-  const togglePin = useCallback(
-    async (modelId: string) => {
-      await togglePinnedModel(modelId)
-      setScrollTrigger('none') // pin操作不触发滚动
+  const setFocusedItemKey = useCallback(
+    (key: string) => {
+      startTransition(() => _setFocusedItemKey(key))
     },
-    [togglePinnedModel, setScrollTrigger]
+    [_setFocusedItemKey]
+  )
+
+  const setLastScrollOffset = useCallback(
+    (offset: number) => {
+      startTransition(() => _setLastScrollOffset(offset))
+    },
+    [_setLastScrollOffset]
+  )
+
+  const setStickyGroup = useCallback(
+    (group: FlatListItem | null) => {
+      startTransition(() => _setStickyGroup(group))
+    },
+    [_setStickyGroup]
   )
 
   // 根据输入的文本筛选模型
@@ -89,14 +109,11 @@ const PopupContainer: React.FC<Props> = ({ model, resolve }) => {
           const lowerFullName = fullName.toLowerCase()
           return keywords.every((keyword) => lowerFullName.includes(keyword))
         })
-      } else {
-        // 如果不是搜索状态，过滤掉已固定的模型
-        models = models.filter((m) => !pinnedModels.includes(getModelUniqId(m)))
       }
 
       return sortBy(models, ['group', 'name'])
     },
-    [searchText, t, pinnedModels]
+    [searchText, t]
   )
 
   // 创建模型列表项
@@ -116,7 +133,7 @@ const PopupContainer: React.FC<Props> = ({ model, resolve }) => {
         ),
         tags: (
           <TagsContainer>
-            <ModelTagsWithLabel model={model} size={11} showLabel={false} />
+            <ModelTagsWithLabel model={model} size={11} showLabel={false} showTooltip={false} />
           </TagsContainer>
         ),
         icon: (
@@ -137,7 +154,7 @@ const PopupContainer: React.FC<Props> = ({ model, resolve }) => {
     const items: FlatListItem[] = []
 
     // 添加置顶模型分组（仅在无搜索文本时）
-    if (pinnedModels.length > 0 && searchText.length === 0) {
+    if (searchText.length === 0 && pinnedModels.length > 0) {
       const pinnedItems = providers.flatMap((p) =>
         p.models.filter((m) => pinnedModels.includes(getModelUniqId(m))).map((m) => createModelItem(m, p, true))
       )
@@ -158,7 +175,7 @@ const PopupContainer: React.FC<Props> = ({ model, resolve }) => {
     // 添加常规模型分组
     providers.forEach((p) => {
       const filteredModels = getFilteredModels(p).filter(
-        (m) => !pinnedModels.includes(getModelUniqId(m)) || searchText.length > 0
+        (m) => searchText.length > 0 || !pinnedModels.includes(getModelUniqId(m))
       )
 
       if (filteredModels.length === 0) return
@@ -198,48 +215,53 @@ const PopupContainer: React.FC<Props> = ({ model, resolve }) => {
   const updateStickyGroup = useCallback(
     (scrollOffset?: number) => {
       if (listItems.length === 0) {
-        setStickyGroup(null)
+        stickyGroup && setStickyGroup(null)
         return
       }
 
+      let newStickyGroup: FlatListItem | null = null
+
       // 基于滚动位置计算当前可见的第一个项的索引
       const estimatedIndex = Math.floor((scrollOffset ?? lastScrollOffset) / ITEM_HEIGHT)
 
       // 从该索引向前查找最近的分组标题
       for (let i = estimatedIndex - 1; i >= 0; i--) {
         if (i < listItems.length && listItems[i]?.type === 'group') {
-          setStickyGroup(listItems[i])
-          return
+          newStickyGroup = listItems[i]
+          break
         }
       }
 
       // 找不到则使用第一个分组标题
-      setStickyGroup(firstGroupRef.current)
-    },
-    [listItems, lastScrollOffset, setStickyGroup]
-  )
+      if (!newStickyGroup) newStickyGroup = firstGroupRef.current
 
-  // 在listItems变化时更新sticky group
-  useEffect(() => {
-    updateStickyGroup()
-  }, [listItems, updateStickyGroup])
+      if (stickyGroup?.key !== newStickyGroup?.key) {
+        setStickyGroup(newStickyGroup)
+      }
+    },
+    [listItems, lastScrollOffset, setStickyGroup, stickyGroup]
+  )
 
   // 处理列表滚动事件，更新lastScrollOffset并更新sticky分组
   const handleScroll = useCallback(
     ({ scrollOffset }) => {
       setLastScrollOffset(scrollOffset)
-      updateStickyGroup(scrollOffset)
     },
-    [updateStickyGroup, setLastScrollOffset]
+    [setLastScrollOffset]
   )
 
-  // 在列表项更新时，更新焦点项
+  // 列表项更新时，更新焦点
   useEffect(() => {
-    updateOnListChange(modelItems)
-  }, [modelItems, updateOnListChange])
+    if (!loading) focusOnListChange(modelItems)
+  }, [modelItems, focusOnListChange, loading])
+
+  // 列表项更新时，更新sticky分组
+  useEffect(() => {
+    if (!loading) updateStickyGroup()
+  }, [modelItems, updateStickyGroup, loading])
 
   // 滚动到聚焦项
-  useEffect(() => {
+  useLayoutEffect(() => {
     if (scrollTrigger === 'none' || !focusedItemKey) return
 
     const index = listItems.findIndex((item) => item.key === focusedItemKey)
@@ -302,23 +324,12 @@ const PopupContainer: React.FC<Props> = ({ model, resolve }) => {
           break
         case 'Escape':
           e.preventDefault()
-          setScrollTrigger('none')
           setOpen(false)
           resolve(undefined)
           break
       }
     },
-    [
-      focusedItemKey,
-      modelItems,
-      handleItemClick,
-      open,
-      resolve,
-      setIsMouseOver,
-      focusNextItem,
-      focusPage,
-      setScrollTrigger
-    ]
+    [focusedItemKey, modelItems, handleItemClick, open, resolve, setIsMouseOver, focusNextItem, focusPage]
   )
 
   useEffect(() => {
@@ -327,11 +338,10 @@ const PopupContainer: React.FC<Props> = ({ model, resolve }) => {
   }, [handleKeyDown])
 
   const onCancel = useCallback(() => {
-    setScrollTrigger('initial')
     setOpen(false)
-  }, [setScrollTrigger])
+  }, [])
 
-  const onClose = useCallback(async () => {
+  const onAfterClose = useCallback(async () => {
     setScrollTrigger('initial')
     resolve(undefined)
     SelectModelPopup.hide()
@@ -339,10 +349,16 @@ const PopupContainer: React.FC<Props> = ({ model, resolve }) => {
 
   // 初始化焦点和滚动位置
   useEffect(() => {
-    if (!open || loadingPinnedModels) return
+    if (!open) return
     setTimeout(() => inputRef.current?.focus(), 0)
-    initScroll()
-  }, [open, initScroll, loadingPinnedModels])
+  }, [open])
+
+  const togglePin = useCallback(
+    async (modelId: string) => {
+      await togglePinnedModel(modelId)
+    },
+    [togglePinnedModel]
+  )
 
   const RowData = useMemo(
     (): VirtualizedRowData => ({
@@ -365,7 +381,7 @@ const PopupContainer: React.FC<Props> = ({ model, resolve }) => {
       centered
       open={open}
       onCancel={onCancel}
-      afterClose={onClose}
+      afterClose={onAfterClose}
       width={600}
       transitionName="animation-move-down"
       styles={{
@@ -408,7 +424,7 @@ const PopupContainer: React.FC<Props> = ({ model, resolve }) => {
       <Divider style={{ margin: 0, marginTop: 4, borderBlockStartWidth: 0.5 }} />
 
       {listItems.length > 0 ? (
-        <ListContainer onMouseMove={() => !isMouseOver && setIsMouseOver(true)}>
+        <ListContainer onMouseMove={() => !isMouseOver && startTransition(() => setIsMouseOver(true))}>
           {/* Sticky Group Banner，它会替换第一个分组名称 */}
           <StickyGroupBanner>{stickyGroup?.name}</StickyGroupBanner>
           <FixedSizeList
@@ -456,6 +472,8 @@ const VirtualizedRow = React.memo(
       return <div style={style} />
     }
 
+    const isFocused = item.key === focusedItemKey
+
     return (
       <div style={style}>
         {item.type === 'group' ? (
@@ -463,11 +481,11 @@ const VirtualizedRow = React.memo(
         ) : (
           <ModelItem
             className={classNames({
-              focused: item.key === focusedItemKey,
+              focused: isFocused,
               selected: item.isSelected
             })}
             onClick={() => handleItemClick(item)}
-            onMouseEnter={() => setFocusedItemKey(item.key)}>
+            onMouseOver={() => !isFocused && setFocusedItemKey(item.key)}>
             <ModelItemLeft>
               {item.icon}
               {item.name}
diff --git a/src/renderer/src/components/Popups/SelectModelPopup/reducer.ts b/src/renderer/src/components/Popups/SelectModelPopup/reducer.ts
index 45e3390ea8..974fc5b509 100644
--- a/src/renderer/src/components/Popups/SelectModelPopup/reducer.ts
+++ b/src/renderer/src/components/Popups/SelectModelPopup/reducer.ts
@@ -72,7 +72,7 @@ export const scrollReducer = (state: ScrollState, action: ScrollAction): ScrollS
         scrollTrigger: action.payload.searchText ? 'search' : 'initial'
       }
 
-    case 'UPDATE_ON_LIST_CHANGE': {
+    case 'FOCUS_ON_LIST_CHANGE': {
       const { modelItems } = action.payload
 
       // 在列表变化时尝试聚焦一个模型：
@@ -96,13 +96,6 @@ export const scrollReducer = (state: ScrollState, action: ScrollAction): ScrollS
       }
     }
 
-    case 'INIT_SCROLL':
-      return {
-        ...state,
-        scrollTrigger: 'initial',
-        lastScrollOffset: 0
-      }
-
     default:
       return state
   }
diff --git a/src/renderer/src/components/Popups/SelectModelPopup/types.ts b/src/renderer/src/components/Popups/SelectModelPopup/types.ts
index 41ec04c583..745e9688bb 100644
--- a/src/renderer/src/components/Popups/SelectModelPopup/types.ts
+++ b/src/renderer/src/components/Popups/SelectModelPopup/types.ts
@@ -38,5 +38,4 @@ export type ScrollAction =
   | { type: 'FOCUS_NEXT_ITEM'; payload: { modelItems: FlatListItem[]; step: number } }
   | { type: 'FOCUS_PAGE'; payload: { modelItems: FlatListItem[]; currentIndex: number; step: number } }
   | { type: 'SEARCH_CHANGED'; payload: { searchText: string } }
-  | { type: 'UPDATE_ON_LIST_CHANGE'; payload: { modelItems: FlatListItem[] } }
-  | { type: 'INIT_SCROLL'; payload?: void }
+  | { type: 'FOCUS_ON_LIST_CHANGE'; payload: { modelItems: FlatListItem[] } }

From 0b45e1fd11de373a480dd250928336aa741f2c2c Mon Sep 17 00:00:00 2001
From: Chen Tao <70054568+eeee0717@users.noreply.github.com>
Date: Mon, 12 May 2025 20:49:31 +0800
Subject: [PATCH 07/50] fix: add i18n (#5921)

* fix(i18n)

* Update en-us.json
---
 src/renderer/src/i18n/locales/en-us.json | 2 +-
 src/renderer/src/i18n/locales/ja-jp.json | 2 +-
 src/renderer/src/i18n/locales/ru-ru.json | 2 +-
 src/renderer/src/i18n/locales/zh-cn.json | 2 +-
 src/renderer/src/i18n/locales/zh-tw.json | 2 +-
 5 files changed, 5 insertions(+), 5 deletions(-)

diff --git a/src/renderer/src/i18n/locales/en-us.json b/src/renderer/src/i18n/locales/en-us.json
index 4db5907ac4..e5cc69df61 100644
--- a/src/renderer/src/i18n/locales/en-us.json
+++ b/src/renderer/src/i18n/locales/en-us.json
@@ -489,7 +489,7 @@
       "threshold_tooltip": "Used to evaluate the relevance between the user's question and the content in the knowledge base (0-1)",
       "title": "Knowledge Base",
       "topN": "Number of results returned",
-      "topN__too_large_or_small": "The number of results returned cannot be greater than 100 or less than 1.",
+      "topN_too_large_or_small": "The number of results returned cannot be greater than 30 or less than 1.",
       "topN_placeholder": "Not set",
       "topN_tooltip": "The number of matching results returned; the larger the value, the more matching results, but also the more tokens consumed.",
       "url_added": "URL added",
diff --git a/src/renderer/src/i18n/locales/ja-jp.json b/src/renderer/src/i18n/locales/ja-jp.json
index 6e9ab12361..a403b3292c 100644
--- a/src/renderer/src/i18n/locales/ja-jp.json
+++ b/src/renderer/src/i18n/locales/ja-jp.json
@@ -489,7 +489,7 @@
       "threshold_tooltip": "ユーザーの質問と知識ベースの内容の関連性を評価するためのしきい値（0-1）",
       "title": "ナレッジベース",
       "topN": "返却される結果の数",
-      "topN__too_large_or_small": "結果の数は100より大きくてはならず、1より小さくてはなりません。",
+      "topN_too_large_or_small": "結果の数は30より大きくてはならず、1より小さくてはなりません。",
       "topN_placeholder": "未設定",
       "topN_tooltip": "返されるマッチ結果の数は、数値が大きいほどマッチ結果が多くなりますが、消費されるトークンも増えます。",
       "url_added": "URLが追加されました",
diff --git a/src/renderer/src/i18n/locales/ru-ru.json b/src/renderer/src/i18n/locales/ru-ru.json
index 82f03caebb..d0920fd2cf 100644
--- a/src/renderer/src/i18n/locales/ru-ru.json
+++ b/src/renderer/src/i18n/locales/ru-ru.json
@@ -489,7 +489,7 @@
       "threshold_tooltip": "Используется для оценки соответствия между пользовательским вопросом и содержимым в базе знаний (0-1)",
       "title": "База знаний",
       "topN": "Количество возвращаемых результатов",
-      "topN__too_large_or_small": "Количество возвращаемых результатов не может быть больше 100 или меньше 1.",
+      "topN_too_large_or_small": "Количество возвращаемых результатов не может быть больше 30 или меньше 1.",
       "topN_placeholder": "Не установлено",
       "topN_tooltip": "Количество возвращаемых совпадений; чем больше значение, тем больше совпадений, но и потребление токенов тоже возрастает.",
       "url_added": "URL добавлен",
diff --git a/src/renderer/src/i18n/locales/zh-cn.json b/src/renderer/src/i18n/locales/zh-cn.json
index f3545271d1..85c9e4c485 100644
--- a/src/renderer/src/i18n/locales/zh-cn.json
+++ b/src/renderer/src/i18n/locales/zh-cn.json
@@ -493,7 +493,7 @@
       "threshold_tooltip": "用于衡量用户问题与知识库内容之间的相关性（0-1）",
       "title": "知识库",
       "topN": "返回结果数量",
-      "topN__too_large_or_small": "返回结果数量不能大于100或小于1",
+      "topN_too_large_or_small": "返回结果数量不能大于30或小于1",
       "topN_placeholder": "未设置",
       "topN_tooltip": "返回的匹配结果数量，数值越大，匹配结果越多，但消耗的 Token 也越多",
       "url_added": "网址已添加",
diff --git a/src/renderer/src/i18n/locales/zh-tw.json b/src/renderer/src/i18n/locales/zh-tw.json
index a342046550..212316a4ac 100644
--- a/src/renderer/src/i18n/locales/zh-tw.json
+++ b/src/renderer/src/i18n/locales/zh-tw.json
@@ -489,7 +489,7 @@
       "threshold_tooltip": "用於衡量使用者問題與知識庫內容之間的相關性（0-1）",
       "title": "知識庫",
       "topN": "返回結果數量",
-      "topN__too_large_or_small": "返回結果數量不能大於100或小於1",
+      "topN_too_large_or_small": "返回結果數量不能大於30或小於1",
       "topN_placeholder": "未設定",
       "topN_tooltip": "返回的匹配結果數量，數值越大，匹配結果越多，但消耗的 Token 也越多",
       "url_added": "網址已新增",

From f9611c78e4638c886f1e713a16bea1df469eb4c3 Mon Sep 17 00:00:00 2001
From: George Zhao <38124587+CreatorZZY@users.noreply.github.com>
Date: Mon, 12 May 2025 20:58:35 +0800
Subject: [PATCH 08/50] fix: ensure correct handling of custom mini app updates
 and removals (#5922)

* fix: ensure correct handling of custom mini app updates and removals

* fix: update title for custom mini app to be more concise in localization files

---------

Co-authored-by: George Zhao <georgezhao@SKJLAB>
---
 src/renderer/src/i18n/locales/en-us.json | 2 +-
 src/renderer/src/i18n/locales/zh-cn.json | 2 +-
 src/renderer/src/i18n/locales/zh-tw.json | 2 +-
 src/renderer/src/pages/apps/App.tsx      | 8 +++++---
 4 files changed, 8 insertions(+), 6 deletions(-)

diff --git a/src/renderer/src/i18n/locales/en-us.json b/src/renderer/src/i18n/locales/en-us.json
index e5cc69df61..631f92bc11 100644
--- a/src/renderer/src/i18n/locales/en-us.json
+++ b/src/renderer/src/i18n/locales/en-us.json
@@ -1148,7 +1148,7 @@
       "miniapps": {
         "title": "Mini Apps Settings",
         "custom": {
-          "title": "Custom Mini App",
+          "title": "Custom",
           "edit_title": "Edit Custom Mini App",
           "save_success": "Custom mini app saved successfully.",
           "save_error": "Failed to save custom mini app.",
diff --git a/src/renderer/src/i18n/locales/zh-cn.json b/src/renderer/src/i18n/locales/zh-cn.json
index 85c9e4c485..6ffb9620c1 100644
--- a/src/renderer/src/i18n/locales/zh-cn.json
+++ b/src/renderer/src/i18n/locales/zh-cn.json
@@ -1154,7 +1154,7 @@
           "title": "在浏览器中打开新窗口链接"
         },
         "custom": {
-          "title": "自定义小程序",
+          "title": "自定义",
           "edit_title": "编辑自定义小程序",
           "save_success": "自定义小程序保存成功。",
           "save_error": "自定义小程序保存失败。",
diff --git a/src/renderer/src/i18n/locales/zh-tw.json b/src/renderer/src/i18n/locales/zh-tw.json
index 212316a4ac..17667120e0 100644
--- a/src/renderer/src/i18n/locales/zh-tw.json
+++ b/src/renderer/src/i18n/locales/zh-tw.json
@@ -1156,7 +1156,7 @@
         "custom": {
           "duplicate_ids": "發現重複的ID: {{ids}}",
           "conflicting_ids": "與預設應用ID衝突: {{ids}}",
-          "title": "自定義小程序",
+          "title": "自定義",
           "edit_title": "編輯自定義小程序",
           "save_success": "自定義小程序保存成功。",
           "save_error": "自定義小程序保存失敗。",
diff --git a/src/renderer/src/pages/apps/App.tsx b/src/renderer/src/pages/apps/App.tsx
index 295c77f6cc..506aaded1e 100644
--- a/src/renderer/src/pages/apps/App.tsx
+++ b/src/renderer/src/pages/apps/App.tsx
@@ -53,7 +53,7 @@ const App: FC<Props> = ({ app, onClick, size = 60, isLast }) => {
         return
       }
 
-      const newApp = {
+      const newApp: MinAppType = {
         id: values.id,
         name: values.name,
         url: values.url,
@@ -70,7 +70,7 @@ const App: FC<Props> = ({ app, onClick, size = 60, isLast }) => {
       // 重新加载应用列表
       const reloadedApps = [...ORIGIN_DEFAULT_MIN_APPS, ...(await loadCustomMiniApp())]
       updateDefaultMinApps(reloadedApps)
-      updateMinapps(reloadedApps)
+      updateMinapps([...minapps, newApp])
     } catch (error) {
       message.error(t('settings.miniapps.custom.save_error'))
       console.error('Failed to save custom mini app:', error)
@@ -143,7 +143,9 @@ const App: FC<Props> = ({ app, onClick, size = 60, isLast }) => {
                     message.success(t('settings.miniapps.custom.remove_success'))
                     const reloadedApps = [...ORIGIN_DEFAULT_MIN_APPS, ...(await loadCustomMiniApp())]
                     updateDefaultMinApps(reloadedApps)
-                    updateMinapps(reloadedApps)
+                    updateMinapps(minapps.filter((item) => item.id !== app.id))
+                    updatePinnedMinapps(pinned.filter((item) => item.id !== app.id))
+                    updateDisabledMinapps(disabled.filter((item) => item.id !== app.id))
                   } catch (error) {
                     message.error(t('settings.miniapps.custom.remove_error'))
                     console.error('Failed to remove custom mini app:', error)

From 10ce47239cc48c00728bfaf26fb033d4f9f5d322 Mon Sep 17 00:00:00 2001
From: beyondkmp <beyondkmp@gmail.com>
Date: Mon, 12 May 2025 21:57:50 +0800
Subject: [PATCH 09/50] fix(ipc): enhance theme handling with title bar overlay
 updates and broadcast notifications (#5915)

feat(ipc): enhance theme handling with title bar overlay updates and broadcast notifications
---
 src/main/ipc.ts | 23 ++++++++++++++++-------
 1 file changed, 16 insertions(+), 7 deletions(-)

diff --git a/src/main/ipc.ts b/src/main/ipc.ts
index d628dd45a5..ecb74a57b4 100644
--- a/src/main/ipc.ts
+++ b/src/main/ipc.ts
@@ -121,11 +121,21 @@ export function registerIpc(mainWindow: BrowserWindow, app: Electron.App) {
 
   // theme
   ipcMain.handle(IpcChannel.App_SetTheme, (_, theme: ThemeMode) => {
+    const updateTitleBarOverlay = () => {
+      if (!mainWindow?.setTitleBarOverlay) return
+      const isDark = nativeTheme.shouldUseDarkColors
+      mainWindow.setTitleBarOverlay(isDark ? titleBarOverlayDark : titleBarOverlayLight)
+    }
+
+    const broadcastThemeChange = () => {
+      const isDark = nativeTheme.shouldUseDarkColors
+      const effectiveTheme = isDark ? ThemeMode.dark : ThemeMode.light
+      BrowserWindow.getAllWindows().forEach((win) => win.webContents.send(IpcChannel.ThemeChange, effectiveTheme))
+    }
+
     const notifyThemeChange = () => {
-      const windows = BrowserWindow.getAllWindows()
-      windows.forEach((win) =>
-        win.webContents.send(IpcChannel.ThemeChange, nativeTheme.shouldUseDarkColors ? ThemeMode.dark : ThemeMode.light)
-      )
+      updateTitleBarOverlay()
+      broadcastThemeChange()
     }
 
     if (theme === ThemeMode.auto) {
@@ -133,11 +143,10 @@ export function registerIpc(mainWindow: BrowserWindow, app: Electron.App) {
       nativeTheme.on('updated', notifyThemeChange)
     } else {
       nativeTheme.themeSource = theme
-      nativeTheme.removeAllListeners('updated')
+      nativeTheme.off('updated', notifyThemeChange)
     }
 
-    mainWindow?.setTitleBarOverlay &&
-      mainWindow.setTitleBarOverlay(nativeTheme.shouldUseDarkColors ? titleBarOverlayDark : titleBarOverlayLight)
+    updateTitleBarOverlay()
     configManager.setTheme(theme)
     notifyThemeChange()
   })

From 01439c56d9023c53ca7ce72ee33eae95c9d686d1 Mon Sep 17 00:00:00 2001
From: SuYao <sy20010504@gmail.com>
Date: Tue, 13 May 2025 08:47:14 +0800
Subject: [PATCH 10/50] fix: timer stop (#5914)

---
 src/renderer/src/pages/home/Messages/Blocks/ThinkingBlock.tsx | 3 ++-
 src/renderer/src/store/thunk/messageThunk.ts                  | 4 ++++
 2 files changed, 6 insertions(+), 1 deletion(-)

diff --git a/src/renderer/src/pages/home/Messages/Blocks/ThinkingBlock.tsx b/src/renderer/src/pages/home/Messages/Blocks/ThinkingBlock.tsx
index caf7d3f764..252f3d3f7e 100644
--- a/src/renderer/src/pages/home/Messages/Blocks/ThinkingBlock.tsx
+++ b/src/renderer/src/pages/home/Messages/Blocks/ThinkingBlock.tsx
@@ -89,7 +89,8 @@ const ThinkingBlock: React.FC<Props> = ({ block }) => {
 
     return () => {
       if (intervalId.current) {
-        window.clearInterval(intervalId.current)
+        clearInterval(intervalId.current)
+        intervalId.current = null
       }
     }
   }, [isThinking])
diff --git a/src/renderer/src/store/thunk/messageThunk.ts b/src/renderer/src/store/thunk/messageThunk.ts
index aafe8bc652..a98b69f39d 100644
--- a/src/renderer/src/store/thunk/messageThunk.ts
+++ b/src/renderer/src/store/thunk/messageThunk.ts
@@ -348,6 +348,7 @@ const fetchAndProcessAssistantResponseImpl = async (
         }
       },
       onTextComplete: async (finalText) => {
+        cancelThrottledBlockUpdate()
         if (lastBlockType === MessageBlockType.MAIN_TEXT && lastBlockId) {
           const changes = {
             content: finalText,
@@ -405,6 +406,8 @@ const fetchAndProcessAssistantResponseImpl = async (
         }
       },
       onThinkingComplete: (finalText, final_thinking_millsec) => {
+        cancelThrottledBlockUpdate()
+
         if (lastBlockType === MessageBlockType.THINKING && lastBlockId) {
           const changes = {
             type: MessageBlockType.THINKING,
@@ -446,6 +449,7 @@ const fetchAndProcessAssistantResponseImpl = async (
         }
       },
       onToolCallComplete: (toolResponse: MCPToolResponse) => {
+        cancelThrottledBlockUpdate()
         const existingBlockId = toolCallIdToBlockIdMap.get(toolResponse.id)
         if (toolResponse.status === 'done' || toolResponse.status === 'error') {
           if (!existingBlockId) {

From a90142f4b106579a50b6cf817c9dfd5a691c73a2 Mon Sep 17 00:00:00 2001
From: jwcrystal <121911854+jwcrystal@users.noreply.github.com>
Date: Tue, 13 May 2025 12:20:01 +0800
Subject: [PATCH 11/50] docs: Add Photo instructions to the branch strategy
 document (#5944)

---
 docs/branching-strategy.md | 1 +
 1 file changed, 1 insertion(+)

diff --git a/docs/branching-strategy.md b/docs/branching-strategy.md
index 3196d09fe7..897763af16 100644
--- a/docs/branching-strategy.md
+++ b/docs/branching-strategy.md
@@ -49,3 +49,4 @@ When contributing to Cherry Studio, please follow these guidelines:
 - Include relevant issue numbers in your PR description
 - Make sure all tests pass and code meets our quality standards
 - Critical hotfixes may be submitted against `main` but must also be merged into `develop`
+- Add a photo to show what is different if you add a new feature or modify a component in the UI.

From 2ae1069fc289d745f6dec8f9059281d62b7a16f5 Mon Sep 17 00:00:00 2001
From: dlzmoe <anghunk@gmail.com>
Date: Tue, 13 May 2025 12:21:12 +0800
Subject: [PATCH 12/50] feat: Optimize the display method for the three modes
 (#5938)

chore: Optimize the display method for the three modes
---
 src/renderer/src/pages/home/Messages/MessageTokens.tsx | 9 ++++++++-
 1 file changed, 8 insertions(+), 1 deletion(-)

diff --git a/src/renderer/src/pages/home/Messages/MessageTokens.tsx b/src/renderer/src/pages/home/Messages/MessageTokens.tsx
index 98b4e82732..390b3530df 100644
--- a/src/renderer/src/pages/home/Messages/MessageTokens.tsx
+++ b/src/renderer/src/pages/home/Messages/MessageTokens.tsx
@@ -44,7 +44,10 @@ const MessgeTokens: React.FC<MessageTokensProps> = ({ message }) => {
       <MessageMetadata className={`message-tokens ${hasMetrics ? 'has-metrics' : ''}`} onClick={locateMessage}>
         <span className="metrics">{metrixs}</span>
         <span className="tokens">
-          Tokens: {message?.usage?.total_tokens} ↑{message?.usage?.prompt_tokens} ↓{message?.usage?.completion_tokens}
+          Tokens: 
+          <span>{message?.usage?.total_tokens}</span>
+          <span>↑{message?.usage?.prompt_tokens}</span>
+          <span>↓{message?.usage?.completion_tokens}</span>
         </span>
       </MessageMetadata>
     )
@@ -67,6 +70,10 @@ const MessageMetadata = styled.div`
 
   .tokens {
     display: block;
+
+    span {
+      padding:0 2px;
+    }
   }
 
   &.has-metrics:hover {

From 909acf1da374633534511a84494746aed010a864 Mon Sep 17 00:00:00 2001
From: one <wangan.cs@gmail.com>
Date: Tue, 13 May 2025 13:22:24 +0800
Subject: [PATCH 13/50] fix: animation on resolving SelectModelPopup (#5947)

---
 .../components/Popups/SelectModelPopup/popup.tsx   | 14 ++------------
 1 file changed, 2 insertions(+), 12 deletions(-)

diff --git a/src/renderer/src/components/Popups/SelectModelPopup/popup.tsx b/src/renderer/src/components/Popups/SelectModelPopup/popup.tsx
index 558b254ae0..a02c63bcb2 100644
--- a/src/renderer/src/components/Popups/SelectModelPopup/popup.tsx
+++ b/src/renderer/src/components/Popups/SelectModelPopup/popup.tsx
@@ -278,12 +278,11 @@ const PopupContainer: React.FC<Props> = ({ model, resolve }) => {
   const handleItemClick = useCallback(
     (item: FlatListItem) => {
       if (item.type === 'model') {
-        setScrollTrigger('initial')
         resolve(item.model)
         setOpen(false)
       }
     },
-    [resolve, setScrollTrigger]
+    [resolve]
   )
 
   // 处理键盘导航
@@ -651,16 +650,7 @@ export class SelectModelPopup {
 
   static show(params: PopupParams) {
     return new Promise<Model | undefined>((resolve) => {
-      TopView.show(
-        <PopupContainer
-          {...params}
-          resolve={(v) => {
-            resolve(v)
-            TopView.hide(TopViewKey)
-          }}
-        />,
-        TopViewKey
-      )
+      TopView.show(<PopupContainer {...params} resolve={(v) => resolve(v)} />, TopViewKey)
     })
   }
 }

From ff3d418622e7b715c0f96900c2a4bd9d2bb02957 Mon Sep 17 00:00:00 2001
From: beyondkmp <beyondkmp@gmail.com>
Date: Tue, 13 May 2025 13:41:06 +0800
Subject: [PATCH 14/50] chore: use node-stream-zip to improve perfermanc and
 remove unused dependencies  (#5946)

* chore: remove unused dependencies from package.json and yarn.lock

* fix: update backup extraction progress logging in BackupManager

---------

Co-authored-by: beyondkmp <beyondkmkp@gmail.com>
---
 package.json                       |  2 --
 src/main/services/BackupManager.ts | 15 +++++----------
 yarn.lock                          |  4 +---
 3 files changed, 6 insertions(+), 15 deletions(-)

diff --git a/package.json b/package.json
index 306312cda3..2b3483a952 100644
--- a/package.json
+++ b/package.json
@@ -73,7 +73,6 @@
     "@strongtz/win32-arm64-msvc": "^0.4.7",
     "@tanstack/react-query": "^5.27.0",
     "@types/react-infinite-scroll-component": "^5.0.0",
-    "adm-zip": "^0.5.16",
     "archiver": "^7.0.1",
     "async-mutex": "^0.5.0",
     "color": "^5.0.0",
@@ -84,7 +83,6 @@
     "electron-updater": "6.6.4",
     "electron-window-state": "^5.0.3",
     "epub": "patch:epub@npm%3A1.3.0#~/.yarn/patches/epub-npm-1.3.0-8325494ffe.patch",
-    "extract-zip": "^2.0.1",
     "fast-xml-parser": "^5.2.0",
     "fetch-socks": "^1.3.2",
     "fs-extra": "^11.2.0",
diff --git a/src/main/services/BackupManager.ts b/src/main/services/BackupManager.ts
index ef96529903..6be19d035b 100644
--- a/src/main/services/BackupManager.ts
+++ b/src/main/services/BackupManager.ts
@@ -4,7 +4,7 @@ import archiver from 'archiver'
 import { exec } from 'child_process'
 import { app } from 'electron'
 import Logger from 'electron-log'
-import extract from 'extract-zip'
+import StreamZip from 'node-stream-zip'
 import * as fs from 'fs-extra'
 import * as path from 'path'
 import { createClient, CreateDirectoryOptions, FileStat } from 'webdav'
@@ -231,15 +231,10 @@ class BackupManager {
 
       Logger.log('[backup] step 1: unzip backup file', this.tempDir)
 
-      // 使用 extract-zip 解压
-      await extract(backupPath, {
-        dir: this.tempDir,
-        onEntry: () => {
-          // 这里可以处理进度，但 extract-zip 不提供总条目数信息
-          onProgress({ stage: 'extracting', progress: 15, total: 100 })
-        }
-      })
-      onProgress({ stage: 'extracting', progress: 25, total: 100 })
+      const zip = new StreamZip.async({ file: backupPath })
+      onProgress({ stage: 'extracting', progress: 15, total: 100 })
+      await zip.extract(null, this.tempDir)
+      onProgress({ stage: 'extracted', progress: 25, total: 100 })
 
       Logger.log('[backup] step 2: read data.json')
       // 读取 data.json
diff --git a/yarn.lock b/yarn.lock
index 05068932fd..4d7e8ea9f7 100644
--- a/yarn.lock
+++ b/yarn.lock
@@ -4392,7 +4392,6 @@ __metadata:
     "@vitest/coverage-v8": "npm:^3.1.1"
     "@vitest/ui": "npm:^3.1.1"
     "@xyflow/react": "npm:^12.4.4"
-    adm-zip: "npm:^0.5.16"
     antd: "npm:^5.22.5"
     applescript: "npm:^1.0.0"
     archiver: "npm:^7.0.1"
@@ -4423,7 +4422,6 @@ __metadata:
     eslint-plugin-react-hooks: "npm:^5.2.0"
     eslint-plugin-simple-import-sort: "npm:^12.1.1"
     eslint-plugin-unused-imports: "npm:^4.1.4"
-    extract-zip: "npm:^2.0.1"
     fast-xml-parser: "npm:^5.2.0"
     fetch-socks: "npm:^1.3.2"
     fs-extra: "npm:^11.2.0"
@@ -4540,7 +4538,7 @@ __metadata:
   languageName: node
   linkType: hard
 
-"adm-zip@npm:^0.5.16, adm-zip@npm:^0.5.9":
+"adm-zip@npm:^0.5.9":
   version: 0.5.16
   resolution: "adm-zip@npm:0.5.16"
   checksum: 10c0/6f10119d4570c7ba76dcf428abb8d3f69e63f92e51f700a542b43d4c0130373dd2ddfc8f85059f12d4a843703a90c3970cfd17876844b4f3f48bf042bfa6b49f

From f8603d0c248d07f4d6ac4cf657310b6ea970063d Mon Sep 17 00:00:00 2001
From: one <wangan.cs@gmail.com>
Date: Tue, 13 May 2025 14:48:59 +0800
Subject: [PATCH 15/50] refactor: improve model management UI, add animations
 to some buttons (#5932)

* feat: add motion to ModelListSearchBar

* feat: add motion to health checking button

* refactor(EditModelsPopup): show spin while fetching models

* refactor: remove redundant filtering, use transient props

* chore: remove useless component ModelTags

* refactor: extract and reuse ModelIdWithTags

* refactor(EditModelsPopup): use ExpandableText instead of expandable Typography.Paragraph

* refactor(EditModelsPopup): implement optimistic updates for filter type and loading state

* refactor: startTransition for search

* refactor(EditModelsPopup): enhance search and filter handling with optimistic updates

* refactor(EditModelsPopup): implement debounced search filter updates

---------

Co-authored-by: suyao <sy20010504@gmail.com>
---
 .../src/components/ExpandableText.tsx         |  51 ++++
 .../src/components/ModelIdWithTags.tsx        |  64 +++++
 src/renderer/src/components/ModelTags.tsx     |  51 ----
 .../home/Messages/Blocks/ThinkingBlock.tsx    |  24 +-
 .../ProviderSettings/EditModelsPopup.tsx      | 224 ++++++++++--------
 .../settings/ProviderSettings/ModelList.tsx   |  87 ++-----
 .../ProviderSettings/ModelListSearchBar.tsx   | 104 +++++---
 .../ProviderSettings/ProviderSetting.tsx      |  12 +-
 src/renderer/src/utils/motionVariants.ts      |  18 ++
 9 files changed, 357 insertions(+), 278 deletions(-)
 create mode 100644 src/renderer/src/components/ExpandableText.tsx
 create mode 100644 src/renderer/src/components/ModelIdWithTags.tsx
 delete mode 100644 src/renderer/src/components/ModelTags.tsx
 create mode 100644 src/renderer/src/utils/motionVariants.ts

diff --git a/src/renderer/src/components/ExpandableText.tsx b/src/renderer/src/components/ExpandableText.tsx
new file mode 100644
index 0000000000..5df32bb9c6
--- /dev/null
+++ b/src/renderer/src/components/ExpandableText.tsx
@@ -0,0 +1,51 @@
+import { Button } from 'antd'
+import { memo, useCallback, useMemo, useState } from 'react'
+import { useTranslation } from 'react-i18next'
+import styled from 'styled-components'
+
+interface ExpandableTextProps {
+  text: string
+  style?: React.CSSProperties
+}
+
+const ExpandableText = ({
+  ref,
+  text,
+  style
+}: ExpandableTextProps & { ref?: React.RefObject<HTMLParagraphElement> | null }) => {
+  const { t } = useTranslation()
+  const [isExpanded, setIsExpanded] = useState(false)
+
+  const toggleExpand = useCallback(() => {
+    setIsExpanded((prev) => !prev)
+  }, [])
+
+  const button = useMemo(() => {
+    return (
+      <Button type="link" onClick={toggleExpand} style={{ alignSelf: 'flex-end' }}>
+        {isExpanded ? t('common.collapse') : t('common.expand')}
+      </Button>
+    )
+  }, [isExpanded, t, toggleExpand])
+
+  return (
+    <Container ref={ref} style={style} $expanded={isExpanded}>
+      <TextContainer $expanded={isExpanded}>{text}</TextContainer>
+      {button}
+    </Container>
+  )
+}
+
+const Container = styled.div<{ $expanded?: boolean }>`
+  display: flex;
+  flex-direction: ${(props) => (props.$expanded ? 'column' : 'row')};
+`
+
+const TextContainer = styled.div<{ $expanded?: boolean }>`
+  overflow: hidden;
+  text-overflow: ${(props) => (props.$expanded ? 'unset' : 'ellipsis')};
+  white-space: ${(props) => (props.$expanded ? 'normal' : 'nowrap')};
+  line-height: ${(props) => (props.$expanded ? 'unset' : '30px')};
+`
+
+export default memo(ExpandableText)
diff --git a/src/renderer/src/components/ModelIdWithTags.tsx b/src/renderer/src/components/ModelIdWithTags.tsx
new file mode 100644
index 0000000000..cfd109d0aa
--- /dev/null
+++ b/src/renderer/src/components/ModelIdWithTags.tsx
@@ -0,0 +1,64 @@
+import { Model } from '@renderer/types'
+import { Tooltip, Typography } from 'antd'
+import { memo } from 'react'
+import styled from 'styled-components'
+
+import ModelTagsWithLabel from './ModelTagsWithLabel'
+
+interface ModelIdWithTagsProps {
+  model: Model
+  fontSize?: number
+  style?: React.CSSProperties
+}
+
+const ModelIdWithTags = ({
+  ref,
+  model,
+  fontSize = 14,
+  style
+}: ModelIdWithTagsProps & { ref?: React.RefObject<HTMLDivElement> | null }) => {
+  return (
+    <ListItemName ref={ref} $fontSize={fontSize} style={style}>
+      <Tooltip
+        styles={{
+          root: {
+            width: 'auto',
+            maxWidth: '500px'
+          }
+        }}
+        destroyTooltipOnHide
+        title={
+          <Typography.Text style={{ color: 'white' }} copyable={{ text: model.id }}>
+            {model.id}
+          </Typography.Text>
+        }
+        mouseEnterDelay={0.5}
+        placement="top">
+        <NameSpan>{model.name}</NameSpan>
+      </Tooltip>
+      <ModelTagsWithLabel model={model} size={11} style={{ flexShrink: 0 }} />
+    </ListItemName>
+  )
+}
+
+const ListItemName = styled.div<{ $fontSize?: number }>`
+  display: flex;
+  align-items: center;
+  flex-direction: row;
+  gap: 10px;
+  color: var(--color-text);
+  line-height: 1;
+  font-weight: 600;
+  font-size: ${(props) => props.$fontSize}px;
+`
+
+const NameSpan = styled.span`
+  overflow: hidden;
+  text-overflow: ellipsis;
+  white-space: nowrap;
+  cursor: help;
+  font-family: 'Ubuntu';
+  line-height: 30px;
+`
+
+export default memo(ModelIdWithTags)
diff --git a/src/renderer/src/components/ModelTags.tsx b/src/renderer/src/components/ModelTags.tsx
deleted file mode 100644
index 4c683bff58..0000000000
--- a/src/renderer/src/components/ModelTags.tsx
+++ /dev/null
@@ -1,51 +0,0 @@
-import {
-  isEmbeddingModel,
-  isFunctionCallingModel,
-  isReasoningModel,
-  isRerankModel,
-  isVisionModel,
-  isWebSearchModel
-} from '@renderer/config/models'
-import { Model } from '@renderer/types'
-import { isFreeModel } from '@renderer/utils'
-import { Tag } from 'antd'
-import { FC } from 'react'
-import { useTranslation } from 'react-i18next'
-import styled from 'styled-components'
-
-import ReasoningIcon from './Icons/ReasoningIcon'
-import ToolsCallingIcon from './Icons/ToolsCallingIcon'
-import VisionIcon from './Icons/VisionIcon'
-import WebSearchIcon from './Icons/WebSearchIcon'
-
-interface ModelTagsProps {
-  model: Model
-  showFree?: boolean
-  showReasoning?: boolean
-  showToolsCalling?: boolean
-}
-
-const ModelTags: FC<ModelTagsProps> = ({ model, showFree = true, showReasoning = true, showToolsCalling = true }) => {
-  const { t } = useTranslation()
-  return (
-    <Container>
-      {isVisionModel(model) && <VisionIcon />}
-      {isWebSearchModel(model) && <WebSearchIcon />}
-      {showReasoning && isReasoningModel(model) && <ReasoningIcon />}
-      {showToolsCalling && isFunctionCallingModel(model) && <ToolsCallingIcon />}
-      {isEmbeddingModel(model) && <Tag color="orange">{t('models.type.embedding')}</Tag>}
-      {showFree && isFreeModel(model) && <Tag color="green">{t('models.type.free')}</Tag>}
-      {isRerankModel(model) && <Tag color="geekblue">{t('models.type.rerank')}</Tag>}
-    </Container>
-  )
-}
-
-const Container = styled.div`
-  display: flex;
-  flex-direction: row;
-  align-items: center;
-  justify-content: space-between;
-  gap: 2px;
-`
-
-export default ModelTags
diff --git a/src/renderer/src/pages/home/Messages/Blocks/ThinkingBlock.tsx b/src/renderer/src/pages/home/Messages/Blocks/ThinkingBlock.tsx
index 252f3d3f7e..6911250e9b 100644
--- a/src/renderer/src/pages/home/Messages/Blocks/ThinkingBlock.tsx
+++ b/src/renderer/src/pages/home/Messages/Blocks/ThinkingBlock.tsx
@@ -1,6 +1,7 @@
 import { CheckOutlined } from '@ant-design/icons'
 import { useSettings } from '@renderer/hooks/useSettings'
 import { MessageBlockStatus, type ThinkingMessageBlock } from '@renderer/types/newMessage'
+import { lightbulbVariants } from '@renderer/utils/motionVariants'
 import { Collapse, message as antdMessage, Tooltip } from 'antd'
 import { Lightbulb } from 'lucide-react'
 import { motion } from 'motion/react'
@@ -10,27 +11,6 @@ import styled from 'styled-components'
 
 import Markdown from '../../Markdown/Markdown'
 
-// Define variants outside the component if they don't depend on component's props/state directly
-// or inside if they do (though for this case, outside is fine).
-const lightbulbVariants = {
-  thinking: {
-    opacity: [1, 0.2, 1],
-    transition: {
-      duration: 1.2,
-      ease: 'easeInOut',
-      times: [0, 0.5, 1],
-      repeat: Infinity
-    }
-  },
-  idle: {
-    opacity: 1,
-    transition: {
-      duration: 0.3, // Smooth transition to idle state
-      ease: 'easeInOut'
-    }
-  }
-}
-
 interface Props {
   block: ThinkingMessageBlock
 }
@@ -116,7 +96,7 @@ const ThinkingBlock: React.FC<Props> = ({ block }) => {
               <motion.span
                 style={{ height: '18px' }}
                 variants={lightbulbVariants}
-                animate={isThinking ? 'thinking' : 'idle'}
+                animate={isThinking ? 'active' : 'idle'}
                 initial="idle">
                 <Lightbulb size={18} />
               </motion.span>
diff --git a/src/renderer/src/pages/settings/ProviderSettings/EditModelsPopup.tsx b/src/renderer/src/pages/settings/ProviderSettings/EditModelsPopup.tsx
index 1c5d189bd3..4ff54fa55a 100644
--- a/src/renderer/src/pages/settings/ProviderSettings/EditModelsPopup.tsx
+++ b/src/renderer/src/pages/settings/ProviderSettings/EditModelsPopup.tsx
@@ -1,7 +1,8 @@
-import { LoadingOutlined, MinusOutlined, PlusOutlined } from '@ant-design/icons'
+import { MinusOutlined, PlusOutlined } from '@ant-design/icons'
 import CustomCollapse from '@renderer/components/CustomCollapse'
 import CustomTag from '@renderer/components/CustomTag'
-import ModelTagsWithLabel from '@renderer/components/ModelTagsWithLabel'
+import ExpandableText from '@renderer/components/ExpandableText'
+import ModelIdWithTags from '@renderer/components/ModelIdWithTags'
 import {
   getModelLogo,
   groupQwenModels,
@@ -18,11 +19,12 @@ import FileItem from '@renderer/pages/files/FileItem'
 import { fetchModels } from '@renderer/services/ApiService'
 import { Model, Provider } from '@renderer/types'
 import { getDefaultGroupName, isFreeModel, runAsyncFunction } from '@renderer/utils'
-import { Avatar, Button, Empty, Flex, Modal, Tabs, Tooltip, Typography } from 'antd'
+import { Avatar, Button, Empty, Flex, Modal, Spin, Tabs, Tooltip } from 'antd'
 import Input from 'antd/es/input/Input'
 import { groupBy, isEmpty, uniqBy } from 'lodash'
+import { debounce } from 'lodash'
 import { Search } from 'lucide-react'
-import { useCallback, useEffect, useMemo, useRef, useState } from 'react'
+import { memo, useCallback, useEffect, useMemo, useOptimistic, useRef, useState, useTransition } from 'react'
 import { useTranslation } from 'react-i18next'
 import styled from 'styled-components'
 
@@ -47,7 +49,28 @@ const PopupContainer: React.FC<Props> = ({ provider: _provider, resolve }) => {
   const [listModels, setListModels] = useState<Model[]>([])
   const [loading, setLoading] = useState(false)
   const [searchText, setSearchText] = useState('')
-  const [filterType, setFilterType] = useState<string>('all')
+  const [filterSearchText, setFilterSearchText] = useState('')
+  const debouncedSetFilterText = useMemo(
+    () =>
+      debounce((value: string) => {
+        startSearchTransition(() => {
+          setFilterSearchText(value)
+        })
+      }, 300),
+    []
+  )
+  useEffect(() => {
+    return () => {
+      debouncedSetFilterText.cancel()
+    }
+  }, [debouncedSetFilterText])
+  const [actualFilterType, setActualFilterType] = useState<string>('all')
+  const [optimisticFilterType, setOptimisticFilterTypeFn] = useOptimistic(
+    actualFilterType,
+    (_currentFilterType, newFilterType: string) => newFilterType
+  )
+  const [isSearchPending, startSearchTransition] = useTransition()
+  const [isFilterTypePending, startFilterTypeTransition] = useTransition()
   const { t, i18n } = useTranslation()
   const searchInputRef = useRef<any>(null)
 
@@ -56,14 +79,14 @@ const PopupContainer: React.FC<Props> = ({ provider: _provider, resolve }) => {
 
   const list = allModels.filter((model) => {
     if (
-      searchText &&
-      !model.id.toLocaleLowerCase().includes(searchText.toLocaleLowerCase()) &&
-      !model.name?.toLocaleLowerCase().includes(searchText.toLocaleLowerCase())
+      filterSearchText &&
+      !model.id.toLocaleLowerCase().includes(filterSearchText.toLocaleLowerCase()) &&
+      !model.name?.toLocaleLowerCase().includes(filterSearchText.toLocaleLowerCase())
     ) {
       return false
     }
 
-    switch (filterType) {
+    switch (actualFilterType) {
       case 'reasoning':
         return isReasoningModel(model)
       case 'vision':
@@ -133,9 +156,10 @@ const PopupContainer: React.FC<Props> = ({ provider: _provider, resolve }) => {
             }))
             .filter((model) => !isEmpty(model.name))
         )
-        setLoading(false)
       } catch (error) {
-        setLoading(false)
+        console.error('Failed to fetch models', error)
+      } finally {
+        setTimeout(() => setLoading(false), 300)
       }
     })
     // eslint-disable-next-line react-hooks/exhaustive-deps
@@ -145,7 +169,7 @@ const PopupContainer: React.FC<Props> = ({ provider: _provider, resolve }) => {
     if (open && searchInputRef.current) {
       setTimeout(() => {
         searchInputRef.current?.focus()
-      }, 100)
+      }, 350)
     }
   }, [open])
 
@@ -157,7 +181,6 @@ const PopupContainer: React.FC<Props> = ({ provider: _provider, resolve }) => {
           {i18n.language.startsWith('zh') ? '' : ' '}
           {t('common.models')}
         </ModelHeaderTitle>
-        {loading && <LoadingOutlined size={20} />}
       </Flex>
     )
   }
@@ -170,6 +193,7 @@ const PopupContainer: React.FC<Props> = ({ provider: _provider, resolve }) => {
         title={
           isAllFilteredInProvider ? t('settings.models.manage.remove_listed') : t('settings.models.manage.add_listed')
         }
+        mouseEnterDelay={0.5}
         placement="top">
         <Button
           type={isAllFilteredInProvider ? 'default' : 'primary'}
@@ -200,6 +224,7 @@ const PopupContainer: React.FC<Props> = ({ provider: _provider, resolve }) => {
               ? t(`settings.models.manage.remove_whole_group`)
               : t(`settings.models.manage.add_whole_group`)
           }
+          mouseEnterDelay={0.5}
           placement="top">
           <Button
             type="text"
@@ -242,13 +267,19 @@ const PopupContainer: React.FC<Props> = ({ provider: _provider, resolve }) => {
             ref={searchInputRef}
             placeholder={t('settings.provider.search_placeholder')}
             allowClear
-            onChange={(e) => setSearchText(e.target.value)}
+            value={searchText}
+            onChange={(e) => {
+              const newSearchValue = e.target.value
+              setSearchText(newSearchValue) // Update input field immediately
+              debouncedSetFilterText(newSearchValue)
+            }}
           />
           {renderTopTools()}
         </TopToolsWrapper>
         <Tabs
           size={i18n.language.startsWith('zh') ? 'middle' : 'small'}
           defaultActiveKey="all"
+          activeKey={optimisticFilterType}
           items={[
             { label: t('models.all'), key: 'all' },
             { label: t('models.type.reasoning'), key: 'reasoning' },
@@ -259,92 +290,90 @@ const PopupContainer: React.FC<Props> = ({ provider: _provider, resolve }) => {
             { label: t('models.type.rerank'), key: 'rerank' },
             { label: t('models.type.function_calling'), key: 'function_calling' }
           ]}
-          onChange={(key) => setFilterType(key)}
+          onChange={(key) => {
+            setOptimisticFilterTypeFn(key)
+            startFilterTypeTransition(() => {
+              setActualFilterType(key)
+            })
+          }}
         />
       </SearchContainer>
       <ListContainer>
-        {Object.keys(modelGroups).map((group, i) => {
-          return (
-            <CustomCollapse
-              key={i}
-              defaultActiveKey={['1']}
-              styles={{ body: { padding: '0 10px' } }}
-              label={
-                <Flex align="center" gap={10}>
-                  <span style={{ fontWeight: 600 }}>{group}</span>
-                  <CustomTag color="#02B96B" size={10}>
-                    {modelGroups[group].length}
-                  </CustomTag>
-                </Flex>
-              }
-              extra={renderGroupTools(group)}>
-              <FlexColumn style={{ margin: '10px 0' }}>
-                {modelGroups[group].map((model) => (
-                  <FileItem
-                    style={{
-                      backgroundColor: isModelInProvider(provider, model.id)
-                        ? 'rgba(0, 126, 0, 0.06)'
-                        : 'rgba(255, 255, 255, 0.04)',
-                      border: 'none',
-                      boxShadow: 'none'
-                    }}
-                    key={model.id}
-                    fileInfo={{
-                      icon: <Avatar src={getModelLogo(model.id)}>{model?.name?.[0]?.toUpperCase()}</Avatar>,
-                      name: (
-                        <ListItemName>
-                          <Tooltip
-                            styles={{
-                              root: {
-                                width: 'auto',
-                                maxWidth: '500px'
-                              }
-                            }}
-                            destroyTooltipOnHide
-                            title={
-                              <Typography.Text style={{ color: 'white' }} copyable={{ text: model.id }}>
-                                {model.id}
-                              </Typography.Text>
-                            }
-                            placement="top">
-                            <span style={{ cursor: 'help' }}>{model.name}</span>
-                          </Tooltip>
-                          <ModelTagsWithLabel model={model} size={11} />
-                        </ListItemName>
-                      ),
-                      extra: model.description && (
-                        <div style={{ marginTop: 6 }}>
-                          <Typography.Paragraph
-                            type="secondary"
-                            ellipsis={{ rows: 1, expandable: true }}
-                            style={{ marginBottom: 0, marginTop: 5 }}>
-                            {model.description}
-                          </Typography.Paragraph>
-                        </div>
-                      ),
-                      ext: '.model',
-                      actions: (
-                        <div>
-                          {isModelInProvider(provider, model.id) ? (
-                            <Button type="text" onClick={() => onRemoveModel(model)} icon={<MinusOutlined />} />
-                          ) : (
-                            <Button type="text" onClick={() => onAddModel(model)} icon={<PlusOutlined />} />
-                          )}
-                        </div>
-                      )
-                    }}
-                  />
-                ))}
-              </FlexColumn>
-            </CustomCollapse>
-          )
-        })}
-        {isEmpty(list) && <Empty image={Empty.PRESENTED_IMAGE_SIMPLE} description={t('settings.models.empty')} />}
+        {loading || isFilterTypePending || isSearchPending ? (
+          <Flex justify="center" align="center" style={{ height: '70%' }}>
+            <Spin size="large" />
+          </Flex>
+        ) : (
+          Object.keys(modelGroups).map((group, i) => {
+            return (
+              <CustomCollapse
+                key={i}
+                defaultActiveKey={['1']}
+                styles={{ body: { padding: '0 10px' } }}
+                label={
+                  <Flex align="center" gap={10}>
+                    <span style={{ fontWeight: 600 }}>{group}</span>
+                    <CustomTag color="#02B96B" size={10}>
+                      {modelGroups[group].length}
+                    </CustomTag>
+                  </Flex>
+                }
+                extra={renderGroupTools(group)}>
+                <FlexColumn style={{ margin: '10px 0' }}>
+                  {modelGroups[group].map((model) => (
+                    <ModelListItem
+                      key={model.id}
+                      model={model}
+                      provider={provider}
+                      onAddModel={onAddModel}
+                      onRemoveModel={onRemoveModel}
+                    />
+                  ))}
+                </FlexColumn>
+              </CustomCollapse>
+            )
+          })
+        )}
+        {!(loading || isFilterTypePending || isSearchPending) && isEmpty(list) && (
+          <Empty image={Empty.PRESENTED_IMAGE_SIMPLE} description={t('settings.models.empty')} />
+        )}
       </ListContainer>
     </Modal>
   )
 }
 
+interface ModelListItemProps {
+  model: Model
+  provider: Provider
+  onAddModel: (model: Model) => void
+  onRemoveModel: (model: Model) => void
+}
+
+const ModelListItem: React.FC<ModelListItemProps> = memo(({ model, provider, onAddModel, onRemoveModel }) => {
+  const isAdded = useMemo(() => isModelInProvider(provider, model.id), [provider, model.id])
+
+  return (
+    <FileItem
+      style={{
+        backgroundColor: isAdded ? 'rgba(0, 126, 0, 0.06)' : 'rgba(255, 255, 255, 0.04)',
+        border: 'none',
+        boxShadow: 'none'
+      }}
+      fileInfo={{
+        icon: <Avatar src={getModelLogo(model.id)}>{model?.name?.[0]?.toUpperCase()}</Avatar>,
+        name: <ModelIdWithTags model={model} />,
+        extra: model.description && <ExpandableText text={model.description} />,
+        ext: '.model',
+        actions: isAdded ? (
+          <Button type="text" onClick={() => onRemoveModel(model)} icon={<MinusOutlined />} />
+        ) : (
+          <Button type="text" onClick={() => onAddModel(model)} icon={<PlusOutlined />} />
+        )
+      }}
+    />
+  )
+})
+
 const SearchContainer = styled.div`
   display: flex;
   flex-direction: column;
@@ -382,17 +411,6 @@ const FlexColumn = styled.div`
   margin-top: 16px;
 `
 
-const ListItemName = styled.div`
-  display: flex;
-  flex-direction: row;
-  align-items: center;
-  gap: 10px;
-  color: var(--color-text);
-  font-size: 14px;
-  line-height: 1;
-  font-weight: 600;
-`
-
 const ModelHeaderTitle = styled.div`
   color: var(--color-text);
   font-size: 18px;
diff --git a/src/renderer/src/pages/settings/ProviderSettings/ModelList.tsx b/src/renderer/src/pages/settings/ProviderSettings/ModelList.tsx
index 5789571a9a..7b9741b338 100644
--- a/src/renderer/src/pages/settings/ProviderSettings/ModelList.tsx
+++ b/src/renderer/src/pages/settings/ProviderSettings/ModelList.tsx
@@ -8,7 +8,7 @@ import {
 } from '@ant-design/icons'
 import CustomCollapse from '@renderer/components/CustomCollapse'
 import { HStack } from '@renderer/components/Layout'
-import ModelTagsWithLabel from '@renderer/components/ModelTagsWithLabel'
+import ModelIdWithTags from '@renderer/components/ModelIdWithTags'
 import { getModelLogo } from '@renderer/config/models'
 import { PROVIDER_CONFIG } from '@renderer/config/providers'
 import { useAssistants, useDefaultModel } from '@renderer/hooks/useAssistant'
@@ -36,12 +36,6 @@ const STATUS_COLORS = {
   warning: '#faad14'
 }
 
-interface ModelListProps {
-  providerId: string
-  modelStatuses?: ModelStatus[]
-  searchText?: string
-}
-
 export interface ModelStatus {
   model: Model
   status?: ModelCheckStatus
@@ -121,7 +115,7 @@ function useModelStatusRendering() {
 
     if (modelStatus.checking) {
       return (
-        <StatusIndicator type="checking">
+        <StatusIndicator $type="checking">
           <LoadingOutlined spin />
         </StatusIndicator>
       )
@@ -150,8 +144,8 @@ function useModelStatusRendering() {
     }
 
     return (
-      <Tooltip title={renderKeyCheckResultTooltip(modelStatus)}>
-        <StatusIndicator type={statusType}>{icon}</StatusIndicator>
+      <Tooltip title={renderKeyCheckResultTooltip(modelStatus)} mouseEnterDelay={0.5}>
+        <StatusIndicator $type={statusType}>{icon}</StatusIndicator>
       </Tooltip>
     )
   }
@@ -167,6 +161,15 @@ function useModelStatusRendering() {
   return { renderStatusIndicator, renderLatencyText }
 }
 
+interface ModelListProps {
+  providerId: string
+  modelStatuses?: ModelStatus[]
+  searchText?: string
+}
+
+/**
+ * Model list component
+ */
 const ModelList: React.FC<ModelListProps> = ({ providerId, modelStatuses = [], searchText = '' }) => {
   const { t } = useTranslation()
   const { provider, updateProvider, models, removeModel } = useProvider(providerId)
@@ -252,16 +255,12 @@ const ModelList: React.FC<ModelListProps> = ({ providerId, modelStatuses = [], s
                 </Flex>
               }
               extra={
-                <Tooltip title={t('settings.models.manage.remove_whole_group')}>
+                <Tooltip title={t('settings.models.manage.remove_whole_group')} mouseEnterDelay={0.5}>
                   <Button
                     type="text"
                     className="toolbar-item"
                     icon={<MinusOutlined />}
-                    onClick={() =>
-                      modelGroups[group]
-                        .filter((model) => provider.models.some((m) => m.id === model.id))
-                        .forEach((model) => removeModel(model))
-                    }
+                    onClick={() => modelGroups[group].forEach((model) => removeModel(model))}
                   />
                 </Tooltip>
               }>
@@ -276,25 +275,14 @@ const ModelList: React.FC<ModelListProps> = ({ providerId, modelStatuses = [], s
                         <Avatar src={getModelLogo(model.id)} style={{ width: 26, height: 26 }}>
                           {model?.name?.[0]?.toUpperCase()}
                         </Avatar>
-                        <ListItemName>
-                          <Tooltip
-                            styles={{
-                              root: {
-                                width: 'auto',
-                                maxWidth: '500px'
-                              }
-                            }}
-                            destroyTooltipOnHide
-                            title={
-                              <Typography.Text style={{ color: 'white' }} copyable={{ text: model.id }}>
-                                {model.id}
-                              </Typography.Text>
-                            }
-                            placement="top">
-                            <NameSpan>{model.name}</NameSpan>
-                          </Tooltip>
-                          <ModelTagsWithLabel model={model} size={11} style={{ flexShrink: 0 }} />
-                        </ListItemName>
+                        <ModelIdWithTags
+                          model={model}
+                          style={{
+                            flex: 1,
+                            width: 0,
+                            overflow: 'hidden'
+                          }}
+                        />
                       </HStack>
                       <Flex gap={4} align="center">
                         {renderLatencyText(modelStatus)}
@@ -378,38 +366,13 @@ const ListItem = styled.div`
   line-height: 1;
 `
 
-const ListItemName = styled.div`
-  display: flex;
-  flex-direction: row;
-  align-items: center;
-  gap: 10px;
-  color: var(--color-text);
-  font-size: 14px;
-  line-height: 1;
-  font-weight: 600;
-  min-width: 0;
-  overflow: hidden;
-  flex: 1;
-  width: 0;
-`
-
-const NameSpan = styled.span`
-  overflow: hidden;
-  text-overflow: ellipsis;
-  white-space: nowrap;
-  cursor: help;
-  font-family: 'Ubuntu';
-  line-height: 30px;
-  font-size: 14px;
-`
-
-const StatusIndicator = styled.div<{ type: string }>`
+const StatusIndicator = styled.div<{ $type: string }>`
   display: flex;
   align-items: center;
   justify-content: center;
   font-size: 14px;
   color: ${(props) => {
-    switch (props.type) {
+    switch (props.$type) {
       case 'success':
         return STATUS_COLORS.success
       case 'error':
diff --git a/src/renderer/src/pages/settings/ProviderSettings/ModelListSearchBar.tsx b/src/renderer/src/pages/settings/ProviderSettings/ModelListSearchBar.tsx
index b1a1b34291..bf59cf2e50 100644
--- a/src/renderer/src/pages/settings/ProviderSettings/ModelListSearchBar.tsx
+++ b/src/renderer/src/pages/settings/ProviderSettings/ModelListSearchBar.tsx
@@ -1,6 +1,7 @@
-import { Input, Tooltip } from 'antd'
+import { Input, InputRef, Tooltip } from 'antd'
 import { Search } from 'lucide-react'
-import React, { useState } from 'react'
+import { motion } from 'motion/react'
+import React, { memo, useCallback, useEffect, useRef, useState } from 'react'
 import { useTranslation } from 'react-i18next'
 
 interface ModelListSearchBarProps {
@@ -15,49 +16,76 @@ const ModelListSearchBar: React.FC<ModelListSearchBarProps> = ({ onSearch }) =>
   const { t } = useTranslation()
   const [searchVisible, setSearchVisible] = useState(false)
   const [searchText, setSearchText] = useState('')
+  const inputRef = useRef<InputRef>(null)
 
-  const handleTextChange = (text: string) => {
-    setSearchText(text)
-    onSearch(text)
-  }
+  const handleTextChange = useCallback(
+    (text: string) => {
+      setSearchText(text)
+      onSearch(text)
+    },
+    [onSearch]
+  )
 
-  const handleClear = () => {
+  const handleClear = useCallback(() => {
     setSearchText('')
     setSearchVisible(false)
     onSearch('')
-  }
+  }, [onSearch])
 
-  return searchVisible ? (
-    <Input
-      type="text"
-      placeholder={t('models.search')}
-      size="small"
-      style={{ width: '160px' }}
-      suffix={<Search size={14} />}
-      onChange={(e) => handleTextChange(e.target.value)}
-      onKeyDown={(e) => {
-        if (e.key === 'Escape') {
-          handleTextChange('')
-          if (!searchText) setSearchVisible(false)
-        }
-      }}
-      onBlur={() => {
-        if (!searchText) setSearchVisible(false)
-      }}
-      autoFocus
-      allowClear
-      onClear={handleClear}
-    />
-  ) : (
-    <Tooltip title={t('models.search')} mouseEnterDelay={0.5}>
-      <Search
-        size={14}
-        color="var(--color-icon)"
-        onClick={() => setSearchVisible(true)}
+  useEffect(() => {
+    if (searchVisible && inputRef.current) {
+      inputRef.current.focus()
+    }
+  }, [searchVisible])
+
+  return (
+    <div style={{ display: 'flex', alignItems: 'center', position: 'relative' }}>
+      <motion.div
+        initial="collapsed"
+        animate={searchVisible ? 'expanded' : 'collapsed'}
+        variants={{
+          expanded: { maxWidth: 360, opacity: 1, transition: { duration: 0.3, ease: 'easeInOut' } },
+          collapsed: { maxWidth: 0, opacity: 0, transition: { duration: 0.3, ease: 'easeInOut' } }
+        }}
+        style={{ overflow: 'hidden', flex: 1 }}>
+        <Input
+          ref={inputRef}
+          type="text"
+          placeholder={t('models.search')}
+          size="small"
+          suffix={<Search size={14} />}
+          value={searchText}
+          autoFocus
+          allowClear
+          onChange={(e) => handleTextChange(e.target.value)}
+          onKeyDown={(e) => {
+            if (e.key === 'Escape') {
+              handleTextChange('')
+              if (!searchText) setSearchVisible(false)
+            }
+          }}
+          onBlur={() => {
+            if (!searchText) setSearchVisible(false)
+          }}
+          onClear={handleClear}
+          style={{ width: '100%' }}
+        />
+      </motion.div>
+      <motion.div
+        initial="visible"
+        animate={searchVisible ? 'hidden' : 'visible'}
+        variants={{
+          visible: { opacity: 1, transition: { duration: 0.1, delay: 0.3, ease: 'easeInOut' } },
+          hidden: { opacity: 0, transition: { duration: 0.1, ease: 'easeInOut' } }
+        }}
         style={{ cursor: 'pointer' }}
-      />
-    </Tooltip>
+        onClick={() => setSearchVisible(true)}>
+        <Tooltip title={t('models.search')} mouseEnterDelay={0.5}>
+          <Search size={14} color="var(--color-icon)" />
+        </Tooltip>
+      </motion.div>
+    </div>
   )
 }
 
-export default ModelListSearchBar
+export default memo(ModelListSearchBar)
diff --git a/src/renderer/src/pages/settings/ProviderSettings/ProviderSetting.tsx b/src/renderer/src/pages/settings/ProviderSettings/ProviderSetting.tsx
index dd0844b2c7..793e2bd282 100644
--- a/src/renderer/src/pages/settings/ProviderSettings/ProviderSetting.tsx
+++ b/src/renderer/src/pages/settings/ProviderSettings/ProviderSetting.tsx
@@ -12,10 +12,12 @@ import { checkModelsHealth, getModelCheckSummary } from '@renderer/services/Heal
 import { isProviderSupportAuth } from '@renderer/services/ProviderService'
 import { Provider } from '@renderer/types'
 import { formatApiHost } from '@renderer/utils/api'
+import { lightbulbVariants } from '@renderer/utils/motionVariants'
 import { Button, Divider, Flex, Input, Space, Switch, Tooltip } from 'antd'
 import Link from 'antd/es/typography/Link'
 import { debounce, isEmpty } from 'lodash'
 import { Settings2, SquareArrowOutUpRight } from 'lucide-react'
+import { motion } from 'motion/react'
 import { FC, useCallback, useDeferredValue, useEffect, useState } from 'react'
 import { useTranslation } from 'react-i18next'
 import styled from 'styled-components'
@@ -411,9 +413,15 @@ const ProviderSetting: FC<Props> = ({ provider: _provider }) => {
               <Button
                 type="text"
                 size="small"
-                icon={<StreamlineGoodHealthAndWellBeing />}
                 onClick={onHealthCheck}
-                loading={isHealthChecking}
+                icon={
+                  <motion.span
+                    variants={lightbulbVariants}
+                    animate={isHealthChecking ? 'active' : 'idle'}
+                    initial="idle">
+                    <StreamlineGoodHealthAndWellBeing />
+                  </motion.span>
+                }
               />
             </Tooltip>
           )}
diff --git a/src/renderer/src/utils/motionVariants.ts b/src/renderer/src/utils/motionVariants.ts
new file mode 100644
index 0000000000..1f4812369f
--- /dev/null
+++ b/src/renderer/src/utils/motionVariants.ts
@@ -0,0 +1,18 @@
+export const lightbulbVariants = {
+  active: {
+    opacity: [1, 0.2, 1],
+    transition: {
+      duration: 1.2,
+      ease: 'easeInOut',
+      times: [0, 0.5, 1],
+      repeat: Infinity
+    }
+  },
+  idle: {
+    opacity: 1,
+    transition: {
+      duration: 0.3,
+      ease: 'easeInOut'
+    }
+  }
+}

From 9a8e17908aa77b01addd81727b074bd9550688ce Mon Sep 17 00:00:00 2001
From: Konv Suu <2583695112@qq.com>
Date: Tue, 13 May 2025 15:55:38 +0800
Subject: [PATCH 16/50] feat: add cache size retrieval functionality and
 integrate with UI (#5689)

* feat: add cache size retrieval functionality and integrate with UI

* chore: clean

* update

* update
---
 package.json                                   |  1 +
 packages/shared/IpcChannel.ts                  |  1 +
 src/main/ipc.ts                                | 17 ++++++++++++++++-
 src/main/utils/file.ts                         |  4 ++++
 src/preload/index.ts                           |  1 +
 .../settings/DataSettings/DataSettings.tsx     | 18 +++++++++++++++++-
 yarn.lock                                      | 14 +++++++++++++-
 7 files changed, 53 insertions(+), 3 deletions(-)

diff --git a/package.json b/package.json
index 2b3483a952..3cc85ed935 100644
--- a/package.json
+++ b/package.json
@@ -86,6 +86,7 @@
     "fast-xml-parser": "^5.2.0",
     "fetch-socks": "^1.3.2",
     "fs-extra": "^11.2.0",
+    "go-get-folder-size": "^0.5.5",
     "got-scraping": "^4.1.1",
     "jsdom": "^26.0.0",
     "markdown-it": "^14.1.0",
diff --git a/packages/shared/IpcChannel.ts b/packages/shared/IpcChannel.ts
index 1dd61c6364..dcb4f18656 100644
--- a/packages/shared/IpcChannel.ts
+++ b/packages/shared/IpcChannel.ts
@@ -1,4 +1,5 @@
 export enum IpcChannel {
+  App_GetCacheSize = 'app:get-cache-size',
   App_ClearCache = 'app:clear-cache',
   App_SetLaunchOnBoot = 'app:set-launch-on-boot',
   App_SetLanguage = 'app:set-language',
diff --git a/src/main/ipc.ts b/src/main/ipc.ts
index ecb74a57b4..dd7a5ca3b3 100644
--- a/src/main/ipc.ts
+++ b/src/main/ipc.ts
@@ -8,6 +8,7 @@ import { IpcChannel } from '@shared/IpcChannel'
 import { Shortcut, ThemeMode } from '@types'
 import { BrowserWindow, ipcMain, nativeTheme, session, shell } from 'electron'
 import log from 'electron-log'
+import { getFolderSizeBin } from 'go-get-folder-size'
 
 import { titleBarOverlayDark, titleBarOverlayLight } from './config'
 import AppUpdater from './services/AppUpdater'
@@ -31,8 +32,9 @@ import { setOpenLinkExternal } from './services/WebviewService'
 import { windowService } from './services/WindowService'
 import { getResourcePath } from './utils'
 import { decrypt, encrypt } from './utils/aes'
-import { getConfigDir, getFilesDir } from './utils/file'
+import { getCacheDir, getConfigDir, getFilesDir } from './utils/file'
 import { compress, decompress } from './utils/zip'
+
 const fileManager = new FileStorage()
 const backupManager = new BackupManager()
 const exportService = new ExportService(fileManager)
@@ -179,6 +181,19 @@ export function registerIpc(mainWindow: BrowserWindow, app: Electron.App) {
     }
   })
 
+  // get cache size
+  ipcMain.handle(IpcChannel.App_GetCacheSize, async () => {
+    const cachePath = getCacheDir()
+    const size = await getFolderSizeBin(cachePath, true, {
+      // ignore files that we can't access
+      loose: true
+    }).catch((err) => {
+      log.error('Failed to get cache size:', err)
+    })
+
+    return size || '0MB'
+  })
+
   // check for update
   ipcMain.handle(IpcChannel.App_CheckForUpdate, async () => {
     await appUpdater.checkForUpdates()
diff --git a/src/main/utils/file.ts b/src/main/utils/file.ts
index 25a4ed7323..f01a6d47bf 100644
--- a/src/main/utils/file.ts
+++ b/src/main/utils/file.ts
@@ -81,6 +81,10 @@ export function getConfigDir() {
   return path.join(os.homedir(), '.cherrystudio', 'config')
 }
 
+export function getCacheDir() {
+  return path.join(app.getPath('userData'), 'Cache')
+}
+
 export function getAppConfigDir(name: string) {
   return path.join(getConfigDir(), name)
 }
diff --git a/src/preload/index.ts b/src/preload/index.ts
index eeea6ec3de..373cad4a24 100644
--- a/src/preload/index.ts
+++ b/src/preload/index.ts
@@ -23,6 +23,7 @@ const api = {
     ipcRenderer.invoke(IpcChannel.App_HandleZoomFactor, delta, reset),
   setAutoUpdate: (isActive: boolean) => ipcRenderer.invoke(IpcChannel.App_SetAutoUpdate, isActive),
   openWebsite: (url: string) => ipcRenderer.invoke(IpcChannel.Open_Website, url),
+  getCacheSize: () => ipcRenderer.invoke(IpcChannel.App_GetCacheSize),
   clearCache: () => ipcRenderer.invoke(IpcChannel.App_ClearCache),
   system: {
     getDeviceType: () => ipcRenderer.invoke(IpcChannel.System_GetDeviceType),
diff --git a/src/renderer/src/pages/settings/DataSettings/DataSettings.tsx b/src/renderer/src/pages/settings/DataSettings/DataSettings.tsx
index 4178ac9df7..32d6e0e926 100644
--- a/src/renderer/src/pages/settings/DataSettings/DataSettings.tsx
+++ b/src/renderer/src/pages/settings/DataSettings/DataSettings.tsx
@@ -36,6 +36,7 @@ import YuqueSettings from './YuqueSettings'
 const DataSettings: FC = () => {
   const { t } = useTranslation()
   const [appInfo, setAppInfo] = useState<AppInfo>()
+  const [cacheSize, setCacheSize] = useState<string>('')
   const { size, removeAllFiles } = useKnowledgeFiles()
   const { theme } = useTheme()
   const [menu, setMenu] = useState<string>('data')
@@ -106,6 +107,7 @@ const DataSettings: FC = () => {
 
   useEffect(() => {
     window.api.getAppInfo().then(setAppInfo)
+    window.api.getCacheSize().then(setCacheSize)
   }, [])
 
   const handleOpenPath = (path?: string) => {
@@ -130,6 +132,7 @@ const DataSettings: FC = () => {
       onOk: async () => {
         try {
           await window.api.clearCache()
+          await window.api.getCacheSize().then(setCacheSize)
           window.message.success(t('settings.data.clear_cache.success'))
         } catch (error) {
           window.message.error(t('settings.data.clear_cache.error'))
@@ -228,7 +231,10 @@ const DataSettings: FC = () => {
               </SettingRow>
               <SettingDivider />
               <SettingRow>
-                <SettingRowTitle>{t('settings.data.clear_cache.title')}</SettingRowTitle>
+                <SettingRowTitle>
+                  {t('settings.data.clear_cache.title')}
+                  <CacheText>({cacheSize})</CacheText>
+                </SettingRowTitle>
                 <HStack gap="5px">
                   <Button onClick={handleClearCache} danger>
                     {t('settings.data.clear_cache.button')}
@@ -280,6 +286,16 @@ const MenuList = styled.div`
   }
 `
 
+const CacheText = styled(Typography.Text)`
+  color: var(--color-text-3);
+  font-size: 12px;
+  margin-left: 5px;
+  line-height: 16px;
+  display: inline-block;
+  vertical-align: middle;
+  text-align: left;
+`
+
 const PathText = styled(Typography.Text)`
   flex: 1;
   min-width: 0;
diff --git a/yarn.lock b/yarn.lock
index 4d7e8ea9f7..17f6773b91 100644
--- a/yarn.lock
+++ b/yarn.lock
@@ -4425,6 +4425,7 @@ __metadata:
     fast-xml-parser: "npm:^5.2.0"
     fetch-socks: "npm:^1.3.2"
     fs-extra: "npm:^11.2.0"
+    go-get-folder-size: "npm:^0.5.5"
     got-scraping: "npm:^4.1.1"
     html-to-image: "npm:^1.11.13"
     husky: "npm:^9.1.7"
@@ -8963,6 +8964,17 @@ __metadata:
   languageName: node
   linkType: hard
 
+"go-get-folder-size@npm:^0.5.5":
+  version: 0.5.5
+  resolution: "go-get-folder-size@npm:0.5.5"
+  dependencies:
+    std-env: "npm:^3.7.0"
+  bin:
+    go-get-folder-size: bin/cli.js
+  checksum: 10c0/eb69b686952218cc114dccf65763e0dff5056050fa3e9b2afa6161b933c3978500455503b104f9f28d96aab2fedd64ccb0255d6ea16d699fe020795f431ed7b8
+  languageName: node
+  linkType: hard
+
 "google-auth-library@npm:^9.14.2":
   version: 9.15.1
   resolution: "google-auth-library@npm:9.15.1"
@@ -16013,7 +16025,7 @@ __metadata:
   languageName: node
   linkType: hard
 
-"std-env@npm:^3.8.1":
+"std-env@npm:^3.7.0, std-env@npm:^3.8.1":
   version: 3.9.0
   resolution: "std-env@npm:3.9.0"
   checksum: 10c0/4a6f9218aef3f41046c3c7ecf1f98df00b30a07f4f35c6d47b28329bc2531eef820828951c7d7b39a1c5eb19ad8a46e3ddfc7deb28f0a2f3ceebee11bab7ba50

From 9b01baf0d6dd2776f80faca184b4a44e35a60443 Mon Sep 17 00:00:00 2001
From: fullex <0xfullex@gmail.com>
Date: Tue, 13 May 2025 13:54:18 +0800
Subject: [PATCH 17/50] fix(WebviewService): simplify user agent string
 modification by removing Chrome version replacement

---
 src/main/services/WebviewService.ts | 6 +-----
 1 file changed, 1 insertion(+), 5 deletions(-)

diff --git a/src/main/services/WebviewService.ts b/src/main/services/WebviewService.ts
index 50da5cd1e5..7a14e65c19 100644
--- a/src/main/services/WebviewService.ts
+++ b/src/main/services/WebviewService.ts
@@ -6,12 +6,8 @@ import { session, shell, webContents } from 'electron'
  */
 export function initSessionUserAgent() {
   const wvSession = session.fromPartition('persist:webview')
-  const newChromeVersion = '135.0.7049.96'
   const originUA = wvSession.getUserAgent()
-  const newUA = originUA
-    .replace(/CherryStudio\/\S+\s/, '')
-    .replace(/Electron\/\S+\s/, '')
-    .replace(/Chrome\/\d+\.\d+\.\d+\.\d+/, `Chrome/${newChromeVersion}`)
+  const newUA = originUA.replace(/CherryStudio\/\S+\s/, '').replace(/Electron\/\S+\s/, '')
 
   wvSession.setUserAgent(newUA)
 }

From 0e269cadb9a5dc3c1beef786cc973f3e363ae8e4 Mon Sep 17 00:00:00 2001
From: Yohann <13710295382@163.com>
Date: Tue, 13 May 2025 16:53:55 +0800
Subject: [PATCH 18/50] feat: add DevTools functionality and localization
 support (#5796)

* feat: add DevTools functionality and localization support

* Added new IPC channels for opening and toggling DevTools.
* Implemented corresponding handlers in the main process.
* Updated preload API to include DevTools methods.
* Enhanced the AboutSettings component with a debug section to control DevTools.
* Added localization strings for debug actions in English, Simplified Chinese, and Traditional Chinese.

* refactor: remove DevTools open state handling and related localization strings

* Removed the IPC channel and associated handlers for checking if DevTools is open.
* Updated the AboutSettings component to eliminate the DevTools open state management.
* Removed localization strings for the DevTools close action in English, Simplified Chinese, and Traditional Chinese.

* ToggleDevTools event uses the source window to trigger switching, compatible with multiple windows

* Remove empty comments

---------

Co-authored-by: yangheng <492238647@qq.com>
---
 packages/shared/IpcChannel.ts                     |  3 +++
 src/main/index.ts                                 |  7 ++++++-
 src/preload/index.ts                              |  3 +++
 src/renderer/src/i18n/locales/en-us.json          |  2 ++
 src/renderer/src/i18n/locales/zh-cn.json          |  2 ++
 src/renderer/src/i18n/locales/zh-tw.json          |  2 ++
 src/renderer/src/pages/settings/AboutSettings.tsx | 14 +++++++++++++-
 7 files changed, 31 insertions(+), 2 deletions(-)

diff --git a/packages/shared/IpcChannel.ts b/packages/shared/IpcChannel.ts
index dcb4f18656..b4c4c571d6 100644
--- a/packages/shared/IpcChannel.ts
+++ b/packages/shared/IpcChannel.ts
@@ -135,6 +135,9 @@ export enum IpcChannel {
   System_GetDeviceType = 'system:getDeviceType',
   System_GetHostname = 'system:getHostname',
 
+  // DevTools
+  System_ToggleDevTools = 'system:toggleDevTools',
+
   // events
   BackupProgress = 'backup-progress',
   ThemeChange = 'theme:change',
diff --git a/src/main/index.ts b/src/main/index.ts
index 132dff40fc..41c48cd977 100644
--- a/src/main/index.ts
+++ b/src/main/index.ts
@@ -1,7 +1,7 @@
 import { electronApp, optimizer } from '@electron-toolkit/utils'
 import { replaceDevtoolsFont } from '@main/utils/windowUtil'
 import { IpcChannel } from '@shared/IpcChannel'
-import { app, ipcMain } from 'electron'
+import { app, BrowserWindow, ipcMain } from 'electron'
 import installExtension, { REACT_DEVELOPER_TOOLS, REDUX_DEVTOOLS } from 'electron-devtools-installer'
 import Logger from 'electron-log'
 
@@ -75,6 +75,11 @@ if (!app.requestSingleInstanceLock()) {
     ipcMain.handle(IpcChannel.System_GetHostname, () => {
       return require('os').hostname()
     })
+
+    ipcMain.handle(IpcChannel.System_ToggleDevTools, (e) => {
+      const win = BrowserWindow.fromWebContents(e.sender)
+      win && win.webContents.toggleDevTools()
+    })
   })
 
   registerProtocolClient(app)
diff --git a/src/preload/index.ts b/src/preload/index.ts
index 373cad4a24..2a2f378fa2 100644
--- a/src/preload/index.ts
+++ b/src/preload/index.ts
@@ -29,6 +29,9 @@ const api = {
     getDeviceType: () => ipcRenderer.invoke(IpcChannel.System_GetDeviceType),
     getHostname: () => ipcRenderer.invoke(IpcChannel.System_GetHostname)
   },
+  devTools: {
+    toggle: () => ipcRenderer.invoke(IpcChannel.System_ToggleDevTools)
+  },
   zip: {
     compress: (text: string) => ipcRenderer.invoke(IpcChannel.Zip_Compress, text),
     decompress: (text: Buffer) => ipcRenderer.invoke(IpcChannel.Zip_Decompress, text)
diff --git a/src/renderer/src/i18n/locales/en-us.json b/src/renderer/src/i18n/locales/en-us.json
index 631f92bc11..171d5a9786 100644
--- a/src/renderer/src/i18n/locales/en-us.json
+++ b/src/renderer/src/i18n/locales/en-us.json
@@ -905,6 +905,8 @@
       "about.checkUpdate.available": "Update",
       "about.contact.button": "Email",
       "about.contact.title": "Contact",
+      "about.debug.title": "Debug",
+      "about.debug.open": "Open",
       "about.description": "A powerful AI assistant for producer",
       "about.downloading": "Downloading...",
       "about.feedback.button": "Feedback",
diff --git a/src/renderer/src/i18n/locales/zh-cn.json b/src/renderer/src/i18n/locales/zh-cn.json
index 6ffb9620c1..b194461eba 100644
--- a/src/renderer/src/i18n/locales/zh-cn.json
+++ b/src/renderer/src/i18n/locales/zh-cn.json
@@ -905,6 +905,8 @@
       "about.checkUpdate.available": "立即更新",
       "about.contact.button": "邮件",
       "about.contact.title": "邮件联系",
+      "about.debug.title": "调试面板",
+      "about.debug.open": "打开",
       "about.description": "一款为创造者而生的 AI 助手",
       "about.downloading": "正在下载更新...",
       "about.feedback.button": "反馈",
diff --git a/src/renderer/src/i18n/locales/zh-tw.json b/src/renderer/src/i18n/locales/zh-tw.json
index 17667120e0..0279639c8c 100644
--- a/src/renderer/src/i18n/locales/zh-tw.json
+++ b/src/renderer/src/i18n/locales/zh-tw.json
@@ -905,6 +905,8 @@
       "about.checkUpdate.available": "立即更新",
       "about.contact.button": "電子郵件",
       "about.contact.title": "聯絡方式",
+      "about.debug.title": "調試面板",
+      "about.debug.open": "開啟",
       "about.description": "一款為創作者而生的強大 AI 助手",
       "about.downloading": "正在下載...",
       "about.feedback.button": "回饋",
diff --git a/src/renderer/src/pages/settings/AboutSettings.tsx b/src/renderer/src/pages/settings/AboutSettings.tsx
index 62a4971caa..bd7e174f6f 100644
--- a/src/renderer/src/pages/settings/AboutSettings.tsx
+++ b/src/renderer/src/pages/settings/AboutSettings.tsx
@@ -12,7 +12,7 @@ import { ThemeMode } from '@renderer/types'
 import { compareVersions, runAsyncFunction } from '@renderer/utils'
 import { Avatar, Button, Progress, Row, Switch, Tag } from 'antd'
 import { debounce } from 'lodash'
-import { FileCheck, Github, Globe, Mail, Rss } from 'lucide-react'
+import { Bug, FileCheck, Github, Globe, Mail, Rss } from 'lucide-react'
 import { FC, useEffect, useState } from 'react'
 import { useTranslation } from 'react-i18next'
 import Markdown from 'react-markdown'
@@ -69,6 +69,10 @@ const AboutSettings: FC = () => {
     onOpenWebsite(url)
   }
 
+  const debug = async () => {
+    await window.api.devTools.toggle()
+  }
+
   const showLicense = async () => {
     const { appPath } = await window.api.getAppInfo()
     openMinapp({
@@ -219,6 +223,14 @@ const AboutSettings: FC = () => {
           </SettingRowTitle>
           <Button onClick={mailto}>{t('settings.about.contact.button')}</Button>
         </SettingRow>
+        <SettingDivider />
+        <SettingRow>
+          <SettingRowTitle>
+            <Bug size={18} />
+            {t('settings.about.debug.title')}
+          </SettingRowTitle>
+          <Button onClick={debug}>{t('settings.about.debug.open')}</Button>
+        </SettingRow>
       </SettingGroup>
     </SettingContainer>
   )

From c0c0faabc8378d18faf2574edc2239947e524d72 Mon Sep 17 00:00:00 2001
From: kangfenmao <kangfenmao@qq.com>
Date: Tue, 13 May 2025 20:24:19 +0800
Subject: [PATCH 19/50] fix: history topic message block is empty

* Added useEffect to dispatch loadTopicMessagesThunk when the topic is available
* Integrated useAppDispatch for state management
---
 .../src/pages/history/components/TopicMessages.tsx       | 9 ++++++++-
 1 file changed, 8 insertions(+), 1 deletion(-)

diff --git a/src/renderer/src/pages/history/components/TopicMessages.tsx b/src/renderer/src/pages/history/components/TopicMessages.tsx
index 6e8095037b..86805dd1af 100644
--- a/src/renderer/src/pages/history/components/TopicMessages.tsx
+++ b/src/renderer/src/pages/history/components/TopicMessages.tsx
@@ -7,10 +7,12 @@ import { getAssistantById } from '@renderer/services/AssistantService'
 import { EVENT_NAMES, EventEmitter } from '@renderer/services/EventService'
 import { isGenerating, locateToMessage } from '@renderer/services/MessagesService'
 import NavigationService from '@renderer/services/NavigationService'
+import { useAppDispatch } from '@renderer/store'
+import { loadTopicMessagesThunk } from '@renderer/store/thunk/messageThunk'
 import { Topic } from '@renderer/types'
 import { Button, Divider, Empty } from 'antd'
 import { t } from 'i18next'
-import { FC } from 'react'
+import { FC, useEffect } from 'react'
 import styled from 'styled-components'
 
 import { default as MessageItem } from '../../home/Messages/Message'
@@ -23,6 +25,11 @@ const TopicMessages: FC<Props> = ({ topic, ...props }) => {
   const navigate = NavigationService.navigate!
   const { handleScroll, containerRef } = useScrollPosition('TopicMessages')
   const { messageStyle } = useSettings()
+  const dispatch = useAppDispatch()
+
+  useEffect(() => {
+    topic && dispatch(loadTopicMessagesThunk(topic.id))
+  }, [dispatch, topic])
 
   const isEmpty = (topic?.messages || []).length === 0
 

From 483ea46440f968fb402634803e488eb3d69b428c Mon Sep 17 00:00:00 2001
From: kangfenmao <kangfenmao@qq.com>
Date: Mon, 12 May 2025 20:28:51 +0800
Subject: [PATCH 20/50] fix: regenerate message use assistant model

---
 src/renderer/src/pages/home/Messages/Blocks/ErrorBlock.tsx   | 5 ++++-
 .../src/pages/home/Messages/Blocks/ThinkingBlock.tsx         | 1 -
 src/renderer/src/store/thunk/messageThunk.ts                 | 5 ++++-
 src/renderer/src/utils/messageUtils/create.ts                | 2 +-
 4 files changed, 9 insertions(+), 4 deletions(-)

diff --git a/src/renderer/src/pages/home/Messages/Blocks/ErrorBlock.tsx b/src/renderer/src/pages/home/Messages/Blocks/ErrorBlock.tsx
index f55a3ab6b1..5a1f597ede 100644
--- a/src/renderer/src/pages/home/Messages/Blocks/ErrorBlock.tsx
+++ b/src/renderer/src/pages/home/Messages/Blocks/ErrorBlock.tsx
@@ -11,22 +11,25 @@ interface Props {
 const ErrorBlock: React.FC<Props> = ({ block }) => {
   return <MessageErrorInfo block={block} />
 }
+
 const MessageErrorInfo: React.FC<{ block: ErrorMessageBlock }> = ({ block }) => {
   const { t, i18n } = useTranslation()
 
   const HTTP_ERROR_CODES = [400, 401, 403, 404, 429, 500, 502, 503, 504]
+
   if (block.error && HTTP_ERROR_CODES.includes(block.error?.status)) {
     return <Alert description={t(`error.http.${block.error.status}`)} message={block.error?.message} type="error" />
   }
+
   if (block?.error?.message) {
     const errorKey = `error.${block.error.message}`
     const pauseErrorLanguagePlaceholder = i18n.exists(errorKey) ? t(errorKey) : block.error.message
-
     return <Alert description={pauseErrorLanguagePlaceholder} type="error" />
   }
 
   return <Alert description={t('error.chat.response')} type="error" />
 }
+
 const Alert = styled(AntdAlert)`
   margin: 15px 0 8px;
   padding: 10px;
diff --git a/src/renderer/src/pages/home/Messages/Blocks/ThinkingBlock.tsx b/src/renderer/src/pages/home/Messages/Blocks/ThinkingBlock.tsx
index 6911250e9b..212ee53ee9 100644
--- a/src/renderer/src/pages/home/Messages/Blocks/ThinkingBlock.tsx
+++ b/src/renderer/src/pages/home/Messages/Blocks/ThinkingBlock.tsx
@@ -136,7 +136,6 @@ const ThinkingBlock: React.FC<Props> = ({ block }) => {
 
 const CollapseContainer = styled(Collapse)`
   margin-bottom: 15px;
-  max-width: 960px;
 `
 
 const MessageTitleLabel = styled.div`
diff --git a/src/renderer/src/store/thunk/messageThunk.ts b/src/renderer/src/store/thunk/messageThunk.ts
index a98b69f39d..4e631bba65 100644
--- a/src/renderer/src/store/thunk/messageThunk.ts
+++ b/src/renderer/src/store/thunk/messageThunk.ts
@@ -989,8 +989,11 @@ export const regenerateAssistantResponseThunk =
       // 5. Reset the message entity in Redux
       const resetAssistantMsg = resetAssistantMessage(messageToResetEntity, {
         status: AssistantMessageStatus.PENDING,
-        updatedAt: new Date().toISOString()
+        updatedAt: new Date().toISOString(),
+        model: assistant.model,
+        modelId: assistant?.model?.id
       })
+
       dispatch(
         newMessagesActions.updateMessage({
           topicId,
diff --git a/src/renderer/src/utils/messageUtils/create.ts b/src/renderer/src/utils/messageUtils/create.ts
index c9b3bbbfd4..1a7450aad7 100644
--- a/src/renderer/src/utils/messageUtils/create.ts
+++ b/src/renderer/src/utils/messageUtils/create.ts
@@ -388,7 +388,7 @@ export function resetMessage(
  */
 export const resetAssistantMessage = (
   originalMessage: Message,
-  updates?: Partial<Pick<Message, 'status' | 'updatedAt'>> // Primarily allow updating status
+  updates?: Partial<Pick<Message, 'status' | 'updatedAt' | 'model' | 'modelId'>> // Primarily allow updating status
 ): Message => {
   // Ensure we are only resetting assistant messages
   if (originalMessage.role !== 'assistant') {

From 396b400004fbf5a3fce8125f264bbae64d5cad16 Mon Sep 17 00:00:00 2001
From: kangfenmao <kangfenmao@qq.com>
Date: Mon, 12 May 2025 21:56:05 +0800
Subject: [PATCH 21/50] revert: openai compatible type

---
 src/renderer/src/config/models.ts             |    4 +-
 src/renderer/src/databases/upgrades.ts        |    2 +-
 .../home/Messages/Blocks/MainTextBlock.tsx    |    4 +-
 .../ProviderSettings/AddProviderPopup.tsx     |    8 +-
 .../ProviderSettings/ProviderSetting.tsx      |    2 +-
 .../providers/AiProvider/AihubmixProvider.ts  |    6 +-
 .../AiProvider/OpenAICompatibleProvider.ts    | 1220 -------------
 .../providers/AiProvider/OpenAIProvider.ts    | 1605 ++++++++---------
 .../AiProvider/OpenAIResponseProvider.ts      | 1265 +++++++++++++
 .../providers/AiProvider/ProviderFactory.ts   |   15 +-
 src/renderer/src/store/index.ts               |    2 +-
 src/renderer/src/store/llm.ts                 |   86 +-
 src/renderer/src/store/messageBlock.ts        |    4 +-
 src/renderer/src/store/migrate.ts             |   17 +
 src/renderer/src/types/index.ts               |    4 +-
 15 files changed, 2131 insertions(+), 2113 deletions(-)
 delete mode 100644 src/renderer/src/providers/AiProvider/OpenAICompatibleProvider.ts
 create mode 100644 src/renderer/src/providers/AiProvider/OpenAIResponseProvider.ts

diff --git a/src/renderer/src/config/models.ts b/src/renderer/src/config/models.ts
index 5565584254..f00f2d1a88 100644
--- a/src/renderer/src/config/models.ts
+++ b/src/renderer/src/config/models.ts
@@ -2410,7 +2410,7 @@ export function isWebSearchModel(model: Model): boolean {
     return CLAUDE_SUPPORTED_WEBSEARCH_REGEX.test(model.id)
   }
 
-  if (provider.type === 'openai') {
+  if (provider.type === 'openai-response') {
     if (
       isOpenAILLMModel(model) &&
       !isTextToImageModel(model) &&
@@ -2441,7 +2441,7 @@ export function isWebSearchModel(model: Model): boolean {
     return models.includes(model?.id)
   }
 
-  if (provider?.type === 'openai-compatible') {
+  if (provider?.type === 'openai') {
     if (GEMINI_SEARCH_MODELS.includes(model?.id) || isOpenAIWebSearch(model)) {
       return true
     }
diff --git a/src/renderer/src/databases/upgrades.ts b/src/renderer/src/databases/upgrades.ts
index 11db1ed090..fae8a74719 100644
--- a/src/renderer/src/databases/upgrades.ts
+++ b/src/renderer/src/databases/upgrades.ts
@@ -213,7 +213,7 @@ export async function upgradeToV7(tx: Transaction): Promise<void> {
         hasCitationData = true
         citationDataToCreate.response = {
           results: oldMessage.metadata.annotations,
-          source: WebSearchSource.OPENAI
+          source: WebSearchSource.OPENAI_RESPONSE
         }
       }
       if (oldMessage.metadata?.citations?.length) {
diff --git a/src/renderer/src/pages/home/Messages/Blocks/MainTextBlock.tsx b/src/renderer/src/pages/home/Messages/Blocks/MainTextBlock.tsx
index 0d9156a885..f21cc47131 100644
--- a/src/renderer/src/pages/home/Messages/Blocks/MainTextBlock.tsx
+++ b/src/renderer/src/pages/home/Messages/Blocks/MainTextBlock.tsx
@@ -49,8 +49,8 @@ const MainTextBlock: React.FC<Props> = ({ block, citationBlockId, role, mentions
     }
 
     switch (block.citationReferences[0].citationBlockSource) {
-      case WebSearchSource.OPENAI_COMPATIBLE:
-      case WebSearchSource.OPENAI: {
+      case WebSearchSource.OPENAI:
+      case WebSearchSource.OPENAI_RESPONSE: {
         formattedCitations.forEach((citation) => {
           const citationNum = citation.number
           const supData = {
diff --git a/src/renderer/src/pages/settings/ProviderSettings/AddProviderPopup.tsx b/src/renderer/src/pages/settings/ProviderSettings/AddProviderPopup.tsx
index 309ebbe0a8..e683f8c432 100644
--- a/src/renderer/src/pages/settings/ProviderSettings/AddProviderPopup.tsx
+++ b/src/renderer/src/pages/settings/ProviderSettings/AddProviderPopup.tsx
@@ -16,7 +16,7 @@ interface Props {
 const PopupContainer: React.FC<Props> = ({ provider, resolve }) => {
   const [open, setOpen] = useState(true)
   const [name, setName] = useState(provider?.name || '')
-  const [type, setType] = useState<ProviderType>(provider?.type || 'openai-compatible')
+  const [type, setType] = useState<ProviderType>(provider?.type || 'openai')
   const [logo, setLogo] = useState<string | null>(null)
   const [dropdownOpen, setDropdownOpen] = useState(false)
   const { t } = useTranslation()
@@ -52,7 +52,7 @@ const PopupContainer: React.FC<Props> = ({ provider, resolve }) => {
 
   const onCancel = () => {
     setOpen(false)
-    resolve({ name: '', type: 'openai-compatible' })
+    resolve({ name: '', type: 'openai' })
   }
 
   const onClose = () => {
@@ -189,8 +189,8 @@ const PopupContainer: React.FC<Props> = ({ provider, resolve }) => {
             value={type}
             onChange={setType}
             options={[
-              { label: 'OpenAI-Compatible', value: 'openai-compatible' },
-              { label: 'OpenAI-Response', value: 'openai' },
+              { label: 'OpenAI', value: 'openai' },
+              { label: 'OpenAI-Response', value: 'openai-response' },
               { label: 'Gemini', value: 'gemini' },
               { label: 'Anthropic', value: 'anthropic' },
               { label: 'Azure OpenAI', value: 'azure-openai' }
diff --git a/src/renderer/src/pages/settings/ProviderSettings/ProviderSetting.tsx b/src/renderer/src/pages/settings/ProviderSettings/ProviderSetting.tsx
index 793e2bd282..2f58a924dd 100644
--- a/src/renderer/src/pages/settings/ProviderSettings/ProviderSetting.tsx
+++ b/src/renderer/src/pages/settings/ProviderSettings/ProviderSetting.tsx
@@ -262,7 +262,7 @@ const ProviderSetting: FC<Props> = ({ provider: _provider }) => {
     if (apiHost.endsWith('#')) {
       return apiHost.replace('#', '')
     }
-    if (provider.type === 'openai-compatible') {
+    if (provider.type === 'openai') {
       return formatApiHost(apiHost) + 'chat/completions'
     }
     return formatApiHost(apiHost) + 'responses'
diff --git a/src/renderer/src/providers/AiProvider/AihubmixProvider.ts b/src/renderer/src/providers/AiProvider/AihubmixProvider.ts
index 83b5377b5c..6fe0a1c235 100644
--- a/src/renderer/src/providers/AiProvider/AihubmixProvider.ts
+++ b/src/renderer/src/providers/AiProvider/AihubmixProvider.ts
@@ -8,8 +8,8 @@ import { CompletionsParams } from '.'
 import AnthropicProvider from './AnthropicProvider'
 import BaseProvider from './BaseProvider'
 import GeminiProvider from './GeminiProvider'
-import OpenAICompatibleProvider from './OpenAICompatibleProvider'
 import OpenAIProvider from './OpenAIProvider'
+import OpenAIResponseProvider from './OpenAIResponseProvider'
 
 /**
  * AihubmixProvider - 根据模型类型自动选择合适的提供商
@@ -26,8 +26,8 @@ export default class AihubmixProvider extends BaseProvider {
     // 初始化各个提供商
     this.providers.set('claude', new AnthropicProvider(provider))
     this.providers.set('gemini', new GeminiProvider({ ...provider, apiHost: 'https://aihubmix.com/gemini' }))
-    this.providers.set('openai', new OpenAIProvider(provider))
-    this.providers.set('default', new OpenAICompatibleProvider(provider))
+    this.providers.set('openai', new OpenAIResponseProvider(provider))
+    this.providers.set('default', new OpenAIProvider(provider))
 
     // 设置默认提供商
     this.defaultProvider = this.providers.get('default')!
diff --git a/src/renderer/src/providers/AiProvider/OpenAICompatibleProvider.ts b/src/renderer/src/providers/AiProvider/OpenAICompatibleProvider.ts
deleted file mode 100644
index 057a1e3e06..0000000000
--- a/src/renderer/src/providers/AiProvider/OpenAICompatibleProvider.ts
+++ /dev/null
@@ -1,1220 +0,0 @@
-import {
-  findTokenLimit,
-  getOpenAIWebSearchParams,
-  isHunyuanSearchModel,
-  isOpenAIReasoningModel,
-  isOpenAIWebSearch,
-  isReasoningModel,
-  isSupportedModel,
-  isSupportedReasoningEffortGrokModel,
-  isSupportedReasoningEffortModel,
-  isSupportedReasoningEffortOpenAIModel,
-  isSupportedThinkingTokenClaudeModel,
-  isSupportedThinkingTokenModel,
-  isSupportedThinkingTokenQwenModel,
-  isVisionModel,
-  isZhipuModel
-} from '@renderer/config/models'
-import { getStoreSetting } from '@renderer/hooks/useSettings'
-import i18n from '@renderer/i18n'
-import { extractReasoningMiddleware } from '@renderer/middlewares/extractReasoningMiddleware'
-import { getAssistantSettings, getDefaultModel, getTopNamingModel } from '@renderer/services/AssistantService'
-import { EVENT_NAMES } from '@renderer/services/EventService'
-import {
-  filterContextMessages,
-  filterEmptyMessages,
-  filterUserRoleStartMessages
-} from '@renderer/services/MessagesService'
-import { processPostsuffixQwen3Model, processReqMessages } from '@renderer/services/ModelMessageService'
-import store from '@renderer/store'
-import {
-  Assistant,
-  EFFORT_RATIO,
-  FileTypes,
-  MCPCallToolResponse,
-  MCPTool,
-  MCPToolResponse,
-  Metrics,
-  Model,
-  Provider,
-  Suggestion,
-  ToolCallResponse,
-  Usage,
-  WebSearchSource
-} from '@renderer/types'
-import { ChunkType, LLMWebSearchCompleteChunk } from '@renderer/types/chunk'
-import { Message } from '@renderer/types/newMessage'
-import { removeSpecialCharactersForTopicName } from '@renderer/utils'
-import { addImageFileToContents } from '@renderer/utils/formats'
-import {
-  convertLinks,
-  convertLinksToHunyuan,
-  convertLinksToOpenRouter,
-  convertLinksToZhipu
-} from '@renderer/utils/linkConverter'
-import {
-  mcpToolCallResponseToOpenAICompatibleMessage,
-  mcpToolsToOpenAIChatTools,
-  openAIToolsToMcpTool,
-  parseAndCallTools
-} from '@renderer/utils/mcp-tools'
-import { findFileBlocks, findImageBlocks, getMainTextContent } from '@renderer/utils/messageUtils/find'
-import { buildSystemPrompt } from '@renderer/utils/prompt'
-import { asyncGeneratorToReadableStream, readableStreamAsyncIterable } from '@renderer/utils/stream'
-import { isEmpty, takeRight } from 'lodash'
-import OpenAI, { AzureOpenAI } from 'openai'
-import {
-  ChatCompletionContentPart,
-  ChatCompletionCreateParamsNonStreaming,
-  ChatCompletionMessageParam,
-  ChatCompletionMessageToolCall,
-  ChatCompletionTool,
-  ChatCompletionToolMessageParam
-} from 'openai/resources'
-
-import { CompletionsParams } from '.'
-import { BaseOpenAiProvider } from './OpenAIProvider'
-
-// 1. 定义联合类型
-export type OpenAIStreamChunk =
-  | { type: 'reasoning' | 'text-delta'; textDelta: string }
-  | { type: 'tool-calls'; delta: any }
-  | { type: 'finish'; finishReason: any; usage: any; delta: any; chunk: any }
-
-export default class OpenAICompatibleProvider extends BaseOpenAiProvider {
-  constructor(provider: Provider) {
-    super(provider)
-
-    if (provider.id === 'azure-openai' || provider.type === 'azure-openai') {
-      this.sdk = new AzureOpenAI({
-        dangerouslyAllowBrowser: true,
-        apiKey: this.apiKey,
-        apiVersion: provider.apiVersion,
-        endpoint: provider.apiHost
-      })
-      return
-    }
-
-    this.sdk = new OpenAI({
-      dangerouslyAllowBrowser: true,
-      apiKey: this.apiKey,
-      baseURL: this.getBaseURL(),
-      defaultHeaders: {
-        ...this.defaultHeaders(),
-        ...(this.provider.id === 'copilot' ? { 'editor-version': 'vscode/1.97.2' } : {}),
-        ...(this.provider.id === 'copilot' ? { 'copilot-vision-request': 'true' } : {})
-      }
-    })
-  }
-
-  /**
-   * Check if the provider does not support files
-   * @returns True if the provider does not support files, false otherwise
-   */
-  private get isNotSupportFiles() {
-    if (this.provider?.isNotSupportArrayContent) {
-      return true
-    }
-
-    const providers = ['deepseek', 'baichuan', 'minimax', 'xirang']
-
-    return providers.includes(this.provider.id)
-  }
-
-  /**
-   * Get the message parameter
-   * @param message - The message
-   * @param model - The model
-   * @returns The message parameter
-   */
-  override async getMessageParam(
-    message: Message,
-    model: Model
-  ): Promise<OpenAI.Chat.Completions.ChatCompletionMessageParam> {
-    const isVision = isVisionModel(model)
-    const content = await this.getMessageContent(message)
-    const fileBlocks = findFileBlocks(message)
-    const imageBlocks = findImageBlocks(message)
-
-    if (fileBlocks.length === 0 && imageBlocks.length === 0) {
-      return {
-        role: message.role === 'system' ? 'user' : message.role,
-        content
-      }
-    }
-
-    // If the model does not support files, extract the file content
-    if (this.isNotSupportFiles) {
-      const fileContent = await this.extractFileContent(message)
-
-      return {
-        role: message.role === 'system' ? 'user' : message.role,
-        content: content + '\n\n---\n\n' + fileContent
-      }
-    }
-
-    // If the model supports files, add the file content to the message
-    const parts: ChatCompletionContentPart[] = []
-
-    if (content) {
-      parts.push({ type: 'text', text: content })
-    }
-
-    for (const imageBlock of imageBlocks) {
-      if (isVision) {
-        if (imageBlock.file) {
-          const image = await window.api.file.base64Image(imageBlock.file.id + imageBlock.file.ext)
-          parts.push({ type: 'image_url', image_url: { url: image.data } })
-        } else if (imageBlock.url && imageBlock.url.startsWith('data:')) {
-          parts.push({ type: 'image_url', image_url: { url: imageBlock.url } })
-        }
-      }
-    }
-
-    for (const fileBlock of fileBlocks) {
-      const file = fileBlock.file
-      if (!file) {
-        continue
-      }
-
-      if ([FileTypes.TEXT, FileTypes.DOCUMENT].includes(file.type)) {
-        const fileContent = await (await window.api.file.read(file.id + file.ext)).trim()
-        parts.push({
-          type: 'text',
-          text: file.origin_name + '\n' + fileContent
-        })
-      }
-    }
-
-    return {
-      role: message.role === 'system' ? 'user' : message.role,
-      content: parts
-    } as ChatCompletionMessageParam
-  }
-
-  /**
-   * Get the temperature for the assistant
-   * @param assistant - The assistant
-   * @param model - The model
-   * @returns The temperature
-   */
-  override getTemperature(assistant: Assistant, model: Model) {
-    return isReasoningModel(model) || isOpenAIWebSearch(model) ? undefined : assistant?.settings?.temperature
-  }
-
-  /**
-   * Get the provider specific parameters for the assistant
-   * @param assistant - The assistant
-   * @param model - The model
-   * @returns The provider specific parameters
-   */
-  private getProviderSpecificParameters(assistant: Assistant, model: Model) {
-    const { maxTokens } = getAssistantSettings(assistant)
-
-    if (this.provider.id === 'openrouter') {
-      if (model.id.includes('deepseek-r1')) {
-        return {
-          include_reasoning: true
-        }
-      }
-    }
-
-    if (isOpenAIReasoningModel(model)) {
-      return {
-        max_tokens: undefined,
-        max_completion_tokens: maxTokens
-      }
-    }
-
-    return {}
-  }
-
-  /**
-   * Get the top P for the assistant
-   * @param assistant - The assistant
-   * @param model - The model
-   * @returns The top P
-   */
-  override getTopP(assistant: Assistant, model: Model) {
-    if (isReasoningModel(model) || isOpenAIWebSearch(model)) {
-      return undefined
-    }
-
-    return assistant?.settings?.topP
-  }
-
-  /**
-   * Get the reasoning effort for the assistant
-   * @param assistant - The assistant
-   * @param model - The model
-   * @returns The reasoning effort
-   */
-  private getReasoningEffort(assistant: Assistant, model: Model) {
-    if (this.provider.id === 'groq') {
-      return {}
-    }
-
-    if (!isReasoningModel(model)) {
-      return {}
-    }
-    const reasoningEffort = assistant?.settings?.reasoning_effort
-    if (!reasoningEffort) {
-      if (isSupportedThinkingTokenQwenModel(model)) {
-        return { enable_thinking: false }
-      }
-
-      if (isSupportedThinkingTokenClaudeModel(model)) {
-        return { thinking: { type: 'disabled' } }
-      }
-
-      return {}
-    }
-    const effortRatio = EFFORT_RATIO[reasoningEffort]
-    const budgetTokens = Math.floor((findTokenLimit(model.id)?.max || 0) * effortRatio)
-    // OpenRouter models
-    if (model.provider === 'openrouter') {
-      if (isSupportedReasoningEffortModel(model)) {
-        return {
-          reasoning: {
-            effort: assistant?.settings?.reasoning_effort
-          }
-        }
-      }
-
-      if (isSupportedThinkingTokenModel(model)) {
-        return {
-          reasoning: {
-            max_tokens: budgetTokens
-          }
-        }
-      }
-    }
-
-    // Qwen models
-    if (isSupportedThinkingTokenQwenModel(model)) {
-      return {
-        enable_thinking: true,
-        thinking_budget: budgetTokens
-      }
-    }
-
-    // Grok models
-    if (isSupportedReasoningEffortGrokModel(model)) {
-      return {
-        reasoning_effort: assistant?.settings?.reasoning_effort
-      }
-    }
-
-    // OpenAI models
-    if (isSupportedReasoningEffortOpenAIModel(model)) {
-      return {
-        reasoning_effort: assistant?.settings?.reasoning_effort
-      }
-    }
-
-    // Claude models
-    if (isSupportedThinkingTokenClaudeModel(model)) {
-      return {
-        thinking: {
-          type: 'enabled',
-          budget_tokens: budgetTokens
-        }
-      }
-    }
-
-    // Default case: no special thinking settings
-    return {}
-  }
-
-  public convertMcpTools<T>(mcpTools: MCPTool[]): T[] {
-    return mcpToolsToOpenAIChatTools(mcpTools) as T[]
-  }
-
-  public mcpToolCallResponseToMessage = (mcpToolResponse: MCPToolResponse, resp: MCPCallToolResponse, model: Model) => {
-    if ('toolUseId' in mcpToolResponse && mcpToolResponse.toolUseId) {
-      return mcpToolCallResponseToOpenAICompatibleMessage(mcpToolResponse, resp, isVisionModel(model))
-    } else if ('toolCallId' in mcpToolResponse && mcpToolResponse.toolCallId) {
-      const toolCallOut: ChatCompletionToolMessageParam = {
-        role: 'tool',
-        tool_call_id: mcpToolResponse.toolCallId,
-        content: JSON.stringify(resp.content)
-      }
-      return toolCallOut
-    }
-    return
-  }
-
-  /**
-   * Generate completions for the assistant
-   * @param messages - The messages
-   * @param assistant - The assistant
-   * @param mcpTools - The MCP tools
-   * @param onChunk - The onChunk callback
-   * @param onFilterMessages - The onFilterMessages callback
-   * @returns The completions
-   */
-  async completions({ messages, assistant, mcpTools, onChunk, onFilterMessages }: CompletionsParams): Promise<void> {
-    if (assistant.enableGenerateImage) {
-      await this.generateImageByChat({ messages, assistant, onChunk } as CompletionsParams)
-      return
-    }
-    const defaultModel = getDefaultModel()
-    const model = assistant.model || defaultModel
-
-    const { contextCount, maxTokens, streamOutput, enableToolUse } = getAssistantSettings(assistant)
-    const isEnabledBultinWebSearch = assistant.enableWebSearch
-    messages = addImageFileToContents(messages)
-    const enableReasoning =
-      ((isSupportedThinkingTokenModel(model) || isSupportedReasoningEffortModel(model)) &&
-        assistant.settings?.reasoning_effort !== undefined) ||
-      (isReasoningModel(model) && (!isSupportedThinkingTokenModel(model) || !isSupportedReasoningEffortModel(model)))
-    let systemMessage = { role: 'system', content: assistant.prompt || '' }
-    if (isSupportedReasoningEffortOpenAIModel(model)) {
-      systemMessage = {
-        role: 'developer',
-        content: `Formatting re-enabled${systemMessage ? '\n' + systemMessage.content : ''}`
-      }
-    }
-    const { tools } = this.setupToolsConfig<ChatCompletionTool>({ mcpTools, model, enableToolUse })
-
-    if (this.useSystemPromptForTools) {
-      systemMessage.content = buildSystemPrompt(systemMessage.content || '', mcpTools)
-    }
-
-    const userMessages: ChatCompletionMessageParam[] = []
-    const _messages = filterUserRoleStartMessages(
-      filterEmptyMessages(filterContextMessages(takeRight(messages, contextCount + 1)))
-    )
-
-    onFilterMessages(_messages)
-
-    for (const message of _messages) {
-      userMessages.push(await this.getMessageParam(message, model))
-    }
-
-    const isSupportStreamOutput = () => {
-      return streamOutput
-    }
-
-    const lastUserMessage = _messages.findLast((m) => m.role === 'user')
-    const { abortController, cleanup, signalPromise } = this.createAbortController(lastUserMessage?.id, true)
-    const { signal } = abortController
-    await this.checkIsCopilot()
-
-    const lastUserMsg = userMessages.findLast((m) => m.role === 'user')
-    if (lastUserMsg && isSupportedThinkingTokenQwenModel(model)) {
-      const postsuffix = '/no_think'
-      // qwenThinkMode === true 表示思考模式啓用，此時不應添加 /no_think，如果存在則移除
-      const qwenThinkModeEnabled = assistant.settings?.qwenThinkMode === true
-      const currentContent = lastUserMsg.content // content 類型：string | ChatCompletionContentPart[] | null
-
-      lastUserMsg.content = processPostsuffixQwen3Model(
-        currentContent,
-        postsuffix,
-        qwenThinkModeEnabled
-      ) as ChatCompletionContentPart[]
-    }
-
-    //当 systemMessage 内容为空时不发送 systemMessage
-    let reqMessages: ChatCompletionMessageParam[]
-    if (!systemMessage.content) {
-      reqMessages = [...userMessages]
-    } else {
-      reqMessages = [systemMessage, ...userMessages].filter(Boolean) as ChatCompletionMessageParam[]
-    }
-
-    let finalUsage: Usage = {
-      completion_tokens: 0,
-      prompt_tokens: 0,
-      total_tokens: 0
-    }
-
-    const finalMetrics: Metrics = {
-      completion_tokens: 0,
-      time_completion_millsec: 0,
-      time_first_token_millsec: 0
-    }
-
-    const toolResponses: MCPToolResponse[] = []
-
-    const processToolResults = async (toolResults: Awaited<ReturnType<typeof parseAndCallTools>>, idx: number) => {
-      if (toolResults.length === 0) return
-
-      toolResults.forEach((ts) => reqMessages.push(ts as ChatCompletionMessageParam))
-
-      console.debug('[tool] reqMessages before processing', model.id, reqMessages)
-      reqMessages = processReqMessages(model, reqMessages)
-      console.debug('[tool] reqMessages', model.id, reqMessages)
-
-      onChunk({ type: ChunkType.LLM_RESPONSE_CREATED })
-      const newStream = await this.sdk.chat.completions
-        // @ts-ignore key is not typed
-        .create(
-          {
-            model: model.id,
-            messages: reqMessages,
-            temperature: this.getTemperature(assistant, model),
-            top_p: this.getTopP(assistant, model),
-            max_tokens: maxTokens,
-            keep_alive: this.keepAliveTime,
-            stream: isSupportStreamOutput(),
-            tools: !isEmpty(tools) ? tools : undefined,
-            ...getOpenAIWebSearchParams(assistant, model),
-            ...this.getReasoningEffort(assistant, model),
-            ...this.getProviderSpecificParameters(assistant, model),
-            ...this.getCustomParameters(assistant)
-          },
-          {
-            signal
-          }
-        )
-      await processStream(newStream, idx + 1)
-    }
-
-    const processToolCalls = async (mcpTools, toolCalls: ChatCompletionMessageToolCall[]) => {
-      const mcpToolResponses = toolCalls
-        .map((toolCall) => {
-          const mcpTool = openAIToolsToMcpTool(mcpTools, toolCall as ChatCompletionMessageToolCall)
-          if (!mcpTool) return undefined
-
-          const parsedArgs = (() => {
-            try {
-              return JSON.parse(toolCall.function.arguments)
-            } catch {
-              return toolCall.function.arguments
-            }
-          })()
-
-          return {
-            id: toolCall.id,
-            toolCallId: toolCall.id,
-            tool: mcpTool,
-            arguments: parsedArgs,
-            status: 'pending'
-          } as ToolCallResponse
-        })
-        .filter((t): t is ToolCallResponse => typeof t !== 'undefined')
-      return await parseAndCallTools(
-        mcpToolResponses,
-        toolResponses,
-        onChunk,
-        this.mcpToolCallResponseToMessage,
-        model,
-        mcpTools
-      )
-    }
-
-    const processToolUses = async (content: string) => {
-      return await parseAndCallTools(
-        content,
-        toolResponses,
-        onChunk,
-        this.mcpToolCallResponseToMessage,
-        model,
-        mcpTools
-      )
-    }
-
-    const processStream = async (stream: any, idx: number) => {
-      const toolCalls: ChatCompletionMessageToolCall[] = []
-      let time_first_token_millsec = 0
-
-      // Handle non-streaming case (already returns early, no change needed here)
-      if (!isSupportStreamOutput()) {
-        // Calculate final metrics once
-        finalMetrics.completion_tokens = stream.usage?.completion_tokens
-        finalMetrics.time_completion_millsec = new Date().getTime() - start_time_millsec
-
-        // Create a synthetic usage object if stream.usage is undefined
-        finalUsage = { ...stream.usage }
-        // Separate onChunk calls for text and usage/metrics
-        let content = ''
-        stream.choices.forEach((choice) => {
-          // reasoning
-          if (choice.message.reasoning) {
-            onChunk({ type: ChunkType.THINKING_DELTA, text: choice.message.reasoning })
-            onChunk({
-              type: ChunkType.THINKING_COMPLETE,
-              text: choice.message.reasoning,
-              thinking_millsec: new Date().getTime() - start_time_millsec
-            })
-          }
-          // text
-          if (choice.message.content) {
-            content += choice.message.content
-            onChunk({ type: ChunkType.TEXT_DELTA, text: choice.message.content })
-          }
-          // tool call
-          if (choice.message.tool_calls && choice.message.tool_calls.length) {
-            choice.message.tool_calls.forEach((t) => toolCalls.push(t))
-          }
-
-          reqMessages.push({
-            role: choice.message.role,
-            content: choice.message.content,
-            tool_calls: toolCalls.length
-              ? toolCalls.map((toolCall) => ({
-                  id: toolCall.id,
-                  function: {
-                    ...toolCall.function,
-                    arguments:
-                      typeof toolCall.function.arguments === 'string'
-                        ? toolCall.function.arguments
-                        : JSON.stringify(toolCall.function.arguments)
-                  },
-                  type: 'function'
-                }))
-              : undefined
-          })
-        })
-
-        if (content.length) {
-          onChunk({ type: ChunkType.TEXT_COMPLETE, text: content })
-        }
-
-        const toolResults: Awaited<ReturnType<typeof parseAndCallTools>> = []
-        if (toolCalls.length) {
-          toolResults.push(...(await processToolCalls(mcpTools, toolCalls)))
-        }
-        if (stream.choices[0].message?.content) {
-          toolResults.push(...(await processToolUses(stream.choices[0].message?.content)))
-        }
-        await processToolResults(toolResults, idx)
-
-        // Always send usage and metrics data
-        onChunk({ type: ChunkType.BLOCK_COMPLETE, response: { usage: finalUsage, metrics: finalMetrics } })
-        return
-      }
-
-      let content = ''
-      let thinkingContent = ''
-      let isFirstChunk = true
-
-      // 1. 初始化中间件
-      const reasoningTags = [
-        { openingTag: '<think>', closingTag: '</think>', separator: '\n' },
-        { openingTag: '###Thinking', closingTag: '###Response', separator: '\n' }
-      ]
-      const getAppropriateTag = (model: Model) => {
-        if (model.id.includes('qwen3')) return reasoningTags[0]
-        return reasoningTags[0]
-      }
-      const reasoningTag = getAppropriateTag(model)
-      async function* openAIChunkToTextDelta(stream: any): AsyncGenerator<OpenAIStreamChunk> {
-        for await (const chunk of stream) {
-          if (window.keyv.get(EVENT_NAMES.CHAT_COMPLETION_PAUSED)) {
-            break
-          }
-
-          const delta = chunk.choices[0]?.delta
-          if (delta?.reasoning_content || delta?.reasoning) {
-            yield { type: 'reasoning', textDelta: delta.reasoning_content || delta.reasoning }
-          }
-          if (delta?.content) {
-            yield { type: 'text-delta', textDelta: delta.content }
-          }
-          if (delta?.tool_calls) {
-            yield { type: 'tool-calls', delta: delta }
-          }
-
-          const finishReason = chunk.choices[0]?.finish_reason
-          if (!isEmpty(finishReason)) {
-            yield { type: 'finish', finishReason, usage: chunk.usage, delta, chunk }
-            break
-          }
-        }
-      }
-
-      // 2. 使用中间件
-      const { stream: processedStream } = await extractReasoningMiddleware<OpenAIStreamChunk>({
-        openingTag: reasoningTag?.openingTag,
-        closingTag: reasoningTag?.closingTag,
-        separator: reasoningTag?.separator,
-        enableReasoning
-      }).wrapStream({
-        doStream: async () => ({
-          stream: asyncGeneratorToReadableStream(openAIChunkToTextDelta(stream))
-        })
-      })
-
-      // 3. 消费 processedStream，分发 onChunk
-      for await (const chunk of readableStreamAsyncIterable(processedStream)) {
-        const delta = chunk.type === 'finish' ? chunk.delta : chunk
-        const rawChunk = chunk.type === 'finish' ? chunk.chunk : chunk
-
-        switch (chunk.type) {
-          case 'reasoning': {
-            if (time_first_token_millsec === 0) {
-              time_first_token_millsec = new Date().getTime()
-            }
-            thinkingContent += chunk.textDelta
-            onChunk({
-              type: ChunkType.THINKING_DELTA,
-              text: chunk.textDelta,
-              thinking_millsec: new Date().getTime() - time_first_token_millsec
-            })
-            break
-          }
-          case 'text-delta': {
-            let textDelta = chunk.textDelta
-            if (assistant.enableWebSearch && delta) {
-              const originalDelta = rawChunk?.choices?.[0]?.delta
-
-              if (originalDelta?.annotations) {
-                textDelta = convertLinks(textDelta, isFirstChunk)
-              } else if (assistant.model?.provider === 'openrouter') {
-                textDelta = convertLinksToOpenRouter(textDelta, isFirstChunk)
-              } else if (isZhipuModel(assistant.model)) {
-                textDelta = convertLinksToZhipu(textDelta, isFirstChunk)
-              } else if (isHunyuanSearchModel(assistant.model)) {
-                const searchResults = rawChunk?.search_info?.search_results || []
-                textDelta = convertLinksToHunyuan(textDelta, searchResults, isFirstChunk)
-              }
-            }
-            if (isFirstChunk) {
-              isFirstChunk = false
-              if (time_first_token_millsec === 0) {
-                time_first_token_millsec = new Date().getTime()
-              } else {
-                onChunk({
-                  type: ChunkType.THINKING_COMPLETE,
-                  text: thinkingContent,
-                  thinking_millsec: new Date().getTime() - time_first_token_millsec
-                })
-              }
-            }
-            content += textDelta
-            onChunk({ type: ChunkType.TEXT_DELTA, text: textDelta })
-            break
-          }
-          case 'tool-calls': {
-            if (isFirstChunk) {
-              isFirstChunk = false
-              if (time_first_token_millsec === 0) {
-                time_first_token_millsec = new Date().getTime()
-              } else {
-                onChunk({
-                  type: ChunkType.THINKING_COMPLETE,
-                  text: thinkingContent,
-                  thinking_millsec: new Date().getTime() - time_first_token_millsec
-                })
-              }
-            }
-            chunk.delta.tool_calls.forEach((toolCall) => {
-              const { id, index, type, function: fun } = toolCall
-              if (id && type === 'function' && fun) {
-                const { name, arguments: args } = fun
-                toolCalls.push({
-                  id,
-                  function: {
-                    name: name || '',
-                    arguments: args || ''
-                  },
-                  type: 'function'
-                })
-              } else if (fun?.arguments) {
-                toolCalls[index].function.arguments += fun.arguments
-              }
-            })
-            break
-          }
-          case 'finish': {
-            const finishReason = chunk.finishReason
-            const usage = chunk.usage
-            const originalFinishDelta = chunk.delta
-            const originalFinishRawChunk = chunk.chunk
-
-            if (!isEmpty(finishReason)) {
-              onChunk({ type: ChunkType.TEXT_COMPLETE, text: content })
-              if (usage) {
-                finalUsage.completion_tokens += usage.completion_tokens || 0
-                finalUsage.prompt_tokens += usage.prompt_tokens || 0
-                finalUsage.total_tokens += usage.total_tokens || 0
-                finalMetrics.completion_tokens += usage.completion_tokens || 0
-              }
-              finalMetrics.time_completion_millsec += new Date().getTime() - start_time_millsec
-              finalMetrics.time_first_token_millsec = time_first_token_millsec - start_time_millsec
-              if (originalFinishDelta?.annotations) {
-                if (assistant.model?.provider === 'copilot') return
-
-                onChunk({
-                  type: ChunkType.LLM_WEB_SEARCH_COMPLETE,
-                  llm_web_search: {
-                    results: originalFinishDelta.annotations,
-                    source: WebSearchSource.OPENAI
-                  }
-                } as LLMWebSearchCompleteChunk)
-              }
-              if (assistant.model?.provider === 'perplexity') {
-                const citations = originalFinishRawChunk.citations
-                if (citations) {
-                  onChunk({
-                    type: ChunkType.LLM_WEB_SEARCH_COMPLETE,
-                    llm_web_search: {
-                      results: citations,
-                      source: WebSearchSource.PERPLEXITY
-                    }
-                  } as LLMWebSearchCompleteChunk)
-                }
-              }
-              if (
-                isEnabledBultinWebSearch &&
-                isZhipuModel(model) &&
-                finishReason === 'stop' &&
-                originalFinishRawChunk?.web_search
-              ) {
-                onChunk({
-                  type: ChunkType.LLM_WEB_SEARCH_COMPLETE,
-                  llm_web_search: {
-                    results: originalFinishRawChunk.web_search,
-                    source: WebSearchSource.ZHIPU
-                  }
-                } as LLMWebSearchCompleteChunk)
-              }
-              if (
-                isEnabledBultinWebSearch &&
-                isHunyuanSearchModel(model) &&
-                originalFinishRawChunk?.search_info?.search_results
-              ) {
-                onChunk({
-                  type: ChunkType.LLM_WEB_SEARCH_COMPLETE,
-                  llm_web_search: {
-                    results: originalFinishRawChunk.search_info.search_results,
-                    source: WebSearchSource.HUNYUAN
-                  }
-                } as LLMWebSearchCompleteChunk)
-              }
-            }
-            break
-          }
-        }
-      }
-
-      reqMessages.push({
-        role: 'assistant',
-        content: content,
-        tool_calls: toolCalls.length
-          ? toolCalls.map((toolCall) => ({
-              id: toolCall.id,
-              function: {
-                ...toolCall.function,
-                arguments:
-                  typeof toolCall.function.arguments === 'string'
-                    ? toolCall.function.arguments
-                    : JSON.stringify(toolCall.function.arguments)
-              },
-              type: 'function'
-            }))
-          : undefined
-      })
-      let toolResults: Awaited<ReturnType<typeof parseAndCallTools>> = []
-      if (toolCalls.length) {
-        toolResults = await processToolCalls(mcpTools, toolCalls)
-      }
-      if (content.length) {
-        toolResults = toolResults.concat(await processToolUses(content))
-      }
-      if (toolResults.length) {
-        await processToolResults(toolResults, idx)
-      }
-
-      onChunk({
-        type: ChunkType.BLOCK_COMPLETE,
-        response: {
-          usage: finalUsage,
-          metrics: finalMetrics
-        }
-      })
-    }
-
-    reqMessages = processReqMessages(model, reqMessages)
-    // 等待接口返回流
-    onChunk({ type: ChunkType.LLM_RESPONSE_CREATED })
-    const start_time_millsec = new Date().getTime()
-    const stream = await this.sdk.chat.completions
-      // @ts-ignore key is not typed
-      .create(
-        {
-          model: model.id,
-          messages: reqMessages,
-          temperature: this.getTemperature(assistant, model),
-          top_p: this.getTopP(assistant, model),
-          max_tokens: maxTokens,
-          keep_alive: this.keepAliveTime,
-          stream: isSupportStreamOutput(),
-          tools: !isEmpty(tools) ? tools : undefined,
-          service_tier: this.getServiceTier(model),
-          ...getOpenAIWebSearchParams(assistant, model),
-          ...this.getReasoningEffort(assistant, model),
-          ...this.getProviderSpecificParameters(assistant, model),
-          ...this.getCustomParameters(assistant)
-        },
-        {
-          signal,
-          timeout: this.getTimeout(model)
-        }
-      )
-
-    await processStream(stream, 0).finally(cleanup)
-
-    // 捕获signal的错误
-    await signalPromise?.promise?.catch((error) => {
-      throw error
-    })
-  }
-
-  /**
-   * Translate a message
-   * @param content
-   * @param assistant - The assistant
-   * @param onResponse - The onResponse callback
-   * @returns The translated message
-   */
-  async translate(content: string, assistant: Assistant, onResponse?: (text: string, isComplete: boolean) => void) {
-    const defaultModel = getDefaultModel()
-    const model = assistant.model || defaultModel
-
-    const messagesForApi = content
-      ? [
-          { role: 'system', content: assistant.prompt },
-          { role: 'user', content }
-        ]
-      : [{ role: 'user', content: assistant.prompt }]
-
-    const isSupportedStreamOutput = () => {
-      if (!onResponse) {
-        return false
-      }
-      return true
-    }
-
-    const stream = isSupportedStreamOutput()
-
-    await this.checkIsCopilot()
-
-    // console.debug('[translate] reqMessages', model.id, message)
-    // @ts-ignore key is not typed
-    const response = await this.sdk.chat.completions.create({
-      model: model.id,
-      messages: messagesForApi as ChatCompletionMessageParam[],
-      stream,
-      keep_alive: this.keepAliveTime,
-      temperature: this.getTemperature(assistant, model),
-      top_p: this.getTopP(assistant, model),
-      ...this.getReasoningEffort(assistant, model)
-    })
-
-    if (!stream) {
-      return response.choices[0].message?.content || ''
-    }
-
-    let text = ''
-    let isThinking = false
-    const isReasoning = isReasoningModel(model)
-
-    for await (const chunk of response) {
-      const deltaContent = chunk.choices[0]?.delta?.content || ''
-
-      if (isReasoning) {
-        if (deltaContent.includes('<think>')) {
-          isThinking = true
-        }
-
-        if (!isThinking) {
-          text += deltaContent
-          onResponse?.(text, false)
-        }
-
-        if (deltaContent.includes('</think>')) {
-          isThinking = false
-        }
-      } else {
-        text += deltaContent
-        onResponse?.(text, false)
-      }
-    }
-
-    onResponse?.(text, true)
-
-    return text
-  }
-
-  /**
-   * Summarize a message
-   * @param messages - The messages
-   * @param assistant - The assistant
-   * @returns The summary
-   */
-  public async summaries(messages: Message[], assistant: Assistant): Promise<string> {
-    const model = getTopNamingModel() || assistant.model || getDefaultModel()
-
-    const userMessages = takeRight(messages, 5)
-      .filter((message) => !message.isPreset)
-      .map((message) => ({
-        role: message.role,
-        content: getMainTextContent(message)
-      }))
-
-    const userMessageContent = userMessages.reduce((prev, curr) => {
-      const content = curr.role === 'user' ? `User: ${curr.content}` : `Assistant: ${curr.content}`
-      return prev + (prev ? '\n' : '') + content
-    }, '')
-
-    const systemMessage = {
-      role: 'system',
-      content: getStoreSetting('topicNamingPrompt') || i18n.t('prompts.title')
-    }
-
-    const userMessage = {
-      role: 'user',
-      content: userMessageContent
-    }
-
-    await this.checkIsCopilot()
-
-    // @ts-ignore key is not typed
-    const response = await this.sdk.chat.completions.create({
-      model: model.id,
-      messages: [systemMessage, userMessage] as ChatCompletionMessageParam[],
-      stream: false,
-      keep_alive: this.keepAliveTime,
-      max_tokens: 1000
-    })
-
-    // 针对思考类模型的返回，总结仅截取</think>之后的内容
-    let content = response.choices[0].message?.content || ''
-    content = content.replace(/^<think>(.*?)<\/think>/s, '')
-
-    return removeSpecialCharactersForTopicName(content.substring(0, 50))
-  }
-
-  /**
-   * Summarize a message for search
-   * @param messages - The messages
-   * @param assistant - The assistant
-   * @returns The summary
-   */
-  public async summaryForSearch(messages: Message[], assistant: Assistant): Promise<string | null> {
-    const model = assistant.model || getDefaultModel()
-
-    const systemMessage = {
-      role: 'system',
-      content: assistant.prompt
-    }
-
-    const messageContents = messages.map((m) => getMainTextContent(m))
-    const userMessageContent = messageContents.join('\n')
-
-    const userMessage = {
-      role: 'user',
-      content: userMessageContent
-    }
-
-    const lastUserMessage = messages[messages.length - 1]
-    const { abortController, cleanup } = this.createAbortController(lastUserMessage?.id)
-    const { signal } = abortController
-
-    const response = await this.sdk.chat.completions
-      // @ts-ignore key is not typed
-      .create(
-        {
-          model: model.id,
-          messages: [systemMessage, userMessage] as ChatCompletionMessageParam[],
-          stream: false,
-          keep_alive: this.keepAliveTime,
-          max_tokens: 1000
-        },
-        {
-          timeout: 20 * 1000,
-          signal: signal
-        }
-      )
-      .finally(cleanup)
-
-    // 针对思考类模型的返回，总结仅截取</think>之后的内容
-    let content = response.choices[0].message?.content || ''
-    content = content.replace(/^<think>(.*?)<\/think>/s, '')
-
-    return content
-  }
-
-  /**
-   * Generate text
-   * @param prompt - The prompt
-   * @param content - The content
-   * @returns The generated text
-   */
-  public async generateText({ prompt, content }: { prompt: string; content: string }): Promise<string> {
-    const model = getDefaultModel()
-
-    await this.checkIsCopilot()
-
-    const response = await this.sdk.chat.completions.create({
-      model: model.id,
-      stream: false,
-      messages: [
-        { role: 'system', content: prompt },
-        { role: 'user', content }
-      ]
-    })
-
-    return response.choices[0].message?.content || ''
-  }
-
-  /**
-   * Generate suggestions
-   * @param messages - The messages
-   * @param assistant - The assistant
-   * @returns The suggestions
-   */
-  async suggestions(messages: Message[], assistant: Assistant): Promise<Suggestion[]> {
-    const { model } = assistant
-
-    if (!model) {
-      return []
-    }
-
-    await this.checkIsCopilot()
-
-    const userMessagesForApi = messages
-      .filter((m) => m.role === 'user')
-      .map((m) => ({
-        role: m.role,
-        content: getMainTextContent(m)
-      }))
-
-    const response: any = await this.sdk.request({
-      method: 'post',
-      path: '/advice_questions',
-      body: {
-        messages: userMessagesForApi,
-        model: model.id,
-        max_tokens: 0,
-        temperature: 0,
-        n: 0
-      }
-    })
-
-    return response?.questions?.filter(Boolean)?.map((q: any) => ({ content: q })) || []
-  }
-
-  /**
-   * Check if the model is valid
-   * @param model - The model
-   * @param stream - Whether to use streaming interface
-   * @returns The validity of the model
-   */
-  public async check(model: Model, stream: boolean = false): Promise<{ valid: boolean; error: Error | null }> {
-    if (!model) {
-      return { valid: false, error: new Error('No model found') }
-    }
-
-    const body = {
-      model: model.id,
-      messages: [{ role: 'user', content: 'hi' }],
-      max_completion_tokens: 1, // openAI
-      max_tokens: 1, // openAI deprecated 但大部分OpenAI兼容的提供商继续用这个头
-      enable_thinking: false, // qwen3
-      stream
-    }
-
-    try {
-      await this.checkIsCopilot()
-      if (!stream) {
-        const response = await this.sdk.chat.completions.create(body as ChatCompletionCreateParamsNonStreaming)
-        if (!response?.choices[0].message) {
-          throw new Error('Empty response')
-        }
-        return { valid: true, error: null }
-      } else {
-        const response: any = await this.sdk.chat.completions.create(body as any)
-        // 等待整个流式响应结束
-        let hasContent = false
-        for await (const chunk of response) {
-          if (chunk.choices?.[0]?.delta?.content) {
-            hasContent = true
-          }
-        }
-        if (hasContent) {
-          return { valid: true, error: null }
-        }
-        throw new Error('Empty streaming response')
-      }
-    } catch (error: any) {
-      return {
-        valid: false,
-        error
-      }
-    }
-  }
-
-  /**
-   * Get the models
-   * @returns The models
-   */
-  public async models(): Promise<OpenAI.Models.Model[]> {
-    try {
-      await this.checkIsCopilot()
-
-      const response = await this.sdk.models.list()
-
-      if (this.provider.id === 'github') {
-        // @ts-ignore key is not typed
-        return response.body
-          .map((model) => ({
-            id: model.name,
-            description: model.summary,
-            object: 'model',
-            owned_by: model.publisher
-          }))
-          .filter(isSupportedModel)
-      }
-
-      if (this.provider.id === 'together') {
-        // @ts-ignore key is not typed
-        return response?.body
-          .map((model: any) => ({
-            id: model.id,
-            description: model.display_name,
-            object: 'model',
-            owned_by: model.organization
-          }))
-          .filter(isSupportedModel)
-      }
-
-      const models = response.data || []
-      models.forEach((model) => {
-        model.id = model.id.trim()
-      })
-
-      return models.filter(isSupportedModel)
-    } catch (error) {
-      return []
-    }
-  }
-
-  /**
-   * Get the embedding dimensions
-   * @param model - The model
-   * @returns The embedding dimensions
-   */
-  public async getEmbeddingDimensions(model: Model): Promise<number> {
-    await this.checkIsCopilot()
-
-    const data = await this.sdk.embeddings.create({
-      model: model.id,
-      input: model?.provider === 'baidu-cloud' ? ['hi'] : 'hi'
-    })
-    return data.data[0].embedding.length
-  }
-
-  public async checkIsCopilot() {
-    if (this.provider.id !== 'copilot') {
-      return
-    }
-    const defaultHeaders = store.getState().copilot.defaultHeaders
-    // copilot每次请求前需要重新获取token，因为token中附带时间戳
-    const { token } = await window.api.copilot.getToken(defaultHeaders)
-    this.sdk.apiKey = token
-  }
-}
diff --git a/src/renderer/src/providers/AiProvider/OpenAIProvider.ts b/src/renderer/src/providers/AiProvider/OpenAIProvider.ts
index 51f61136b3..650960fc65 100644
--- a/src/renderer/src/providers/AiProvider/OpenAIProvider.ts
+++ b/src/renderer/src/providers/AiProvider/OpenAIProvider.ts
@@ -1,26 +1,36 @@
 import {
+  findTokenLimit,
   getOpenAIWebSearchParams,
-  isOpenAILLMModel,
+  isHunyuanSearchModel,
   isOpenAIReasoningModel,
   isOpenAIWebSearch,
+  isReasoningModel,
   isSupportedModel,
+  isSupportedReasoningEffortGrokModel,
+  isSupportedReasoningEffortModel,
   isSupportedReasoningEffortOpenAIModel,
-  isVisionModel
+  isSupportedThinkingTokenClaudeModel,
+  isSupportedThinkingTokenModel,
+  isSupportedThinkingTokenQwenModel,
+  isVisionModel,
+  isZhipuModel
 } from '@renderer/config/models'
 import { getStoreSetting } from '@renderer/hooks/useSettings'
 import i18n from '@renderer/i18n'
+import { extractReasoningMiddleware } from '@renderer/middlewares/extractReasoningMiddleware'
 import { getAssistantSettings, getDefaultModel, getTopNamingModel } from '@renderer/services/AssistantService'
 import { EVENT_NAMES } from '@renderer/services/EventService'
-import FileManager from '@renderer/services/FileManager'
 import {
   filterContextMessages,
   filterEmptyMessages,
   filterUserRoleStartMessages
 } from '@renderer/services/MessagesService'
+import { processPostsuffixQwen3Model, processReqMessages } from '@renderer/services/ModelMessageService'
+import store from '@renderer/store'
 import {
   Assistant,
+  EFFORT_RATIO,
   FileTypes,
-  GenerateImageParams,
   MCPCallToolResponse,
   MCPTool,
   MCPToolResponse,
@@ -32,205 +42,83 @@ import {
   Usage,
   WebSearchSource
 } from '@renderer/types'
-import { ChunkType } from '@renderer/types/chunk'
+import { ChunkType, LLMWebSearchCompleteChunk } from '@renderer/types/chunk'
 import { Message } from '@renderer/types/newMessage'
 import { removeSpecialCharactersForTopicName } from '@renderer/utils'
 import { addImageFileToContents } from '@renderer/utils/formats'
-import { convertLinks } from '@renderer/utils/linkConverter'
 import {
-  mcpToolCallResponseToOpenAIMessage,
-  mcpToolsToOpenAIResponseTools,
+  convertLinks,
+  convertLinksToHunyuan,
+  convertLinksToOpenRouter,
+  convertLinksToZhipu
+} from '@renderer/utils/linkConverter'
+import {
+  mcpToolCallResponseToOpenAICompatibleMessage,
+  mcpToolsToOpenAIChatTools,
   openAIToolsToMcpTool,
   parseAndCallTools
 } from '@renderer/utils/mcp-tools'
 import { findFileBlocks, findImageBlocks, getMainTextContent } from '@renderer/utils/messageUtils/find'
 import { buildSystemPrompt } from '@renderer/utils/prompt'
+import { asyncGeneratorToReadableStream, readableStreamAsyncIterable } from '@renderer/utils/stream'
 import { isEmpty, takeRight } from 'lodash'
-import OpenAI from 'openai'
-import { ChatCompletionContentPart, ChatCompletionMessageParam } from 'openai/resources/chat/completions'
-import { Stream } from 'openai/streaming'
-import { FileLike, toFile } from 'openai/uploads'
+import OpenAI, { AzureOpenAI } from 'openai'
+import {
+  ChatCompletionContentPart,
+  ChatCompletionCreateParamsNonStreaming,
+  ChatCompletionMessageParam,
+  ChatCompletionMessageToolCall,
+  ChatCompletionTool,
+  ChatCompletionToolMessageParam
+} from 'openai/resources'
 
 import { CompletionsParams } from '.'
-import BaseProvider from './BaseProvider'
+import { BaseOpenAiProvider } from './OpenAIResponseProvider'
 
-export abstract class BaseOpenAiProvider extends BaseProvider {
-  protected sdk: OpenAI
+// 1. 定义联合类型
+export type OpenAIStreamChunk =
+  | { type: 'reasoning' | 'text-delta'; textDelta: string }
+  | { type: 'tool-calls'; delta: any }
+  | { type: 'finish'; finishReason: any; usage: any; delta: any; chunk: any }
 
+export default class OpenAIProvider extends BaseOpenAiProvider {
   constructor(provider: Provider) {
     super(provider)
 
+    if (provider.id === 'azure-openai' || provider.type === 'azure-openai') {
+      this.sdk = new AzureOpenAI({
+        dangerouslyAllowBrowser: true,
+        apiKey: this.apiKey,
+        apiVersion: provider.apiVersion,
+        endpoint: provider.apiHost
+      })
+      return
+    }
+
     this.sdk = new OpenAI({
       dangerouslyAllowBrowser: true,
       apiKey: this.apiKey,
       baseURL: this.getBaseURL(),
       defaultHeaders: {
-        ...this.defaultHeaders()
+        ...this.defaultHeaders(),
+        ...(this.provider.id === 'copilot' ? { 'editor-version': 'vscode/1.97.2' } : {}),
+        ...(this.provider.id === 'copilot' ? { 'copilot-vision-request': 'true' } : {})
       }
     })
   }
 
-  abstract convertMcpTools<T>(mcpTools: MCPTool[]): T[]
-
-  abstract mcpToolCallResponseToMessage: (
-    mcpToolResponse: MCPToolResponse,
-    resp: MCPCallToolResponse,
-    model: Model
-  ) => OpenAI.Responses.ResponseInputItem | ChatCompletionMessageParam | undefined
-
   /**
-   * Extract the file content from the message
-   * @param message - The message
-   * @returns The file content
+   * Check if the provider does not support files
+   * @returns True if the provider does not support files, false otherwise
    */
-  protected async extractFileContent(message: Message) {
-    const fileBlocks = findFileBlocks(message)
-    if (fileBlocks.length > 0) {
-      const textFileBlocks = fileBlocks.filter(
-        (fb) => fb.file && [FileTypes.TEXT, FileTypes.DOCUMENT].includes(fb.file.type)
-      )
-
-      if (textFileBlocks.length > 0) {
-        let text = ''
-        const divider = '\n\n---\n\n'
-
-        for (const fileBlock of textFileBlocks) {
-          const file = fileBlock.file
-          const fileContent = (await window.api.file.read(file.id + file.ext)).trim()
-          const fileNameRow = 'file: ' + file.origin_name + '\n\n'
-          text = text + fileNameRow + fileContent + divider
-        }
-
-        return text
-      }
+  private get isNotSupportFiles() {
+    if (this.provider?.isNotSupportArrayContent) {
+      return true
     }
 
-    return ''
-  }
+    const providers = ['deepseek', 'baichuan', 'minimax', 'xirang']
 
-  private async getReponseMessageParam(message: Message, model: Model): Promise<OpenAI.Responses.ResponseInputItem> {
-    const isVision = isVisionModel(model)
-    const content = await this.getMessageContent(message)
-    const fileBlocks = findFileBlocks(message)
-    const imageBlocks = findImageBlocks(message)
-
-    if (fileBlocks.length === 0 && imageBlocks.length === 0) {
-      if (message.role === 'assistant') {
-        return {
-          role: 'assistant',
-          content: content
-        }
-      } else {
-        return {
-          role: message.role === 'system' ? 'user' : message.role,
-          content: content ? [{ type: 'input_text', text: content }] : []
-        } as OpenAI.Responses.EasyInputMessage
-      }
-    }
-
-    const parts: OpenAI.Responses.ResponseInputContent[] = []
-    if (content) {
-      parts.push({
-        type: 'input_text',
-        text: content
-      })
-    }
-
-    for (const imageBlock of imageBlocks) {
-      if (isVision) {
-        if (imageBlock.file) {
-          const image = await window.api.file.base64Image(imageBlock.file.id + imageBlock.file.ext)
-          parts.push({
-            detail: 'auto',
-            type: 'input_image',
-            image_url: image.data as string
-          })
-        } else if (imageBlock.url && imageBlock.url.startsWith('data:')) {
-          parts.push({
-            detail: 'auto',
-            type: 'input_image',
-            image_url: imageBlock.url
-          })
-        }
-      }
-    }
-
-    for (const fileBlock of fileBlocks) {
-      const file = fileBlock.file
-      if (!file) continue
-
-      if ([FileTypes.TEXT, FileTypes.DOCUMENT].includes(file.type)) {
-        const fileContent = (await window.api.file.read(file.id + file.ext)).trim()
-        parts.push({
-          type: 'input_text',
-          text: file.origin_name + '\n' + fileContent
-        })
-      }
-    }
-
-    return {
-      role: message.role === 'system' ? 'user' : message.role,
-      content: parts
-    }
-  }
-
-  protected getServiceTier(model: Model) {
-    if ((model.id.includes('o3') && !model.id.includes('o3-mini')) || model.id.includes('o4-mini')) {
-      return 'flex'
-    }
-    if (isOpenAILLMModel(model)) {
-      return 'auto'
-    }
-    return undefined
-  }
-
-  protected getTimeout(model: Model) {
-    if ((model.id.includes('o3') && !model.id.includes('o3-mini')) || model.id.includes('o4-mini')) {
-      return 15 * 1000 * 60
-    }
-    return 5 * 1000 * 60
-  }
-
-  /**
-   * Get the temperature for the assistant
-   * @param assistant - The assistant
-   * @param model - The model
-   * @returns The temperature
-   */
-  protected getTemperature(assistant: Assistant, model: Model) {
-    return isOpenAIReasoningModel(model) || isOpenAILLMModel(model) ? undefined : assistant?.settings?.temperature
-  }
-
-  /**
-   * Get the top P for the assistant
-   * @param assistant - The assistant
-   * @param model - The model
-   * @returns The top P
-   */
-  protected getTopP(assistant: Assistant, model: Model) {
-    return isOpenAIReasoningModel(model) || isOpenAILLMModel(model) ? undefined : assistant?.settings?.topP
-  }
-
-  private getResponseReasoningEffort(assistant: Assistant, model: Model) {
-    if (!isSupportedReasoningEffortOpenAIModel(model)) {
-      return {}
-    }
-
-    const reasoningEffort = assistant?.settings?.reasoning_effort
-    if (!reasoningEffort) {
-      return {}
-    }
-
-    if (isSupportedReasoningEffortOpenAIModel(model)) {
-      return {
-        reasoning: {
-          effort: reasoningEffort as OpenAI.ReasoningEffort,
-          summary: 'detailed'
-        } as OpenAI.Reasoning
-      }
-    }
-
-    return {}
+    return providers.includes(this.provider.id)
   }
 
   /**
@@ -239,7 +127,7 @@ export abstract class BaseOpenAiProvider extends BaseProvider {
    * @param model - The model
    * @returns The message parameter
    */
-  protected async getMessageParam(
+  override async getMessageParam(
     message: Message,
     model: Model
   ): Promise<OpenAI.Chat.Completions.ChatCompletionMessageParam> {
@@ -255,6 +143,17 @@ export abstract class BaseOpenAiProvider extends BaseProvider {
       }
     }
 
+    // If the model does not support files, extract the file content
+    if (this.isNotSupportFiles) {
+      const fileContent = await this.extractFileContent(message)
+
+      return {
+        role: message.role === 'system' ? 'user' : message.role,
+        content: content + '\n\n---\n\n' + fileContent
+      }
+    }
+
+    // If the model supports files, add the file content to the message
     const parts: ChatCompletionContentPart[] = []
 
     if (content) {
@@ -273,7 +172,7 @@ export abstract class BaseOpenAiProvider extends BaseProvider {
     }
 
     for (const fileBlock of fileBlocks) {
-      const { file } = fileBlock
+      const file = fileBlock.file
       if (!file) {
         continue
       }
@@ -294,10 +193,162 @@ export abstract class BaseOpenAiProvider extends BaseProvider {
   }
 
   /**
-   * Generate completions for the assistant use Response API
+   * Get the temperature for the assistant
+   * @param assistant - The assistant
+   * @param model - The model
+   * @returns The temperature
+   */
+  override getTemperature(assistant: Assistant, model: Model) {
+    return isReasoningModel(model) || isOpenAIWebSearch(model) ? undefined : assistant?.settings?.temperature
+  }
+
+  /**
+   * Get the provider specific parameters for the assistant
+   * @param assistant - The assistant
+   * @param model - The model
+   * @returns The provider specific parameters
+   */
+  private getProviderSpecificParameters(assistant: Assistant, model: Model) {
+    const { maxTokens } = getAssistantSettings(assistant)
+
+    if (this.provider.id === 'openrouter') {
+      if (model.id.includes('deepseek-r1')) {
+        return {
+          include_reasoning: true
+        }
+      }
+    }
+
+    if (isOpenAIReasoningModel(model)) {
+      return {
+        max_tokens: undefined,
+        max_completion_tokens: maxTokens
+      }
+    }
+
+    return {}
+  }
+
+  /**
+   * Get the top P for the assistant
+   * @param assistant - The assistant
+   * @param model - The model
+   * @returns The top P
+   */
+  override getTopP(assistant: Assistant, model: Model) {
+    if (isReasoningModel(model) || isOpenAIWebSearch(model)) {
+      return undefined
+    }
+
+    return assistant?.settings?.topP
+  }
+
+  /**
+   * Get the reasoning effort for the assistant
+   * @param assistant - The assistant
+   * @param model - The model
+   * @returns The reasoning effort
+   */
+  private getReasoningEffort(assistant: Assistant, model: Model) {
+    if (this.provider.id === 'groq') {
+      return {}
+    }
+
+    if (!isReasoningModel(model)) {
+      return {}
+    }
+    const reasoningEffort = assistant?.settings?.reasoning_effort
+    if (!reasoningEffort) {
+      if (isSupportedThinkingTokenQwenModel(model)) {
+        return { enable_thinking: false }
+      }
+
+      if (isSupportedThinkingTokenClaudeModel(model)) {
+        return { thinking: { type: 'disabled' } }
+      }
+
+      return {}
+    }
+    const effortRatio = EFFORT_RATIO[reasoningEffort]
+    const budgetTokens = Math.floor((findTokenLimit(model.id)?.max || 0) * effortRatio)
+    // OpenRouter models
+    if (model.provider === 'openrouter') {
+      if (isSupportedReasoningEffortModel(model)) {
+        return {
+          reasoning: {
+            effort: assistant?.settings?.reasoning_effort
+          }
+        }
+      }
+
+      if (isSupportedThinkingTokenModel(model)) {
+        return {
+          reasoning: {
+            max_tokens: budgetTokens
+          }
+        }
+      }
+    }
+
+    // Qwen models
+    if (isSupportedThinkingTokenQwenModel(model)) {
+      return {
+        enable_thinking: true,
+        thinking_budget: budgetTokens
+      }
+    }
+
+    // Grok models
+    if (isSupportedReasoningEffortGrokModel(model)) {
+      return {
+        reasoning_effort: assistant?.settings?.reasoning_effort
+      }
+    }
+
+    // OpenAI models
+    if (isSupportedReasoningEffortOpenAIModel(model)) {
+      return {
+        reasoning_effort: assistant?.settings?.reasoning_effort
+      }
+    }
+
+    // Claude models
+    if (isSupportedThinkingTokenClaudeModel(model)) {
+      return {
+        thinking: {
+          type: 'enabled',
+          budget_tokens: budgetTokens
+        }
+      }
+    }
+
+    // Default case: no special thinking settings
+    return {}
+  }
+
+  public convertMcpTools<T>(mcpTools: MCPTool[]): T[] {
+    return mcpToolsToOpenAIChatTools(mcpTools) as T[]
+  }
+
+  public mcpToolCallResponseToMessage = (mcpToolResponse: MCPToolResponse, resp: MCPCallToolResponse, model: Model) => {
+    if ('toolUseId' in mcpToolResponse && mcpToolResponse.toolUseId) {
+      return mcpToolCallResponseToOpenAICompatibleMessage(mcpToolResponse, resp, isVisionModel(model))
+    } else if ('toolCallId' in mcpToolResponse && mcpToolResponse.toolCallId) {
+      const toolCallOut: ChatCompletionToolMessageParam = {
+        role: 'tool',
+        tool_call_id: mcpToolResponse.toolCallId,
+        content: JSON.stringify(resp.content)
+      }
+      return toolCallOut
+    }
+    return
+  }
+
+  /**
+   * Generate completions for the assistant
    * @param messages - The messages
    * @param assistant - The assistant
-   * @param mcpTools
+   * @param mcpTools - The MCP tools
    * @param onChunk - The onChunk callback
    * @param onFilterMessages - The onFilterMessages callback
    * @returns The completions
@@ -309,173 +360,70 @@ export abstract class BaseOpenAiProvider extends BaseProvider {
     }
     const defaultModel = getDefaultModel()
     const model = assistant.model || defaultModel
+
     const { contextCount, maxTokens, streamOutput, enableToolUse } = getAssistantSettings(assistant)
-    const isEnabledBuiltinWebSearch = assistant.enableWebSearch
-    // 退回到 OpenAI 兼容模式
-    if (isOpenAIWebSearch(model)) {
-      const systemMessage = { role: 'system', content: assistant.prompt || '' }
-      const userMessages: ChatCompletionMessageParam[] = []
-      const _messages = filterUserRoleStartMessages(
-        filterEmptyMessages(filterContextMessages(takeRight(messages, contextCount + 1)))
-      )
-      onFilterMessages(_messages)
-
-      for (const message of _messages) {
-        userMessages.push(await this.getMessageParam(message, model))
-      }
-      //当 systemMessage 内容为空时不发送 systemMessage
-      let reqMessages: ChatCompletionMessageParam[]
-      if (!systemMessage.content) {
-        reqMessages = [...userMessages]
-      } else {
-        reqMessages = [systemMessage, ...userMessages].filter(Boolean) as ChatCompletionMessageParam[]
-      }
-      const lastUserMessage = _messages.findLast((m) => m.role === 'user')
-      const { abortController, cleanup, signalPromise } = this.createAbortController(lastUserMessage?.id, true)
-      const { signal } = abortController
-      const start_time_millsec = new Date().getTime()
-      const response = await this.sdk.chat.completions
-        // @ts-ignore key is not typed
-        .create(
-          {
-            model: model.id,
-            messages: reqMessages,
-            stream: true,
-            temperature: this.getTemperature(assistant, model),
-            top_p: this.getTopP(assistant, model),
-            max_tokens: maxTokens,
-            ...getOpenAIWebSearchParams(assistant, model),
-            ...this.getCustomParameters(assistant)
-          },
-          {
-            signal
-          }
-        )
-      const processStream = async (stream: any) => {
-        let content = ''
-        let isFirstChunk = true
-        const finalUsage: Usage = {
-          completion_tokens: 0,
-          prompt_tokens: 0,
-          total_tokens: 0
-        }
-
-        const finalMetrics: Metrics = {
-          completion_tokens: 0,
-          time_completion_millsec: 0,
-          time_first_token_millsec: 0
-        }
-        for await (const chunk of stream as any) {
-          if (window.keyv.get(EVENT_NAMES.CHAT_COMPLETION_PAUSED)) {
-            break
-          }
-          const delta = chunk.choices[0]?.delta
-          const finishReason = chunk.choices[0]?.finish_reason
-          if (delta?.content) {
-            if (isOpenAIWebSearch(model)) {
-              delta.content = convertLinks(delta.content || '', isFirstChunk)
-            }
-            if (isFirstChunk) {
-              isFirstChunk = false
-              finalMetrics.time_first_token_millsec = new Date().getTime() - start_time_millsec
-            }
-            content += delta.content
-            onChunk({ type: ChunkType.TEXT_DELTA, text: delta.content })
-          }
-          if (!isEmpty(finishReason) || chunk?.annotations) {
-            onChunk({ type: ChunkType.TEXT_COMPLETE, text: content })
-            finalMetrics.time_completion_millsec = new Date().getTime() - start_time_millsec
-            if (chunk.usage) {
-              const usage = chunk.usage as OpenAI.Completions.CompletionUsage
-              finalUsage.completion_tokens = usage.completion_tokens
-              finalUsage.prompt_tokens = usage.prompt_tokens
-              finalUsage.total_tokens = usage.total_tokens
-            }
-            finalMetrics.completion_tokens = finalUsage.completion_tokens
-          }
-          if (delta?.annotations) {
-            onChunk({
-              type: ChunkType.LLM_WEB_SEARCH_COMPLETE,
-              llm_web_search: {
-                results: delta.annotations,
-                source: WebSearchSource.OPENAI_COMPATIBLE
-              }
-            })
-          }
-        }
-        onChunk({
-          type: ChunkType.BLOCK_COMPLETE,
-          response: {
-            usage: finalUsage,
-            metrics: finalMetrics
-          }
-        })
-      }
-      await processStream(response).finally(cleanup)
-      await signalPromise?.promise?.catch((error) => {
-        throw error
-      })
-      return
-    }
-    let tools: OpenAI.Responses.Tool[] = []
-    const toolChoices: OpenAI.Responses.ToolChoiceTypes = {
-      type: 'web_search_preview'
-    }
-    if (isEnabledBuiltinWebSearch) {
-      tools.push({
-        type: 'web_search_preview'
-      })
-    }
+    const isEnabledBultinWebSearch = assistant.enableWebSearch
     messages = addImageFileToContents(messages)
-    const systemMessage: OpenAI.Responses.EasyInputMessage = {
-      role: 'system',
-      content: []
-    }
-    const systemMessageContent: OpenAI.Responses.ResponseInputMessageContentList = []
-    const systemMessageInput: OpenAI.Responses.ResponseInputText = {
-      text: assistant.prompt || '',
-      type: 'input_text'
-    }
+    const enableReasoning =
+      ((isSupportedThinkingTokenModel(model) || isSupportedReasoningEffortModel(model)) &&
+        assistant.settings?.reasoning_effort !== undefined) ||
+      (isReasoningModel(model) && (!isSupportedThinkingTokenModel(model) || !isSupportedReasoningEffortModel(model)))
+    let systemMessage = { role: 'system', content: assistant.prompt || '' }
     if (isSupportedReasoningEffortOpenAIModel(model)) {
-      systemMessage.role = 'developer'
+      systemMessage = {
+        role: 'developer',
+        content: `Formatting re-enabled${systemMessage ? '\n' + systemMessage.content : ''}`
+      }
     }
-
-    const { tools: extraTools } = this.setupToolsConfig<OpenAI.Responses.Tool>({
-      mcpTools,
-      model,
-      enableToolUse
-    })
-
-    tools = tools.concat(extraTools)
+    const { tools } = this.setupToolsConfig<ChatCompletionTool>({ mcpTools, model, enableToolUse })
 
     if (this.useSystemPromptForTools) {
-      systemMessageInput.text = buildSystemPrompt(systemMessageInput.text || '', mcpTools)
+      systemMessage.content = buildSystemPrompt(systemMessage.content || '', mcpTools)
     }
-    systemMessageContent.push(systemMessageInput)
-    systemMessage.content = systemMessageContent
+
+    const userMessages: ChatCompletionMessageParam[] = []
     const _messages = filterUserRoleStartMessages(
       filterEmptyMessages(filterContextMessages(takeRight(messages, contextCount + 1)))
     )
 
     onFilterMessages(_messages)
-    const userMessage: OpenAI.Responses.ResponseInputItem[] = []
+
     for (const message of _messages) {
-      userMessage.push(await this.getReponseMessageParam(message, model))
+      userMessages.push(await this.getMessageParam(message, model))
+    }
+
+    const isSupportStreamOutput = () => {
+      return streamOutput
     }
 
     const lastUserMessage = _messages.findLast((m) => m.role === 'user')
     const { abortController, cleanup, signalPromise } = this.createAbortController(lastUserMessage?.id, true)
     const { signal } = abortController
+    await this.checkIsCopilot()
 
-    // 当 systemMessage 内容为空时不发送 systemMessage
-    let reqMessages: OpenAI.Responses.ResponseInput
-    if (!systemMessage.content) {
-      reqMessages = [...userMessage]
-    } else {
-      reqMessages = [systemMessage, ...userMessage].filter(Boolean) as OpenAI.Responses.EasyInputMessage[]
+    const lastUserMsg = userMessages.findLast((m) => m.role === 'user')
+    if (lastUserMsg && isSupportedThinkingTokenQwenModel(model)) {
+      const postsuffix = '/no_think'
+      // qwenThinkMode === true 表示思考模式啓用，此時不應添加 /no_think，如果存在則移除
+      const qwenThinkModeEnabled = assistant.settings?.qwenThinkMode === true
+      const currentContent = lastUserMsg.content // content 類型：string | ChatCompletionContentPart[] | null
+
+      lastUserMsg.content = processPostsuffixQwen3Model(
+        currentContent,
+        postsuffix,
+        qwenThinkModeEnabled
+      ) as ChatCompletionContentPart[]
     }
 
-    const finalUsage: Usage = {
+    //当 systemMessage 内容为空时不发送 systemMessage
+    let reqMessages: ChatCompletionMessageParam[]
+    if (!systemMessage.content) {
+      reqMessages = [...userMessages]
+    } else {
+      reqMessages = [systemMessage, ...userMessages].filter(Boolean) as ChatCompletionMessageParam[]
+    }
+
+    let finalUsage: Usage = {
       completion_tokens: 0,
       prompt_tokens: 0,
       total_tokens: 0
@@ -492,55 +440,61 @@ export abstract class BaseOpenAiProvider extends BaseProvider {
     const processToolResults = async (toolResults: Awaited<ReturnType<typeof parseAndCallTools>>, idx: number) => {
       if (toolResults.length === 0) return
 
-      toolResults.forEach((ts) => reqMessages.push(ts as OpenAI.Responses.EasyInputMessage))
+      toolResults.forEach((ts) => reqMessages.push(ts as ChatCompletionMessageParam))
+
+      console.debug('[tool] reqMessages before processing', model.id, reqMessages)
+      reqMessages = processReqMessages(model, reqMessages)
+      console.debug('[tool] reqMessages', model.id, reqMessages)
 
       onChunk({ type: ChunkType.LLM_RESPONSE_CREATED })
-      const stream = await this.sdk.responses.create(
-        {
-          model: model.id,
-          input: reqMessages,
-          temperature: this.getTemperature(assistant, model),
-          top_p: this.getTopP(assistant, model),
-          max_output_tokens: maxTokens,
-          stream: streamOutput,
-          tools: !isEmpty(tools) ? tools : undefined,
-          service_tier: this.getServiceTier(model),
-          ...this.getResponseReasoningEffort(assistant, model),
-          ...this.getCustomParameters(assistant)
-        },
-        {
-          signal,
-          timeout: this.getTimeout(model)
-        }
-      )
-      await processStream(stream, idx + 1)
+      const newStream = await this.sdk.chat.completions
+        // @ts-ignore key is not typed
+        .create(
+          {
+            model: model.id,
+            messages: reqMessages,
+            temperature: this.getTemperature(assistant, model),
+            top_p: this.getTopP(assistant, model),
+            max_tokens: maxTokens,
+            keep_alive: this.keepAliveTime,
+            stream: isSupportStreamOutput(),
+            tools: !isEmpty(tools) ? tools : undefined,
+            ...getOpenAIWebSearchParams(assistant, model),
+            ...this.getReasoningEffort(assistant, model),
+            ...this.getProviderSpecificParameters(assistant, model),
+            ...this.getCustomParameters(assistant)
+          },
+          {
+            signal
+          }
+        )
+      await processStream(newStream, idx + 1)
     }
 
-    const processToolCalls = async (mcpTools, toolCalls: OpenAI.Responses.ResponseFunctionToolCall[]) => {
+    const processToolCalls = async (mcpTools, toolCalls: ChatCompletionMessageToolCall[]) => {
       const mcpToolResponses = toolCalls
         .map((toolCall) => {
-          const mcpTool = openAIToolsToMcpTool(mcpTools, toolCall as OpenAI.Responses.ResponseFunctionToolCall)
+          const mcpTool = openAIToolsToMcpTool(mcpTools, toolCall as ChatCompletionMessageToolCall)
           if (!mcpTool) return undefined
 
           const parsedArgs = (() => {
             try {
-              return JSON.parse(toolCall.arguments)
+              return JSON.parse(toolCall.function.arguments)
             } catch {
-              return toolCall.arguments
+              return toolCall.function.arguments
             }
           })()
 
           return {
-            id: toolCall.call_id,
-            toolCallId: toolCall.call_id,
+            id: toolCall.id,
+            toolCallId: toolCall.id,
             tool: mcpTool,
             arguments: parsedArgs,
             status: 'pending'
           } as ToolCallResponse
         })
         .filter((t): t is ToolCallResponse => typeof t !== 'undefined')
-
-      return await parseAndCallTools<OpenAI.Responses.ResponseInputItem | ChatCompletionMessageParam>(
+      return await parseAndCallTools(
         mcpToolResponses,
         toolResponses,
         onChunk,
@@ -561,218 +515,308 @@ export abstract class BaseOpenAiProvider extends BaseProvider {
       )
     }
 
-    const processStream = async (
-      stream: Stream<OpenAI.Responses.ResponseStreamEvent> | OpenAI.Responses.Response,
-      idx: number
-    ) => {
-      const toolCalls: OpenAI.Responses.ResponseFunctionToolCall[] = []
+    const processStream = async (stream: any, idx: number) => {
+      const toolCalls: ChatCompletionMessageToolCall[] = []
       let time_first_token_millsec = 0
 
-      if (!streamOutput) {
-        const nonStream = stream as OpenAI.Responses.Response
-        const time_completion_millsec = new Date().getTime() - start_time_millsec
-        const completion_tokens =
-          (nonStream.usage?.output_tokens || 0) + (nonStream.usage?.output_tokens_details.reasoning_tokens ?? 0)
-        const total_tokens =
-          (nonStream.usage?.total_tokens || 0) + (nonStream.usage?.output_tokens_details.reasoning_tokens ?? 0)
-        const finalMetrics = {
-          completion_tokens,
-          time_completion_millsec,
-          time_first_token_millsec: 0
-        }
-        const finalUsage = {
-          completion_tokens,
-          prompt_tokens: nonStream.usage?.input_tokens || 0,
-          total_tokens
-        }
+      // Handle non-streaming case (already returns early, no change needed here)
+      if (!isSupportStreamOutput()) {
+        // Calculate final metrics once
+        finalMetrics.completion_tokens = stream.usage?.completion_tokens
+        finalMetrics.time_completion_millsec = new Date().getTime() - start_time_millsec
+
+        // Create a synthetic usage object if stream.usage is undefined
+        finalUsage = { ...stream.usage }
+        // Separate onChunk calls for text and usage/metrics
         let content = ''
-
-        for (const output of nonStream.output) {
-          switch (output.type) {
-            case 'message':
-              if (output.content[0].type === 'output_text') {
-                onChunk({ type: ChunkType.TEXT_DELTA, text: output.content[0].text })
-                onChunk({ type: ChunkType.TEXT_COMPLETE, text: output.content[0].text })
-                content += output.content[0].text
-                if (output.content[0].annotations && output.content[0].annotations.length > 0) {
-                  onChunk({
-                    type: ChunkType.LLM_WEB_SEARCH_COMPLETE,
-                    llm_web_search: {
-                      source: WebSearchSource.OPENAI,
-                      results: output.content[0].annotations
-                    }
-                  })
-                }
-              }
-              break
-            case 'reasoning':
-              onChunk({
-                type: ChunkType.THINKING_COMPLETE,
-                text: output.summary.map((s) => s.text).join('\n'),
-                thinking_millsec: new Date().getTime() - start_time_millsec
-              })
-              break
-            case 'function_call':
-              toolCalls.push(output)
+        stream.choices.forEach((choice) => {
+          // reasoning
+          if (choice.message.reasoning) {
+            onChunk({ type: ChunkType.THINKING_DELTA, text: choice.message.reasoning })
+            onChunk({
+              type: ChunkType.THINKING_COMPLETE,
+              text: choice.message.reasoning,
+              thinking_millsec: new Date().getTime() - start_time_millsec
+            })
+          }
+          // text
+          if (choice.message.content) {
+            content += choice.message.content
+            onChunk({ type: ChunkType.TEXT_DELTA, text: choice.message.content })
+          }
+          // tool call
+          if (choice.message.tool_calls && choice.message.tool_calls.length) {
+            choice.message.tool_calls.forEach((t) => toolCalls.push(t))
           }
-        }
 
-        if (content) {
           reqMessages.push({
-            role: 'assistant',
-            content: content
-          })
-        }
-        if (toolCalls.length) {
-          toolCalls.forEach((toolCall) => {
-            reqMessages.push(toolCall)
+            role: choice.message.role,
+            content: choice.message.content,
+            tool_calls: toolCalls.length
+              ? toolCalls.map((toolCall) => ({
+                  id: toolCall.id,
+                  function: {
+                    ...toolCall.function,
+                    arguments:
+                      typeof toolCall.function.arguments === 'string'
+                        ? toolCall.function.arguments
+                        : JSON.stringify(toolCall.function.arguments)
+                  },
+                  type: 'function'
+                }))
+              : undefined
           })
+        })
+
+        if (content.length) {
+          onChunk({ type: ChunkType.TEXT_COMPLETE, text: content })
         }
 
         const toolResults: Awaited<ReturnType<typeof parseAndCallTools>> = []
         if (toolCalls.length) {
           toolResults.push(...(await processToolCalls(mcpTools, toolCalls)))
         }
-        if (content.length) {
-          toolResults.push(...(await processToolUses(content)))
+        if (stream.choices[0].message?.content) {
+          toolResults.push(...(await processToolUses(stream.choices[0].message?.content)))
         }
         await processToolResults(toolResults, idx)
 
-        onChunk({
-          type: ChunkType.BLOCK_COMPLETE,
-          response: {
-            usage: finalUsage,
-            metrics: finalMetrics
-          }
-        })
+        // Always send usage and metrics data
+        onChunk({ type: ChunkType.BLOCK_COMPLETE, response: { usage: finalUsage, metrics: finalMetrics } })
         return
       }
+
       let content = ''
+      let thinkingContent = ''
+      let isFirstChunk = true
 
-      const outputItems: OpenAI.Responses.ResponseOutputItem[] = []
+      // 1. 初始化中间件
+      const reasoningTags = [
+        { openingTag: '<think>', closingTag: '</think>', separator: '\n' },
+        { openingTag: '###Thinking', closingTag: '###Response', separator: '\n' }
+      ]
+      const getAppropriateTag = (model: Model) => {
+        if (model.id.includes('qwen3')) return reasoningTags[0]
+        return reasoningTags[0]
+      }
+      const reasoningTag = getAppropriateTag(model)
+      async function* openAIChunkToTextDelta(stream: any): AsyncGenerator<OpenAIStreamChunk> {
+        for await (const chunk of stream) {
+          if (window.keyv.get(EVENT_NAMES.CHAT_COMPLETION_PAUSED)) {
+            break
+          }
 
-      for await (const chunk of stream as Stream<OpenAI.Responses.ResponseStreamEvent>) {
-        if (window.keyv.get(EVENT_NAMES.CHAT_COMPLETION_PAUSED)) {
-          break
+          const delta = chunk.choices[0]?.delta
+          if (delta?.reasoning_content || delta?.reasoning) {
+            yield { type: 'reasoning', textDelta: delta.reasoning_content || delta.reasoning }
+          }
+          if (delta?.content) {
+            yield { type: 'text-delta', textDelta: delta.content }
+          }
+          if (delta?.tool_calls) {
+            yield { type: 'tool-calls', delta: delta }
+          }
+
+          const finishReason = chunk.choices[0]?.finish_reason
+          if (!isEmpty(finishReason)) {
+            yield { type: 'finish', finishReason, usage: chunk.usage, delta, chunk }
+            break
+          }
         }
+      }
+
+      // 2. 使用中间件
+      const { stream: processedStream } = await extractReasoningMiddleware<OpenAIStreamChunk>({
+        openingTag: reasoningTag?.openingTag,
+        closingTag: reasoningTag?.closingTag,
+        separator: reasoningTag?.separator,
+        enableReasoning
+      }).wrapStream({
+        doStream: async () => ({
+          stream: asyncGeneratorToReadableStream(openAIChunkToTextDelta(stream))
+        })
+      })
+
+      // 3. 消费 processedStream，分发 onChunk
+      for await (const chunk of readableStreamAsyncIterable(processedStream)) {
+        const delta = chunk.type === 'finish' ? chunk.delta : chunk
+        const rawChunk = chunk.type === 'finish' ? chunk.chunk : chunk
+
         switch (chunk.type) {
-          case 'response.output_item.added':
+          case 'reasoning': {
             if (time_first_token_millsec === 0) {
               time_first_token_millsec = new Date().getTime()
             }
-            if (chunk.item.type === 'function_call') {
-              outputItems.push(chunk.item)
-            }
-            break
-
-          case 'response.reasoning_summary_text.delta':
+            thinkingContent += chunk.textDelta
             onChunk({
               type: ChunkType.THINKING_DELTA,
-              text: chunk.delta,
+              text: chunk.textDelta,
               thinking_millsec: new Date().getTime() - time_first_token_millsec
             })
             break
-          case 'response.reasoning_summary_text.done':
-            onChunk({
-              type: ChunkType.THINKING_COMPLETE,
-              text: chunk.text,
-              thinking_millsec: new Date().getTime() - time_first_token_millsec
-            })
-            break
-          case 'response.output_text.delta': {
-            let delta = chunk.delta
-            if (isEnabledBuiltinWebSearch) {
-              delta = convertLinks(delta)
-            }
-            onChunk({
-              type: ChunkType.TEXT_DELTA,
-              text: delta
-            })
-            content += delta
-            break
           }
-          case 'response.output_text.done':
-            onChunk({
-              type: ChunkType.TEXT_COMPLETE,
-              text: content
-            })
-            break
-          case 'response.function_call_arguments.done': {
-            const outputItem: OpenAI.Responses.ResponseOutputItem | undefined = outputItems.find(
-              (item) => item.id === chunk.item_id
-            )
-            if (outputItem) {
-              if (outputItem.type === 'function_call') {
-                toolCalls.push({
-                  ...outputItem,
-                  arguments: chunk.arguments
+          case 'text-delta': {
+            let textDelta = chunk.textDelta
+            if (assistant.enableWebSearch && delta) {
+              const originalDelta = rawChunk?.choices?.[0]?.delta
+
+              if (originalDelta?.annotations) {
+                textDelta = convertLinks(textDelta, isFirstChunk)
+              } else if (assistant.model?.provider === 'openrouter') {
+                textDelta = convertLinksToOpenRouter(textDelta, isFirstChunk)
+              } else if (isZhipuModel(assistant.model)) {
+                textDelta = convertLinksToZhipu(textDelta, isFirstChunk)
+              } else if (isHunyuanSearchModel(assistant.model)) {
+                const searchResults = rawChunk?.search_info?.search_results || []
+                textDelta = convertLinksToHunyuan(textDelta, searchResults, isFirstChunk)
+              }
+            }
+            if (isFirstChunk) {
+              isFirstChunk = false
+              if (time_first_token_millsec === 0) {
+                time_first_token_millsec = new Date().getTime()
+              } else {
+                onChunk({
+                  type: ChunkType.THINKING_COMPLETE,
+                  text: thinkingContent,
+                  thinking_millsec: new Date().getTime() - time_first_token_millsec
                 })
               }
             }
-
+            content += textDelta
+            onChunk({ type: ChunkType.TEXT_DELTA, text: textDelta })
             break
           }
-          case 'response.content_part.done':
-            if (chunk.part.type === 'output_text' && chunk.part.annotations && chunk.part.annotations.length > 0) {
-              onChunk({
-                type: ChunkType.LLM_WEB_SEARCH_COMPLETE,
-                llm_web_search: {
-                  source: WebSearchSource.OPENAI,
-                  results: chunk.part.annotations
-                }
-              })
+          case 'tool-calls': {
+            if (isFirstChunk) {
+              isFirstChunk = false
+              if (time_first_token_millsec === 0) {
+                time_first_token_millsec = new Date().getTime()
+              } else {
+                onChunk({
+                  type: ChunkType.THINKING_COMPLETE,
+                  text: thinkingContent,
+                  thinking_millsec: new Date().getTime() - time_first_token_millsec
+                })
+              }
             }
-            break
-          case 'response.completed': {
-            const completion_tokens =
-              (chunk.response.usage?.output_tokens || 0) +
-              (chunk.response.usage?.output_tokens_details.reasoning_tokens ?? 0)
-            const total_tokens =
-              (chunk.response.usage?.total_tokens || 0) +
-              (chunk.response.usage?.output_tokens_details.reasoning_tokens ?? 0)
-            finalUsage.completion_tokens += completion_tokens
-            finalUsage.prompt_tokens += chunk.response.usage?.input_tokens || 0
-            finalUsage.total_tokens += total_tokens
-            finalMetrics.completion_tokens += completion_tokens
-            finalMetrics.time_completion_millsec += new Date().getTime() - start_time_millsec
-            finalMetrics.time_first_token_millsec = time_first_token_millsec - start_time_millsec
-            break
-          }
-          case 'error':
-            onChunk({
-              type: ChunkType.ERROR,
-              error: {
-                message: chunk.message,
-                code: chunk.code
+            chunk.delta.tool_calls.forEach((toolCall) => {
+              const { id, index, type, function: fun } = toolCall
+              if (id && type === 'function' && fun) {
+                const { name, arguments: args } = fun
+                toolCalls.push({
+                  id,
+                  function: {
+                    name: name || '',
+                    arguments: args || ''
+                  },
+                  type: 'function'
+                })
+              } else if (fun?.arguments) {
+                toolCalls[index].function.arguments += fun.arguments
               }
             })
             break
+          }
+          case 'finish': {
+            const finishReason = chunk.finishReason
+            const usage = chunk.usage
+            const originalFinishDelta = chunk.delta
+            const originalFinishRawChunk = chunk.chunk
+
+            if (!isEmpty(finishReason)) {
+              onChunk({ type: ChunkType.TEXT_COMPLETE, text: content })
+              if (usage) {
+                finalUsage.completion_tokens += usage.completion_tokens || 0
+                finalUsage.prompt_tokens += usage.prompt_tokens || 0
+                finalUsage.total_tokens += usage.total_tokens || 0
+                finalMetrics.completion_tokens += usage.completion_tokens || 0
+              }
+              finalMetrics.time_completion_millsec += new Date().getTime() - start_time_millsec
+              finalMetrics.time_first_token_millsec = time_first_token_millsec - start_time_millsec
+              if (originalFinishDelta?.annotations) {
+                if (assistant.model?.provider === 'copilot') return
+
+                onChunk({
+                  type: ChunkType.LLM_WEB_SEARCH_COMPLETE,
+                  llm_web_search: {
+                    results: originalFinishDelta.annotations,
+                    source: WebSearchSource.OPENAI_RESPONSE
+                  }
+                } as LLMWebSearchCompleteChunk)
+              }
+              if (assistant.model?.provider === 'perplexity') {
+                const citations = originalFinishRawChunk.citations
+                if (citations) {
+                  onChunk({
+                    type: ChunkType.LLM_WEB_SEARCH_COMPLETE,
+                    llm_web_search: {
+                      results: citations,
+                      source: WebSearchSource.PERPLEXITY
+                    }
+                  } as LLMWebSearchCompleteChunk)
+                }
+              }
+              if (
+                isEnabledBultinWebSearch &&
+                isZhipuModel(model) &&
+                finishReason === 'stop' &&
+                originalFinishRawChunk?.web_search
+              ) {
+                onChunk({
+                  type: ChunkType.LLM_WEB_SEARCH_COMPLETE,
+                  llm_web_search: {
+                    results: originalFinishRawChunk.web_search,
+                    source: WebSearchSource.ZHIPU
+                  }
+                } as LLMWebSearchCompleteChunk)
+              }
+              if (
+                isEnabledBultinWebSearch &&
+                isHunyuanSearchModel(model) &&
+                originalFinishRawChunk?.search_info?.search_results
+              ) {
+                onChunk({
+                  type: ChunkType.LLM_WEB_SEARCH_COMPLETE,
+                  llm_web_search: {
+                    results: originalFinishRawChunk.search_info.search_results,
+                    source: WebSearchSource.HUNYUAN
+                  }
+                } as LLMWebSearchCompleteChunk)
+              }
+            }
+            break
+          }
         }
-
-        // --- End of Incremental onChunk calls ---
-      } // End of for await loop
-      if (content) {
-        reqMessages.push({
-          role: 'assistant',
-          content: content
-        })
-      }
-      if (toolCalls.length) {
-        toolCalls.forEach((toolCall) => {
-          reqMessages.push(toolCall)
-        })
       }
 
-      // Call processToolUses AFTER the loop finishes processing the main stream content
-      // Note: parseAndCallTools inside processToolUses should handle its own onChunk for tool responses
-      const toolResults: Awaited<ReturnType<typeof parseAndCallTools>> = []
+      reqMessages.push({
+        role: 'assistant',
+        content: content,
+        tool_calls: toolCalls.length
+          ? toolCalls.map((toolCall) => ({
+              id: toolCall.id,
+              function: {
+                ...toolCall.function,
+                arguments:
+                  typeof toolCall.function.arguments === 'string'
+                    ? toolCall.function.arguments
+                    : JSON.stringify(toolCall.function.arguments)
+              },
+              type: 'function'
+            }))
+          : undefined
+      })
+      let toolResults: Awaited<ReturnType<typeof parseAndCallTools>> = []
       if (toolCalls.length) {
-        toolResults.push(...(await processToolCalls(mcpTools, toolCalls)))
+        toolResults = await processToolCalls(mcpTools, toolCalls)
       }
-      if (content) {
-        toolResults.push(...(await processToolUses(content)))
+      if (content.length) {
+        toolResults = toolResults.concat(await processToolUses(content))
+      }
+      if (toolResults.length) {
+        await processToolResults(toolResults, idx)
       }
-      await processToolResults(toolResults, idx)
 
       onChunk({
         type: ChunkType.BLOCK_COMPLETE,
@@ -783,27 +827,33 @@ export abstract class BaseOpenAiProvider extends BaseProvider {
       })
     }
 
+    reqMessages = processReqMessages(model, reqMessages)
+    // 等待接口返回流
     onChunk({ type: ChunkType.LLM_RESPONSE_CREATED })
     const start_time_millsec = new Date().getTime()
-    const stream = await this.sdk.responses.create(
-      {
-        model: model.id,
-        input: reqMessages,
-        temperature: this.getTemperature(assistant, model),
-        top_p: this.getTopP(assistant, model),
-        max_output_tokens: maxTokens,
-        stream: streamOutput,
-        tools: tools.length > 0 ? tools : undefined,
-        tool_choice: isEnabledBuiltinWebSearch ? toolChoices : undefined,
-        service_tier: this.getServiceTier(model),
-        ...this.getResponseReasoningEffort(assistant, model),
-        ...this.getCustomParameters(assistant)
-      },
-      {
-        signal,
-        timeout: this.getTimeout(model)
-      }
-    )
+    const stream = await this.sdk.chat.completions
+      // @ts-ignore key is not typed
+      .create(
+        {
+          model: model.id,
+          messages: reqMessages,
+          temperature: this.getTemperature(assistant, model),
+          top_p: this.getTopP(assistant, model),
+          max_tokens: maxTokens,
+          keep_alive: this.keepAliveTime,
+          stream: isSupportStreamOutput(),
+          tools: !isEmpty(tools) ? tools : undefined,
+          service_tier: this.getServiceTier(model),
+          ...getOpenAIWebSearchParams(assistant, model),
+          ...this.getReasoningEffort(assistant, model),
+          ...this.getProviderSpecificParameters(assistant, model),
+          ...this.getCustomParameters(assistant)
+        },
+        {
+          signal,
+          timeout: this.getTimeout(model)
+        }
+      )
 
     await processStream(stream, 0).finally(cleanup)
 
@@ -814,163 +864,218 @@ export abstract class BaseOpenAiProvider extends BaseProvider {
   }
 
   /**
-   * Translate the content
-   * @param content - The content
+   * Translate a message
+   * @param content
    * @param assistant - The assistant
    * @param onResponse - The onResponse callback
-   * @returns The translated content
+   * @returns The translated message
    */
-  async translate(
-    content: string,
-    assistant: Assistant,
-    onResponse?: (text: string, isComplete: boolean) => void
-  ): Promise<string> {
+  async translate(content: string, assistant: Assistant, onResponse?: (text: string, isComplete: boolean) => void) {
     const defaultModel = getDefaultModel()
     const model = assistant.model || defaultModel
-    const messageForApi: OpenAI.Responses.EasyInputMessage[] = content
+
+    const messagesForApi = content
       ? [
-          {
-            role: 'system',
-            content: assistant.prompt
-          },
-          {
-            role: 'user',
-            content
-          }
+          { role: 'system', content: assistant.prompt },
+          { role: 'user', content }
         ]
       : [{ role: 'user', content: assistant.prompt }]
 
-    const isOpenAIReasoning = isOpenAIReasoningModel(model)
     const isSupportedStreamOutput = () => {
       if (!onResponse) {
         return false
       }
-      return !isOpenAIReasoning
+      return true
     }
 
     const stream = isSupportedStreamOutput()
-    let text = ''
-    if (stream) {
-      const response = await this.sdk.responses.create({
-        model: model.id,
-        input: messageForApi,
-        stream: true,
-        temperature: this.getTemperature(assistant, model),
-        top_p: this.getTopP(assistant, model),
-        ...this.getResponseReasoningEffort(assistant, model)
-      })
 
-      for await (const chunk of response) {
-        switch (chunk.type) {
-          case 'response.output_text.delta':
-            text += chunk.delta
-            onResponse?.(text, false)
-            break
-          case 'response.output_text.done':
-            onResponse?.(chunk.text, true)
-            break
-        }
-      }
-    } else {
-      const response = await this.sdk.responses.create({
-        model: model.id,
-        input: messageForApi,
-        stream: false,
-        temperature: this.getTemperature(assistant, model),
-        top_p: this.getTopP(assistant, model),
-        ...this.getResponseReasoningEffort(assistant, model)
-      })
-      return response.output_text
+    await this.checkIsCopilot()
+
+    // console.debug('[translate] reqMessages', model.id, message)
+    // @ts-ignore key is not typed
+    const response = await this.sdk.chat.completions.create({
+      model: model.id,
+      messages: messagesForApi as ChatCompletionMessageParam[],
+      stream,
+      keep_alive: this.keepAliveTime,
+      temperature: this.getTemperature(assistant, model),
+      top_p: this.getTopP(assistant, model),
+      ...this.getReasoningEffort(assistant, model)
+    })
+
+    if (!stream) {
+      return response.choices[0].message?.content || ''
     }
 
+    let text = ''
+    let isThinking = false
+    const isReasoning = isReasoningModel(model)
+
+    for await (const chunk of response) {
+      const deltaContent = chunk.choices[0]?.delta?.content || ''
+
+      if (isReasoning) {
+        if (deltaContent.includes('<think>')) {
+          isThinking = true
+        }
+
+        if (!isThinking) {
+          text += deltaContent
+          onResponse?.(text, false)
+        }
+
+        if (deltaContent.includes('</think>')) {
+          isThinking = false
+        }
+      } else {
+        text += deltaContent
+        onResponse?.(text, false)
+      }
+    }
+
+    onResponse?.(text, true)
+
     return text
   }
 
   /**
-   * Summarize the messages
+   * Summarize a message
    * @param messages - The messages
    * @param assistant - The assistant
    * @returns The summary
    */
   public async summaries(messages: Message[], assistant: Assistant): Promise<string> {
     const model = getTopNamingModel() || assistant.model || getDefaultModel()
+
     const userMessages = takeRight(messages, 5)
       .filter((message) => !message.isPreset)
       .map((message) => ({
         role: message.role,
         content: getMainTextContent(message)
       }))
+
     const userMessageContent = userMessages.reduce((prev, curr) => {
       const content = curr.role === 'user' ? `User: ${curr.content}` : `Assistant: ${curr.content}`
       return prev + (prev ? '\n' : '') + content
     }, '')
 
-    const systemMessage: OpenAI.Responses.EasyInputMessage = {
+    const systemMessage = {
       role: 'system',
-      content: (getStoreSetting('topicNamingPrompt') as string) || i18n.t('prompts.title')
+      content: getStoreSetting('topicNamingPrompt') || i18n.t('prompts.title')
     }
 
-    const userMessage: OpenAI.Responses.EasyInputMessage = {
+    const userMessage = {
       role: 'user',
       content: userMessageContent
     }
 
-    const response = await this.sdk.responses.create({
+    await this.checkIsCopilot()
+
+    // @ts-ignore key is not typed
+    const response = await this.sdk.chat.completions.create({
       model: model.id,
-      input: [systemMessage, userMessage],
+      messages: [systemMessage, userMessage] as ChatCompletionMessageParam[],
       stream: false,
-      max_output_tokens: 1000
+      keep_alive: this.keepAliveTime,
+      max_tokens: 1000
     })
-    return removeSpecialCharactersForTopicName(response.output_text.substring(0, 50))
+
+    // 针对思考类模型的返回，总结仅截取</think>之后的内容
+    let content = response.choices[0].message?.content || ''
+    content = content.replace(/^<think>(.*?)<\/think>/s, '')
+
+    return removeSpecialCharactersForTopicName(content.substring(0, 50))
   }
 
+  /**
+   * Summarize a message for search
+   * @param messages - The messages
+   * @param assistant - The assistant
+   * @returns The summary
+   */
   public async summaryForSearch(messages: Message[], assistant: Assistant): Promise<string | null> {
-    const model = getTopNamingModel() || assistant.model || getDefaultModel()
-    const systemMessage: OpenAI.Responses.EasyInputMessage = {
+    const model = assistant.model || getDefaultModel()
+
+    const systemMessage = {
       role: 'system',
       content: assistant.prompt
     }
+
     const messageContents = messages.map((m) => getMainTextContent(m))
     const userMessageContent = messageContents.join('\n')
-    const userMessage: OpenAI.Responses.EasyInputMessage = {
+
+    const userMessage = {
       role: 'user',
       content: userMessageContent
     }
+
     const lastUserMessage = messages[messages.length - 1]
     const { abortController, cleanup } = this.createAbortController(lastUserMessage?.id)
     const { signal } = abortController
 
-    const response = await this.sdk.responses
+    const response = await this.sdk.chat.completions
+      // @ts-ignore key is not typed
       .create(
         {
           model: model.id,
-          input: [systemMessage, userMessage],
+          messages: [systemMessage, userMessage] as ChatCompletionMessageParam[],
           stream: false,
-          max_output_tokens: 1000
+          keep_alive: this.keepAliveTime,
+          max_tokens: 1000
         },
         {
-          signal,
-          timeout: 20 * 1000
+          timeout: 20 * 1000,
+          signal: signal
         }
       )
       .finally(cleanup)
 
-    return response.output_text
+    // 针对思考类模型的返回，总结仅截取</think>之后的内容
+    let content = response.choices[0].message?.content || ''
+    content = content.replace(/^<think>(.*?)<\/think>/s, '')
+
+    return content
   }
 
   /**
-   *  Generate suggestions
+   * Generate text
+   * @param prompt - The prompt
+   * @param content - The content
+   * @returns The generated text
+   */
+  public async generateText({ prompt, content }: { prompt: string; content: string }): Promise<string> {
+    const model = getDefaultModel()
+
+    await this.checkIsCopilot()
+
+    const response = await this.sdk.chat.completions.create({
+      model: model.id,
+      stream: false,
+      messages: [
+        { role: 'system', content: prompt },
+        { role: 'user', content }
+      ]
+    })
+
+    return response.choices[0].message?.content || ''
+  }
+
+  /**
+   * Generate suggestions
    * @param messages - The messages
    * @param assistant - The assistant
    * @returns The suggestions
    */
   async suggestions(messages: Message[], assistant: Assistant): Promise<Suggestion[]> {
-    const model = assistant.model
+    const { model } = assistant
 
     if (!model) {
       return []
     }
 
+    await this.checkIsCopilot()
+
     const userMessagesForApi = messages
       .filter((m) => m.role === 'user')
       .map((m) => ({
@@ -993,63 +1098,53 @@ export abstract class BaseOpenAiProvider extends BaseProvider {
     return response?.questions?.filter(Boolean)?.map((q: any) => ({ content: q })) || []
   }
 
-  /**
-   * Generate text
-   * @param prompt - The prompt
-   * @param content - The content
-   * @returns The generated text
-   */
-  public async generateText({ prompt, content }: { prompt: string; content: string }): Promise<string> {
-    const model = getDefaultModel()
-    const response = await this.sdk.responses.create({
-      model: model.id,
-      stream: false,
-      input: [
-        { role: 'system', content: prompt },
-        { role: 'user', content }
-      ]
-    })
-    return response.output_text
-  }
-
   /**
    * Check if the model is valid
    * @param model - The model
    * @param stream - Whether to use streaming interface
    * @returns The validity of the model
    */
-  public async check(model: Model, stream: boolean): Promise<{ valid: boolean; error: Error | null }> {
+  public async check(model: Model, stream: boolean = false): Promise<{ valid: boolean; error: Error | null }> {
     if (!model) {
       return { valid: false, error: new Error('No model found') }
     }
-    if (stream) {
-      const response = await this.sdk.responses.create({
-        model: model.id,
-        input: [{ role: 'user', content: 'hi' }],
-        max_output_tokens: 1,
-        stream: true
-      })
-      let hasContent = false
-      for await (const chunk of response) {
-        if (chunk.type === 'response.output_text.delta') {
-          hasContent = true
+
+    const body = {
+      model: model.id,
+      messages: [{ role: 'user', content: 'hi' }],
+      max_completion_tokens: 1, // openAI
+      max_tokens: 1, // openAI deprecated 但大部分OpenAI兼容的提供商继续用这个头
+      enable_thinking: false, // qwen3
+      stream
+    }
+
+    try {
+      await this.checkIsCopilot()
+      if (!stream) {
+        const response = await this.sdk.chat.completions.create(body as ChatCompletionCreateParamsNonStreaming)
+        if (!response?.choices[0].message) {
+          throw new Error('Empty response')
         }
-      }
-      if (hasContent) {
         return { valid: true, error: null }
+      } else {
+        const response: any = await this.sdk.chat.completions.create(body as any)
+        // 等待整个流式响应结束
+        let hasContent = false
+        for await (const chunk of response) {
+          if (chunk.choices?.[0]?.delta?.content) {
+            hasContent = true
+          }
+        }
+        if (hasContent) {
+          return { valid: true, error: null }
+        }
+        throw new Error('Empty streaming response')
       }
-      throw new Error('Empty streaming response')
-    } else {
-      const response = await this.sdk.responses.create({
-        model: model.id,
-        input: [{ role: 'user', content: 'hi' }],
-        stream: false,
-        max_output_tokens: 1
-      })
-      if (!response.output_text) {
-        throw new Error('Empty response')
+    } catch (error: any) {
+      return {
+        valid: false,
+        error
       }
-      return { valid: true, error: null }
     }
   }
 
@@ -1059,207 +1154,67 @@ export abstract class BaseOpenAiProvider extends BaseProvider {
    */
   public async models(): Promise<OpenAI.Models.Model[]> {
     try {
+      await this.checkIsCopilot()
+
       const response = await this.sdk.models.list()
+
+      if (this.provider.id === 'github') {
+        // @ts-ignore key is not typed
+        return response.body
+          .map((model) => ({
+            id: model.name,
+            description: model.summary,
+            object: 'model',
+            owned_by: model.publisher
+          }))
+          .filter(isSupportedModel)
+      }
+
+      if (this.provider.id === 'together') {
+        // @ts-ignore key is not typed
+        return response?.body
+          .map((model: any) => ({
+            id: model.id,
+            description: model.display_name,
+            object: 'model',
+            owned_by: model.organization
+          }))
+          .filter(isSupportedModel)
+      }
+
       const models = response.data || []
       models.forEach((model) => {
         model.id = model.id.trim()
       })
+
       return models.filter(isSupportedModel)
     } catch (error) {
       return []
     }
   }
 
-  /**
-   * Generate an image
-   * @param params - The parameters
-   * @returns The generated image
-   */
-  public async generateImage({
-    model,
-    prompt,
-    negativePrompt,
-    imageSize,
-    batchSize,
-    seed,
-    numInferenceSteps,
-    guidanceScale,
-    signal,
-    promptEnhancement
-  }: GenerateImageParams): Promise<string[]> {
-    const response = (await this.sdk.request({
-      method: 'post',
-      path: '/images/generations',
-      signal,
-      body: {
-        model,
-        prompt,
-        negative_prompt: negativePrompt,
-        image_size: imageSize,
-        batch_size: batchSize,
-        seed: seed ? parseInt(seed) : undefined,
-        num_inference_steps: numInferenceSteps,
-        guidance_scale: guidanceScale,
-        prompt_enhancement: promptEnhancement
-      }
-    })) as { data: Array<{ url: string }> }
-
-    return response.data.map((item) => item.url)
-  }
-
-  public async generateImageByChat({ messages, assistant, onChunk }: CompletionsParams): Promise<void> {
-    const defaultModel = getDefaultModel()
-    const model = assistant.model || defaultModel
-    // save image data from the last assistant message
-    messages = addImageFileToContents(messages)
-    const lastUserMessage = messages.findLast((m) => m.role === 'user')
-    const lastAssistantMessage = messages.findLast((m) => m.role === 'assistant')
-    if (!lastUserMessage) {
-      return
-    }
-
-    const { abortController } = this.createAbortController(lastUserMessage?.id, true)
-    const { signal } = abortController
-    const content = getMainTextContent(lastUserMessage!)
-    let response: OpenAI.Images.ImagesResponse | null = null
-    let images: FileLike[] = []
-
-    try {
-      if (lastUserMessage) {
-        const UserFiles = findImageBlocks(lastUserMessage)
-        const validUserFiles = UserFiles.filter((f) => f.file) // Filter out files that are undefined first
-        const userImages = await Promise.all(
-          validUserFiles.map(async (f) => {
-            // f.file is guaranteed to exist here due to the filter above
-            const fileInfo = f.file!
-            const binaryData = await FileManager.readBinaryImage(fileInfo)
-            return await toFile(binaryData, fileInfo.origin_name || 'image.png', {
-              type: 'image/png'
-            })
-          })
-        )
-        images = images.concat(userImages)
-      }
-
-      if (lastAssistantMessage) {
-        const assistantFiles = findImageBlocks(lastAssistantMessage)
-        const assistantImages = await Promise.all(
-          assistantFiles.filter(Boolean).map(async (f) => {
-            const base64Data = f?.url?.replace(/^data:image\/\w+;base64,/, '')
-            if (!base64Data) return null
-            const binary = atob(base64Data)
-            const bytes = new Uint8Array(binary.length)
-            for (let i = 0; i < binary.length; i++) {
-              bytes[i] = binary.charCodeAt(i)
-            }
-            return await toFile(bytes, 'assistant_image.png', {
-              type: 'image/png'
-            })
-          })
-        )
-        images = images.concat(assistantImages.filter(Boolean) as FileLike[])
-      }
-      onChunk({
-        type: ChunkType.IMAGE_CREATED
-      })
-
-      const start_time_millsec = new Date().getTime()
-
-      if (images.length > 0) {
-        response = await this.sdk.images.edit(
-          {
-            model: model.id,
-            image: images,
-            prompt: content || ''
-          },
-          {
-            signal,
-            timeout: 300_000
-          }
-        )
-      } else {
-        response = await this.sdk.images.generate(
-          {
-            model: model.id,
-            prompt: content || '',
-            response_format: model.id.includes('gpt-image-1') ? undefined : 'b64_json'
-          },
-          {
-            signal,
-            timeout: 300_000
-          }
-        )
-      }
-
-      onChunk({
-        type: ChunkType.IMAGE_COMPLETE,
-        image: {
-          type: 'base64',
-          images: response?.data?.map((item) => `data:image/png;base64,${item.b64_json}`) || []
-        }
-      })
-
-      onChunk({
-        type: ChunkType.BLOCK_COMPLETE,
-        response: {
-          usage: {
-            completion_tokens: response.usage?.output_tokens || 0,
-            prompt_tokens: response.usage?.input_tokens || 0,
-            total_tokens: response.usage?.total_tokens || 0
-          },
-          metrics: {
-            completion_tokens: response.usage?.output_tokens || 0,
-            time_first_token_millsec: 0, // Non-streaming, first token time is not relevant
-            time_completion_millsec: new Date().getTime() - start_time_millsec
-          }
-        }
-      })
-    } catch (error: any) {
-      console.error('[generateImageByChat] error', error)
-      onChunk({
-        type: ChunkType.ERROR,
-        error
-      })
-    }
-  }
-
   /**
    * Get the embedding dimensions
    * @param model - The model
    * @returns The embedding dimensions
    */
   public async getEmbeddingDimensions(model: Model): Promise<number> {
+    await this.checkIsCopilot()
+
     const data = await this.sdk.embeddings.create({
       model: model.id,
-      input: 'hi'
+      input: model?.provider === 'baidu-cloud' ? ['hi'] : 'hi'
     })
     return data.data[0].embedding.length
   }
-}
 
-export default class OpenAIProvider extends BaseOpenAiProvider {
-  constructor(provider: Provider) {
-    super(provider)
-  }
-
-  public convertMcpTools<T>(mcpTools: MCPTool[]) {
-    return mcpToolsToOpenAIResponseTools(mcpTools) as T[]
-  }
-
-  public mcpToolCallResponseToMessage = (
-    mcpToolResponse: MCPToolResponse,
-    resp: MCPCallToolResponse,
-    model: Model
-  ): OpenAI.Responses.ResponseInputItem | undefined => {
-    if ('toolUseId' in mcpToolResponse && mcpToolResponse.toolUseId) {
-      return mcpToolCallResponseToOpenAIMessage(mcpToolResponse, resp, isVisionModel(model))
-    } else if ('toolCallId' in mcpToolResponse && mcpToolResponse.toolCallId) {
-      return {
-        type: 'function_call_output',
-        call_id: mcpToolResponse.toolCallId,
-        output: JSON.stringify(resp.content)
-      }
+  public async checkIsCopilot() {
+    if (this.provider.id !== 'copilot') {
+      return
     }
-    return
+    const defaultHeaders = store.getState().copilot.defaultHeaders
+    // copilot每次请求前需要重新获取token，因为token中附带时间戳
+    const { token } = await window.api.copilot.getToken(defaultHeaders)
+    this.sdk.apiKey = token
   }
 }
diff --git a/src/renderer/src/providers/AiProvider/OpenAIResponseProvider.ts b/src/renderer/src/providers/AiProvider/OpenAIResponseProvider.ts
new file mode 100644
index 0000000000..8ebcc475a1
--- /dev/null
+++ b/src/renderer/src/providers/AiProvider/OpenAIResponseProvider.ts
@@ -0,0 +1,1265 @@
+import {
+  getOpenAIWebSearchParams,
+  isOpenAILLMModel,
+  isOpenAIReasoningModel,
+  isOpenAIWebSearch,
+  isSupportedModel,
+  isSupportedReasoningEffortOpenAIModel,
+  isVisionModel
+} from '@renderer/config/models'
+import { getStoreSetting } from '@renderer/hooks/useSettings'
+import i18n from '@renderer/i18n'
+import { getAssistantSettings, getDefaultModel, getTopNamingModel } from '@renderer/services/AssistantService'
+import { EVENT_NAMES } from '@renderer/services/EventService'
+import FileManager from '@renderer/services/FileManager'
+import {
+  filterContextMessages,
+  filterEmptyMessages,
+  filterUserRoleStartMessages
+} from '@renderer/services/MessagesService'
+import {
+  Assistant,
+  FileTypes,
+  GenerateImageParams,
+  MCPCallToolResponse,
+  MCPTool,
+  MCPToolResponse,
+  Metrics,
+  Model,
+  Provider,
+  Suggestion,
+  ToolCallResponse,
+  Usage,
+  WebSearchSource
+} from '@renderer/types'
+import { ChunkType } from '@renderer/types/chunk'
+import { Message } from '@renderer/types/newMessage'
+import { removeSpecialCharactersForTopicName } from '@renderer/utils'
+import { addImageFileToContents } from '@renderer/utils/formats'
+import { convertLinks } from '@renderer/utils/linkConverter'
+import {
+  mcpToolCallResponseToOpenAIMessage,
+  mcpToolsToOpenAIResponseTools,
+  openAIToolsToMcpTool,
+  parseAndCallTools
+} from '@renderer/utils/mcp-tools'
+import { findFileBlocks, findImageBlocks, getMainTextContent } from '@renderer/utils/messageUtils/find'
+import { buildSystemPrompt } from '@renderer/utils/prompt'
+import { isEmpty, takeRight } from 'lodash'
+import OpenAI from 'openai'
+import { ChatCompletionContentPart, ChatCompletionMessageParam } from 'openai/resources/chat/completions'
+import { Stream } from 'openai/streaming'
+import { FileLike, toFile } from 'openai/uploads'
+
+import { CompletionsParams } from '.'
+import BaseProvider from './BaseProvider'
+
+export abstract class BaseOpenAiProvider extends BaseProvider {
+  protected sdk: OpenAI
+
+  constructor(provider: Provider) {
+    super(provider)
+
+    this.sdk = new OpenAI({
+      dangerouslyAllowBrowser: true,
+      apiKey: this.apiKey,
+      baseURL: this.getBaseURL(),
+      defaultHeaders: {
+        ...this.defaultHeaders()
+      }
+    })
+  }
+
+  abstract convertMcpTools<T>(mcpTools: MCPTool[]): T[]
+
+  abstract mcpToolCallResponseToMessage: (
+    mcpToolResponse: MCPToolResponse,
+    resp: MCPCallToolResponse,
+    model: Model
+  ) => OpenAI.Responses.ResponseInputItem | ChatCompletionMessageParam | undefined
+
+  /**
+   * Extract the file content from the message
+   * @param message - The message
+   * @returns The file content
+   */
+  protected async extractFileContent(message: Message) {
+    const fileBlocks = findFileBlocks(message)
+    if (fileBlocks.length > 0) {
+      const textFileBlocks = fileBlocks.filter(
+        (fb) => fb.file && [FileTypes.TEXT, FileTypes.DOCUMENT].includes(fb.file.type)
+      )
+
+      if (textFileBlocks.length > 0) {
+        let text = ''
+        const divider = '\n\n---\n\n'
+
+        for (const fileBlock of textFileBlocks) {
+          const file = fileBlock.file
+          const fileContent = (await window.api.file.read(file.id + file.ext)).trim()
+          const fileNameRow = 'file: ' + file.origin_name + '\n\n'
+          text = text + fileNameRow + fileContent + divider
+        }
+
+        return text
+      }
+    }
+
+    return ''
+  }
+
+  private async getReponseMessageParam(message: Message, model: Model): Promise<OpenAI.Responses.ResponseInputItem> {
+    const isVision = isVisionModel(model)
+    const content = await this.getMessageContent(message)
+    const fileBlocks = findFileBlocks(message)
+    const imageBlocks = findImageBlocks(message)
+
+    if (fileBlocks.length === 0 && imageBlocks.length === 0) {
+      if (message.role === 'assistant') {
+        return {
+          role: 'assistant',
+          content: content
+        }
+      } else {
+        return {
+          role: message.role === 'system' ? 'user' : message.role,
+          content: content ? [{ type: 'input_text', text: content }] : []
+        } as OpenAI.Responses.EasyInputMessage
+      }
+    }
+
+    const parts: OpenAI.Responses.ResponseInputContent[] = []
+    if (content) {
+      parts.push({
+        type: 'input_text',
+        text: content
+      })
+    }
+
+    for (const imageBlock of imageBlocks) {
+      if (isVision) {
+        if (imageBlock.file) {
+          const image = await window.api.file.base64Image(imageBlock.file.id + imageBlock.file.ext)
+          parts.push({
+            detail: 'auto',
+            type: 'input_image',
+            image_url: image.data as string
+          })
+        } else if (imageBlock.url && imageBlock.url.startsWith('data:')) {
+          parts.push({
+            detail: 'auto',
+            type: 'input_image',
+            image_url: imageBlock.url
+          })
+        }
+      }
+    }
+
+    for (const fileBlock of fileBlocks) {
+      const file = fileBlock.file
+      if (!file) continue
+
+      if ([FileTypes.TEXT, FileTypes.DOCUMENT].includes(file.type)) {
+        const fileContent = (await window.api.file.read(file.id + file.ext)).trim()
+        parts.push({
+          type: 'input_text',
+          text: file.origin_name + '\n' + fileContent
+        })
+      }
+    }
+
+    return {
+      role: message.role === 'system' ? 'user' : message.role,
+      content: parts
+    }
+  }
+
+  protected getServiceTier(model: Model) {
+    if ((model.id.includes('o3') && !model.id.includes('o3-mini')) || model.id.includes('o4-mini')) {
+      return 'flex'
+    }
+    if (isOpenAILLMModel(model)) {
+      return 'auto'
+    }
+    return undefined
+  }
+
+  protected getTimeout(model: Model) {
+    if ((model.id.includes('o3') && !model.id.includes('o3-mini')) || model.id.includes('o4-mini')) {
+      return 15 * 1000 * 60
+    }
+    return 5 * 1000 * 60
+  }
+
+  /**
+   * Get the temperature for the assistant
+   * @param assistant - The assistant
+   * @param model - The model
+   * @returns The temperature
+   */
+  protected getTemperature(assistant: Assistant, model: Model) {
+    return isOpenAIReasoningModel(model) || isOpenAILLMModel(model) ? undefined : assistant?.settings?.temperature
+  }
+
+  /**
+   * Get the top P for the assistant
+   * @param assistant - The assistant
+   * @param model - The model
+   * @returns The top P
+   */
+  protected getTopP(assistant: Assistant, model: Model) {
+    return isOpenAIReasoningModel(model) || isOpenAILLMModel(model) ? undefined : assistant?.settings?.topP
+  }
+
+  private getResponseReasoningEffort(assistant: Assistant, model: Model) {
+    if (!isSupportedReasoningEffortOpenAIModel(model)) {
+      return {}
+    }
+
+    const reasoningEffort = assistant?.settings?.reasoning_effort
+    if (!reasoningEffort) {
+      return {}
+    }
+
+    if (isSupportedReasoningEffortOpenAIModel(model)) {
+      return {
+        reasoning: {
+          effort: reasoningEffort as OpenAI.ReasoningEffort,
+          summary: 'detailed'
+        } as OpenAI.Reasoning
+      }
+    }
+
+    return {}
+  }
+
+  /**
+   * Get the message parameter
+   * @param message - The message
+   * @param model - The model
+   * @returns The message parameter
+   */
+  protected async getMessageParam(
+    message: Message,
+    model: Model
+  ): Promise<OpenAI.Chat.Completions.ChatCompletionMessageParam> {
+    const isVision = isVisionModel(model)
+    const content = await this.getMessageContent(message)
+    const fileBlocks = findFileBlocks(message)
+    const imageBlocks = findImageBlocks(message)
+
+    if (fileBlocks.length === 0 && imageBlocks.length === 0) {
+      return {
+        role: message.role === 'system' ? 'user' : message.role,
+        content
+      }
+    }
+
+    const parts: ChatCompletionContentPart[] = []
+
+    if (content) {
+      parts.push({ type: 'text', text: content })
+    }
+
+    for (const imageBlock of imageBlocks) {
+      if (isVision) {
+        if (imageBlock.file) {
+          const image = await window.api.file.base64Image(imageBlock.file.id + imageBlock.file.ext)
+          parts.push({ type: 'image_url', image_url: { url: image.data } })
+        } else if (imageBlock.url && imageBlock.url.startsWith('data:')) {
+          parts.push({ type: 'image_url', image_url: { url: imageBlock.url } })
+        }
+      }
+    }
+
+    for (const fileBlock of fileBlocks) {
+      const { file } = fileBlock
+      if (!file) {
+        continue
+      }
+
+      if ([FileTypes.TEXT, FileTypes.DOCUMENT].includes(file.type)) {
+        const fileContent = await (await window.api.file.read(file.id + file.ext)).trim()
+        parts.push({
+          type: 'text',
+          text: file.origin_name + '\n' + fileContent
+        })
+      }
+    }
+
+    return {
+      role: message.role === 'system' ? 'user' : message.role,
+      content: parts
+    } as ChatCompletionMessageParam
+  }
+
+  /**
+   * Generate completions for the assistant use Response API
+   * @param messages - The messages
+   * @param assistant - The assistant
+   * @param mcpTools
+   * @param onChunk - The onChunk callback
+   * @param onFilterMessages - The onFilterMessages callback
+   * @returns The completions
+   */
+  async completions({ messages, assistant, mcpTools, onChunk, onFilterMessages }: CompletionsParams): Promise<void> {
+    if (assistant.enableGenerateImage) {
+      await this.generateImageByChat({ messages, assistant, onChunk } as CompletionsParams)
+      return
+    }
+    const defaultModel = getDefaultModel()
+    const model = assistant.model || defaultModel
+    const { contextCount, maxTokens, streamOutput, enableToolUse } = getAssistantSettings(assistant)
+    const isEnabledBuiltinWebSearch = assistant.enableWebSearch
+    // 退回到 OpenAI 兼容模式
+    if (isOpenAIWebSearch(model)) {
+      const systemMessage = { role: 'system', content: assistant.prompt || '' }
+      const userMessages: ChatCompletionMessageParam[] = []
+      const _messages = filterUserRoleStartMessages(
+        filterEmptyMessages(filterContextMessages(takeRight(messages, contextCount + 1)))
+      )
+      onFilterMessages(_messages)
+
+      for (const message of _messages) {
+        userMessages.push(await this.getMessageParam(message, model))
+      }
+      //当 systemMessage 内容为空时不发送 systemMessage
+      let reqMessages: ChatCompletionMessageParam[]
+      if (!systemMessage.content) {
+        reqMessages = [...userMessages]
+      } else {
+        reqMessages = [systemMessage, ...userMessages].filter(Boolean) as ChatCompletionMessageParam[]
+      }
+      const lastUserMessage = _messages.findLast((m) => m.role === 'user')
+      const { abortController, cleanup, signalPromise } = this.createAbortController(lastUserMessage?.id, true)
+      const { signal } = abortController
+      const start_time_millsec = new Date().getTime()
+      const response = await this.sdk.chat.completions
+        // @ts-ignore key is not typed
+        .create(
+          {
+            model: model.id,
+            messages: reqMessages,
+            stream: true,
+            temperature: this.getTemperature(assistant, model),
+            top_p: this.getTopP(assistant, model),
+            max_tokens: maxTokens,
+            ...getOpenAIWebSearchParams(assistant, model),
+            ...this.getCustomParameters(assistant)
+          },
+          {
+            signal
+          }
+        )
+      const processStream = async (stream: any) => {
+        let content = ''
+        let isFirstChunk = true
+        const finalUsage: Usage = {
+          completion_tokens: 0,
+          prompt_tokens: 0,
+          total_tokens: 0
+        }
+
+        const finalMetrics: Metrics = {
+          completion_tokens: 0,
+          time_completion_millsec: 0,
+          time_first_token_millsec: 0
+        }
+        for await (const chunk of stream as any) {
+          if (window.keyv.get(EVENT_NAMES.CHAT_COMPLETION_PAUSED)) {
+            break
+          }
+          const delta = chunk.choices[0]?.delta
+          const finishReason = chunk.choices[0]?.finish_reason
+          if (delta?.content) {
+            if (isOpenAIWebSearch(model)) {
+              delta.content = convertLinks(delta.content || '', isFirstChunk)
+            }
+            if (isFirstChunk) {
+              isFirstChunk = false
+              finalMetrics.time_first_token_millsec = new Date().getTime() - start_time_millsec
+            }
+            content += delta.content
+            onChunk({ type: ChunkType.TEXT_DELTA, text: delta.content })
+          }
+          if (!isEmpty(finishReason) || chunk?.annotations) {
+            onChunk({ type: ChunkType.TEXT_COMPLETE, text: content })
+            finalMetrics.time_completion_millsec = new Date().getTime() - start_time_millsec
+            if (chunk.usage) {
+              const usage = chunk.usage as OpenAI.Completions.CompletionUsage
+              finalUsage.completion_tokens = usage.completion_tokens
+              finalUsage.prompt_tokens = usage.prompt_tokens
+              finalUsage.total_tokens = usage.total_tokens
+            }
+            finalMetrics.completion_tokens = finalUsage.completion_tokens
+          }
+          if (delta?.annotations) {
+            onChunk({
+              type: ChunkType.LLM_WEB_SEARCH_COMPLETE,
+              llm_web_search: {
+                results: delta.annotations,
+                source: WebSearchSource.OPENAI
+              }
+            })
+          }
+        }
+        onChunk({
+          type: ChunkType.BLOCK_COMPLETE,
+          response: {
+            usage: finalUsage,
+            metrics: finalMetrics
+          }
+        })
+      }
+      await processStream(response).finally(cleanup)
+      await signalPromise?.promise?.catch((error) => {
+        throw error
+      })
+      return
+    }
+    let tools: OpenAI.Responses.Tool[] = []
+    const toolChoices: OpenAI.Responses.ToolChoiceTypes = {
+      type: 'web_search_preview'
+    }
+    if (isEnabledBuiltinWebSearch) {
+      tools.push({
+        type: 'web_search_preview'
+      })
+    }
+    messages = addImageFileToContents(messages)
+    const systemMessage: OpenAI.Responses.EasyInputMessage = {
+      role: 'system',
+      content: []
+    }
+    const systemMessageContent: OpenAI.Responses.ResponseInputMessageContentList = []
+    const systemMessageInput: OpenAI.Responses.ResponseInputText = {
+      text: assistant.prompt || '',
+      type: 'input_text'
+    }
+    if (isSupportedReasoningEffortOpenAIModel(model)) {
+      systemMessage.role = 'developer'
+    }
+
+    const { tools: extraTools } = this.setupToolsConfig<OpenAI.Responses.Tool>({
+      mcpTools,
+      model,
+      enableToolUse
+    })
+
+    tools = tools.concat(extraTools)
+
+    if (this.useSystemPromptForTools) {
+      systemMessageInput.text = buildSystemPrompt(systemMessageInput.text || '', mcpTools)
+    }
+    systemMessageContent.push(systemMessageInput)
+    systemMessage.content = systemMessageContent
+    const _messages = filterUserRoleStartMessages(
+      filterEmptyMessages(filterContextMessages(takeRight(messages, contextCount + 1)))
+    )
+
+    onFilterMessages(_messages)
+    const userMessage: OpenAI.Responses.ResponseInputItem[] = []
+    for (const message of _messages) {
+      userMessage.push(await this.getReponseMessageParam(message, model))
+    }
+
+    const lastUserMessage = _messages.findLast((m) => m.role === 'user')
+    const { abortController, cleanup, signalPromise } = this.createAbortController(lastUserMessage?.id, true)
+    const { signal } = abortController
+
+    // 当 systemMessage 内容为空时不发送 systemMessage
+    let reqMessages: OpenAI.Responses.ResponseInput
+    if (!systemMessage.content) {
+      reqMessages = [...userMessage]
+    } else {
+      reqMessages = [systemMessage, ...userMessage].filter(Boolean) as OpenAI.Responses.EasyInputMessage[]
+    }
+
+    const finalUsage: Usage = {
+      completion_tokens: 0,
+      prompt_tokens: 0,
+      total_tokens: 0
+    }
+
+    const finalMetrics: Metrics = {
+      completion_tokens: 0,
+      time_completion_millsec: 0,
+      time_first_token_millsec: 0
+    }
+
+    const toolResponses: MCPToolResponse[] = []
+
+    const processToolResults = async (toolResults: Awaited<ReturnType<typeof parseAndCallTools>>, idx: number) => {
+      if (toolResults.length === 0) return
+
+      toolResults.forEach((ts) => reqMessages.push(ts as OpenAI.Responses.EasyInputMessage))
+
+      onChunk({ type: ChunkType.LLM_RESPONSE_CREATED })
+      const stream = await this.sdk.responses.create(
+        {
+          model: model.id,
+          input: reqMessages,
+          temperature: this.getTemperature(assistant, model),
+          top_p: this.getTopP(assistant, model),
+          max_output_tokens: maxTokens,
+          stream: streamOutput,
+          tools: !isEmpty(tools) ? tools : undefined,
+          service_tier: this.getServiceTier(model),
+          ...this.getResponseReasoningEffort(assistant, model),
+          ...this.getCustomParameters(assistant)
+        },
+        {
+          signal,
+          timeout: this.getTimeout(model)
+        }
+      )
+      await processStream(stream, idx + 1)
+    }
+
+    const processToolCalls = async (mcpTools, toolCalls: OpenAI.Responses.ResponseFunctionToolCall[]) => {
+      const mcpToolResponses = toolCalls
+        .map((toolCall) => {
+          const mcpTool = openAIToolsToMcpTool(mcpTools, toolCall as OpenAI.Responses.ResponseFunctionToolCall)
+          if (!mcpTool) return undefined
+
+          const parsedArgs = (() => {
+            try {
+              return JSON.parse(toolCall.arguments)
+            } catch {
+              return toolCall.arguments
+            }
+          })()
+
+          return {
+            id: toolCall.call_id,
+            toolCallId: toolCall.call_id,
+            tool: mcpTool,
+            arguments: parsedArgs,
+            status: 'pending'
+          } as ToolCallResponse
+        })
+        .filter((t): t is ToolCallResponse => typeof t !== 'undefined')
+
+      return await parseAndCallTools<OpenAI.Responses.ResponseInputItem | ChatCompletionMessageParam>(
+        mcpToolResponses,
+        toolResponses,
+        onChunk,
+        this.mcpToolCallResponseToMessage,
+        model,
+        mcpTools
+      )
+    }
+
+    const processToolUses = async (content: string) => {
+      return await parseAndCallTools(
+        content,
+        toolResponses,
+        onChunk,
+        this.mcpToolCallResponseToMessage,
+        model,
+        mcpTools
+      )
+    }
+
+    const processStream = async (
+      stream: Stream<OpenAI.Responses.ResponseStreamEvent> | OpenAI.Responses.Response,
+      idx: number
+    ) => {
+      const toolCalls: OpenAI.Responses.ResponseFunctionToolCall[] = []
+      let time_first_token_millsec = 0
+
+      if (!streamOutput) {
+        const nonStream = stream as OpenAI.Responses.Response
+        const time_completion_millsec = new Date().getTime() - start_time_millsec
+        const completion_tokens =
+          (nonStream.usage?.output_tokens || 0) + (nonStream.usage?.output_tokens_details.reasoning_tokens ?? 0)
+        const total_tokens =
+          (nonStream.usage?.total_tokens || 0) + (nonStream.usage?.output_tokens_details.reasoning_tokens ?? 0)
+        const finalMetrics = {
+          completion_tokens,
+          time_completion_millsec,
+          time_first_token_millsec: 0
+        }
+        const finalUsage = {
+          completion_tokens,
+          prompt_tokens: nonStream.usage?.input_tokens || 0,
+          total_tokens
+        }
+        let content = ''
+
+        for (const output of nonStream.output) {
+          switch (output.type) {
+            case 'message':
+              if (output.content[0].type === 'output_text') {
+                onChunk({ type: ChunkType.TEXT_DELTA, text: output.content[0].text })
+                onChunk({ type: ChunkType.TEXT_COMPLETE, text: output.content[0].text })
+                content += output.content[0].text
+                if (output.content[0].annotations && output.content[0].annotations.length > 0) {
+                  onChunk({
+                    type: ChunkType.LLM_WEB_SEARCH_COMPLETE,
+                    llm_web_search: {
+                      source: WebSearchSource.OPENAI_RESPONSE,
+                      results: output.content[0].annotations
+                    }
+                  })
+                }
+              }
+              break
+            case 'reasoning':
+              onChunk({
+                type: ChunkType.THINKING_COMPLETE,
+                text: output.summary.map((s) => s.text).join('\n'),
+                thinking_millsec: new Date().getTime() - start_time_millsec
+              })
+              break
+            case 'function_call':
+              toolCalls.push(output)
+          }
+        }
+
+        if (content) {
+          reqMessages.push({
+            role: 'assistant',
+            content: content
+          })
+        }
+        if (toolCalls.length) {
+          toolCalls.forEach((toolCall) => {
+            reqMessages.push(toolCall)
+          })
+        }
+
+        const toolResults: Awaited<ReturnType<typeof parseAndCallTools>> = []
+        if (toolCalls.length) {
+          toolResults.push(...(await processToolCalls(mcpTools, toolCalls)))
+        }
+        if (content.length) {
+          toolResults.push(...(await processToolUses(content)))
+        }
+        await processToolResults(toolResults, idx)
+
+        onChunk({
+          type: ChunkType.BLOCK_COMPLETE,
+          response: {
+            usage: finalUsage,
+            metrics: finalMetrics
+          }
+        })
+        return
+      }
+      let content = ''
+
+      const outputItems: OpenAI.Responses.ResponseOutputItem[] = []
+
+      for await (const chunk of stream as Stream<OpenAI.Responses.ResponseStreamEvent>) {
+        if (window.keyv.get(EVENT_NAMES.CHAT_COMPLETION_PAUSED)) {
+          break
+        }
+        switch (chunk.type) {
+          case 'response.output_item.added':
+            if (time_first_token_millsec === 0) {
+              time_first_token_millsec = new Date().getTime()
+            }
+            if (chunk.item.type === 'function_call') {
+              outputItems.push(chunk.item)
+            }
+            break
+
+          case 'response.reasoning_summary_text.delta':
+            onChunk({
+              type: ChunkType.THINKING_DELTA,
+              text: chunk.delta,
+              thinking_millsec: new Date().getTime() - time_first_token_millsec
+            })
+            break
+          case 'response.reasoning_summary_text.done':
+            onChunk({
+              type: ChunkType.THINKING_COMPLETE,
+              text: chunk.text,
+              thinking_millsec: new Date().getTime() - time_first_token_millsec
+            })
+            break
+          case 'response.output_text.delta': {
+            let delta = chunk.delta
+            if (isEnabledBuiltinWebSearch) {
+              delta = convertLinks(delta)
+            }
+            onChunk({
+              type: ChunkType.TEXT_DELTA,
+              text: delta
+            })
+            content += delta
+            break
+          }
+          case 'response.output_text.done':
+            onChunk({
+              type: ChunkType.TEXT_COMPLETE,
+              text: content
+            })
+            break
+          case 'response.function_call_arguments.done': {
+            const outputItem: OpenAI.Responses.ResponseOutputItem | undefined = outputItems.find(
+              (item) => item.id === chunk.item_id
+            )
+            if (outputItem) {
+              if (outputItem.type === 'function_call') {
+                toolCalls.push({
+                  ...outputItem,
+                  arguments: chunk.arguments
+                })
+              }
+            }
+
+            break
+          }
+          case 'response.content_part.done':
+            if (chunk.part.type === 'output_text' && chunk.part.annotations && chunk.part.annotations.length > 0) {
+              onChunk({
+                type: ChunkType.LLM_WEB_SEARCH_COMPLETE,
+                llm_web_search: {
+                  source: WebSearchSource.OPENAI,
+                  results: chunk.part.annotations
+                }
+              })
+            }
+            break
+          case 'response.completed': {
+            const completion_tokens =
+              (chunk.response.usage?.output_tokens || 0) +
+              (chunk.response.usage?.output_tokens_details.reasoning_tokens ?? 0)
+            const total_tokens =
+              (chunk.response.usage?.total_tokens || 0) +
+              (chunk.response.usage?.output_tokens_details.reasoning_tokens ?? 0)
+            finalUsage.completion_tokens += completion_tokens
+            finalUsage.prompt_tokens += chunk.response.usage?.input_tokens || 0
+            finalUsage.total_tokens += total_tokens
+            finalMetrics.completion_tokens += completion_tokens
+            finalMetrics.time_completion_millsec += new Date().getTime() - start_time_millsec
+            finalMetrics.time_first_token_millsec = time_first_token_millsec - start_time_millsec
+            break
+          }
+          case 'error':
+            onChunk({
+              type: ChunkType.ERROR,
+              error: {
+                message: chunk.message,
+                code: chunk.code
+              }
+            })
+            break
+        }
+
+        // --- End of Incremental onChunk calls ---
+      } // End of for await loop
+      if (content) {
+        reqMessages.push({
+          role: 'assistant',
+          content: content
+        })
+      }
+      if (toolCalls.length) {
+        toolCalls.forEach((toolCall) => {
+          reqMessages.push(toolCall)
+        })
+      }
+
+      // Call processToolUses AFTER the loop finishes processing the main stream content
+      // Note: parseAndCallTools inside processToolUses should handle its own onChunk for tool responses
+      const toolResults: Awaited<ReturnType<typeof parseAndCallTools>> = []
+      if (toolCalls.length) {
+        toolResults.push(...(await processToolCalls(mcpTools, toolCalls)))
+      }
+      if (content) {
+        toolResults.push(...(await processToolUses(content)))
+      }
+      await processToolResults(toolResults, idx)
+
+      onChunk({
+        type: ChunkType.BLOCK_COMPLETE,
+        response: {
+          usage: finalUsage,
+          metrics: finalMetrics
+        }
+      })
+    }
+
+    onChunk({ type: ChunkType.LLM_RESPONSE_CREATED })
+    const start_time_millsec = new Date().getTime()
+    const stream = await this.sdk.responses.create(
+      {
+        model: model.id,
+        input: reqMessages,
+        temperature: this.getTemperature(assistant, model),
+        top_p: this.getTopP(assistant, model),
+        max_output_tokens: maxTokens,
+        stream: streamOutput,
+        tools: tools.length > 0 ? tools : undefined,
+        tool_choice: isEnabledBuiltinWebSearch ? toolChoices : undefined,
+        service_tier: this.getServiceTier(model),
+        ...this.getResponseReasoningEffort(assistant, model),
+        ...this.getCustomParameters(assistant)
+      },
+      {
+        signal,
+        timeout: this.getTimeout(model)
+      }
+    )
+
+    await processStream(stream, 0).finally(cleanup)
+
+    // 捕获signal的错误
+    await signalPromise?.promise?.catch((error) => {
+      throw error
+    })
+  }
+
+  /**
+   * Translate the content
+   * @param content - The content
+   * @param assistant - The assistant
+   * @param onResponse - The onResponse callback
+   * @returns The translated content
+   */
+  async translate(
+    content: string,
+    assistant: Assistant,
+    onResponse?: (text: string, isComplete: boolean) => void
+  ): Promise<string> {
+    const defaultModel = getDefaultModel()
+    const model = assistant.model || defaultModel
+    const messageForApi: OpenAI.Responses.EasyInputMessage[] = content
+      ? [
+          {
+            role: 'system',
+            content: assistant.prompt
+          },
+          {
+            role: 'user',
+            content
+          }
+        ]
+      : [{ role: 'user', content: assistant.prompt }]
+
+    const isOpenAIReasoning = isOpenAIReasoningModel(model)
+    const isSupportedStreamOutput = () => {
+      if (!onResponse) {
+        return false
+      }
+      return !isOpenAIReasoning
+    }
+
+    const stream = isSupportedStreamOutput()
+    let text = ''
+    if (stream) {
+      const response = await this.sdk.responses.create({
+        model: model.id,
+        input: messageForApi,
+        stream: true,
+        temperature: this.getTemperature(assistant, model),
+        top_p: this.getTopP(assistant, model),
+        ...this.getResponseReasoningEffort(assistant, model)
+      })
+
+      for await (const chunk of response) {
+        switch (chunk.type) {
+          case 'response.output_text.delta':
+            text += chunk.delta
+            onResponse?.(text, false)
+            break
+          case 'response.output_text.done':
+            onResponse?.(chunk.text, true)
+            break
+        }
+      }
+    } else {
+      const response = await this.sdk.responses.create({
+        model: model.id,
+        input: messageForApi,
+        stream: false,
+        temperature: this.getTemperature(assistant, model),
+        top_p: this.getTopP(assistant, model),
+        ...this.getResponseReasoningEffort(assistant, model)
+      })
+      return response.output_text
+    }
+
+    return text
+  }
+
+  /**
+   * Summarize the messages
+   * @param messages - The messages
+   * @param assistant - The assistant
+   * @returns The summary
+   */
+  public async summaries(messages: Message[], assistant: Assistant): Promise<string> {
+    const model = getTopNamingModel() || assistant.model || getDefaultModel()
+    const userMessages = takeRight(messages, 5)
+      .filter((message) => !message.isPreset)
+      .map((message) => ({
+        role: message.role,
+        content: getMainTextContent(message)
+      }))
+    const userMessageContent = userMessages.reduce((prev, curr) => {
+      const content = curr.role === 'user' ? `User: ${curr.content}` : `Assistant: ${curr.content}`
+      return prev + (prev ? '\n' : '') + content
+    }, '')
+
+    const systemMessage: OpenAI.Responses.EasyInputMessage = {
+      role: 'system',
+      content: (getStoreSetting('topicNamingPrompt') as string) || i18n.t('prompts.title')
+    }
+
+    const userMessage: OpenAI.Responses.EasyInputMessage = {
+      role: 'user',
+      content: userMessageContent
+    }
+
+    const response = await this.sdk.responses.create({
+      model: model.id,
+      input: [systemMessage, userMessage],
+      stream: false,
+      max_output_tokens: 1000
+    })
+    return removeSpecialCharactersForTopicName(response.output_text.substring(0, 50))
+  }
+
+  public async summaryForSearch(messages: Message[], assistant: Assistant): Promise<string | null> {
+    const model = getTopNamingModel() || assistant.model || getDefaultModel()
+    const systemMessage: OpenAI.Responses.EasyInputMessage = {
+      role: 'system',
+      content: assistant.prompt
+    }
+    const messageContents = messages.map((m) => getMainTextContent(m))
+    const userMessageContent = messageContents.join('\n')
+    const userMessage: OpenAI.Responses.EasyInputMessage = {
+      role: 'user',
+      content: userMessageContent
+    }
+    const lastUserMessage = messages[messages.length - 1]
+    const { abortController, cleanup } = this.createAbortController(lastUserMessage?.id)
+    const { signal } = abortController
+
+    const response = await this.sdk.responses
+      .create(
+        {
+          model: model.id,
+          input: [systemMessage, userMessage],
+          stream: false,
+          max_output_tokens: 1000
+        },
+        {
+          signal,
+          timeout: 20 * 1000
+        }
+      )
+      .finally(cleanup)
+
+    return response.output_text
+  }
+
+  /**
+   *  Generate suggestions
+   * @param messages - The messages
+   * @param assistant - The assistant
+   * @returns The suggestions
+   */
+  async suggestions(messages: Message[], assistant: Assistant): Promise<Suggestion[]> {
+    const model = assistant.model
+
+    if (!model) {
+      return []
+    }
+
+    const userMessagesForApi = messages
+      .filter((m) => m.role === 'user')
+      .map((m) => ({
+        role: m.role,
+        content: getMainTextContent(m)
+      }))
+
+    const response: any = await this.sdk.request({
+      method: 'post',
+      path: '/advice_questions',
+      body: {
+        messages: userMessagesForApi,
+        model: model.id,
+        max_tokens: 0,
+        temperature: 0,
+        n: 0
+      }
+    })
+
+    return response?.questions?.filter(Boolean)?.map((q: any) => ({ content: q })) || []
+  }
+
+  /**
+   * Generate text
+   * @param prompt - The prompt
+   * @param content - The content
+   * @returns The generated text
+   */
+  public async generateText({ prompt, content }: { prompt: string; content: string }): Promise<string> {
+    const model = getDefaultModel()
+    const response = await this.sdk.responses.create({
+      model: model.id,
+      stream: false,
+      input: [
+        { role: 'system', content: prompt },
+        { role: 'user', content }
+      ]
+    })
+    return response.output_text
+  }
+
+  /**
+   * Check if the model is valid
+   * @param model - The model
+   * @param stream - Whether to use streaming interface
+   * @returns The validity of the model
+   */
+  public async check(model: Model, stream: boolean): Promise<{ valid: boolean; error: Error | null }> {
+    if (!model) {
+      return { valid: false, error: new Error('No model found') }
+    }
+    if (stream) {
+      const response = await this.sdk.responses.create({
+        model: model.id,
+        input: [{ role: 'user', content: 'hi' }],
+        max_output_tokens: 1,
+        stream: true
+      })
+      let hasContent = false
+      for await (const chunk of response) {
+        if (chunk.type === 'response.output_text.delta') {
+          hasContent = true
+        }
+      }
+      if (hasContent) {
+        return { valid: true, error: null }
+      }
+      throw new Error('Empty streaming response')
+    } else {
+      const response = await this.sdk.responses.create({
+        model: model.id,
+        input: [{ role: 'user', content: 'hi' }],
+        max_output_tokens: 1,
+        stream: false
+      })
+      if (!response.output_text) {
+        throw new Error('Empty response')
+      }
+      return { valid: true, error: null }
+    }
+  }
+
+  /**
+   * Get the models
+   * @returns The models
+   */
+  public async models(): Promise<OpenAI.Models.Model[]> {
+    try {
+      const response = await this.sdk.models.list()
+      const models = response.data || []
+      models.forEach((model) => {
+        model.id = model.id.trim()
+      })
+      return models.filter(isSupportedModel)
+    } catch (error) {
+      return []
+    }
+  }
+
+  /**
+   * Generate an image
+   * @param params - The parameters
+   * @returns The generated image
+   */
+  public async generateImage({
+    model,
+    prompt,
+    negativePrompt,
+    imageSize,
+    batchSize,
+    seed,
+    numInferenceSteps,
+    guidanceScale,
+    signal,
+    promptEnhancement
+  }: GenerateImageParams): Promise<string[]> {
+    const response = (await this.sdk.request({
+      method: 'post',
+      path: '/images/generations',
+      signal,
+      body: {
+        model,
+        prompt,
+        negative_prompt: negativePrompt,
+        image_size: imageSize,
+        batch_size: batchSize,
+        seed: seed ? parseInt(seed) : undefined,
+        num_inference_steps: numInferenceSteps,
+        guidance_scale: guidanceScale,
+        prompt_enhancement: promptEnhancement
+      }
+    })) as { data: Array<{ url: string }> }
+
+    return response.data.map((item) => item.url)
+  }
+
+  public async generateImageByChat({ messages, assistant, onChunk }: CompletionsParams): Promise<void> {
+    const defaultModel = getDefaultModel()
+    const model = assistant.model || defaultModel
+    // save image data from the last assistant message
+    messages = addImageFileToContents(messages)
+    const lastUserMessage = messages.findLast((m) => m.role === 'user')
+    const lastAssistantMessage = messages.findLast((m) => m.role === 'assistant')
+    if (!lastUserMessage) {
+      return
+    }
+
+    const { abortController } = this.createAbortController(lastUserMessage?.id, true)
+    const { signal } = abortController
+    const content = getMainTextContent(lastUserMessage!)
+    let response: OpenAI.Images.ImagesResponse | null = null
+    let images: FileLike[] = []
+
+    try {
+      if (lastUserMessage) {
+        const UserFiles = findImageBlocks(lastUserMessage)
+        const validUserFiles = UserFiles.filter((f) => f.file) // Filter out files that are undefined first
+        const userImages = await Promise.all(
+          validUserFiles.map(async (f) => {
+            // f.file is guaranteed to exist here due to the filter above
+            const fileInfo = f.file!
+            const binaryData = await FileManager.readBinaryImage(fileInfo)
+            return await toFile(binaryData, fileInfo.origin_name || 'image.png', {
+              type: 'image/png'
+            })
+          })
+        )
+        images = images.concat(userImages)
+      }
+
+      if (lastAssistantMessage) {
+        const assistantFiles = findImageBlocks(lastAssistantMessage)
+        const assistantImages = await Promise.all(
+          assistantFiles.filter(Boolean).map(async (f) => {
+            const base64Data = f?.url?.replace(/^data:image\/\w+;base64,/, '')
+            if (!base64Data) return null
+            const binary = atob(base64Data)
+            const bytes = new Uint8Array(binary.length)
+            for (let i = 0; i < binary.length; i++) {
+              bytes[i] = binary.charCodeAt(i)
+            }
+            return await toFile(bytes, 'assistant_image.png', {
+              type: 'image/png'
+            })
+          })
+        )
+        images = images.concat(assistantImages.filter(Boolean) as FileLike[])
+      }
+      onChunk({
+        type: ChunkType.IMAGE_CREATED
+      })
+
+      const start_time_millsec = new Date().getTime()
+
+      if (images.length > 0) {
+        response = await this.sdk.images.edit(
+          {
+            model: model.id,
+            image: images,
+            prompt: content || ''
+          },
+          {
+            signal,
+            timeout: 300_000
+          }
+        )
+      } else {
+        response = await this.sdk.images.generate(
+          {
+            model: model.id,
+            prompt: content || '',
+            response_format: model.id.includes('gpt-image-1') ? undefined : 'b64_json'
+          },
+          {
+            signal,
+            timeout: 300_000
+          }
+        )
+      }
+
+      onChunk({
+        type: ChunkType.IMAGE_COMPLETE,
+        image: {
+          type: 'base64',
+          images: response?.data?.map((item) => `data:image/png;base64,${item.b64_json}`) || []
+        }
+      })
+
+      onChunk({
+        type: ChunkType.BLOCK_COMPLETE,
+        response: {
+          usage: {
+            completion_tokens: response.usage?.output_tokens || 0,
+            prompt_tokens: response.usage?.input_tokens || 0,
+            total_tokens: response.usage?.total_tokens || 0
+          },
+          metrics: {
+            completion_tokens: response.usage?.output_tokens || 0,
+            time_first_token_millsec: 0, // Non-streaming, first token time is not relevant
+            time_completion_millsec: new Date().getTime() - start_time_millsec
+          }
+        }
+      })
+    } catch (error: any) {
+      console.error('[generateImageByChat] error', error)
+      onChunk({
+        type: ChunkType.ERROR,
+        error
+      })
+    }
+  }
+
+  /**
+   * Get the embedding dimensions
+   * @param model - The model
+   * @returns The embedding dimensions
+   */
+  public async getEmbeddingDimensions(model: Model): Promise<number> {
+    const data = await this.sdk.embeddings.create({
+      model: model.id,
+      input: 'hi'
+    })
+    return data.data[0].embedding.length
+  }
+}
+
+export default class OpenAIResponseProvider extends BaseOpenAiProvider {
+  constructor(provider: Provider) {
+    super(provider)
+  }
+
+  public convertMcpTools<T>(mcpTools: MCPTool[]) {
+    return mcpToolsToOpenAIResponseTools(mcpTools) as T[]
+  }
+
+  public mcpToolCallResponseToMessage = (
+    mcpToolResponse: MCPToolResponse,
+    resp: MCPCallToolResponse,
+    model: Model
+  ): OpenAI.Responses.ResponseInputItem | undefined => {
+    if ('toolUseId' in mcpToolResponse && mcpToolResponse.toolUseId) {
+      return mcpToolCallResponseToOpenAIMessage(mcpToolResponse, resp, isVisionModel(model))
+    } else if ('toolCallId' in mcpToolResponse && mcpToolResponse.toolCallId) {
+      return {
+        type: 'function_call_output',
+        call_id: mcpToolResponse.toolCallId,
+        output: JSON.stringify(resp.content)
+      }
+    }
+    return
+  }
+}
diff --git a/src/renderer/src/providers/AiProvider/ProviderFactory.ts b/src/renderer/src/providers/AiProvider/ProviderFactory.ts
index 6d3c10468e..d8c1f40e6f 100644
--- a/src/renderer/src/providers/AiProvider/ProviderFactory.ts
+++ b/src/renderer/src/providers/AiProvider/ProviderFactory.ts
@@ -4,25 +4,26 @@ import AihubmixProvider from './AihubmixProvider'
 import AnthropicProvider from './AnthropicProvider'
 import BaseProvider from './BaseProvider'
 import GeminiProvider from './GeminiProvider'
-import OpenAICompatibleProvider from './OpenAICompatibleProvider'
 import OpenAIProvider from './OpenAIProvider'
+import OpenAIResponseProvider from './OpenAIResponseProvider'
 
 export default class ProviderFactory {
   static create(provider: Provider): BaseProvider {
+    if (provider.id === 'aihubmix') {
+      return new AihubmixProvider(provider)
+    }
+
     switch (provider.type) {
       case 'openai':
         return new OpenAIProvider(provider)
-      case 'openai-compatible':
-        if (provider.id === 'aihubmix') {
-          return new AihubmixProvider(provider)
-        }
-        return new OpenAICompatibleProvider(provider)
+      case 'openai-response':
+        return new OpenAIResponseProvider(provider)
       case 'anthropic':
         return new AnthropicProvider(provider)
       case 'gemini':
         return new GeminiProvider(provider)
       default:
-        return new OpenAICompatibleProvider(provider)
+        return new OpenAIProvider(provider)
     }
   }
 }
diff --git a/src/renderer/src/store/index.ts b/src/renderer/src/store/index.ts
index df7af60f69..abfc334986 100644
--- a/src/renderer/src/store/index.ts
+++ b/src/renderer/src/store/index.ts
@@ -46,7 +46,7 @@ const persistedReducer = persistReducer(
   {
     key: 'cherry-studio',
     storage,
-    version: 99,
+    version: 100,
     blacklist: ['runtime', 'messages', 'messageBlocks'],
     migrate
   },
diff --git a/src/renderer/src/store/llm.ts b/src/renderer/src/store/llm.ts
index 27a68b342b..8bb70599b0 100644
--- a/src/renderer/src/store/llm.ts
+++ b/src/renderer/src/store/llm.ts
@@ -28,7 +28,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'silicon',
     name: 'Silicon',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://api.siliconflow.cn',
     models: SYSTEM_MODELS.silicon,
@@ -38,7 +38,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'aihubmix',
     name: 'AiHubMix',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://aihubmix.com',
     models: SYSTEM_MODELS.aihubmix,
@@ -48,7 +48,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'ocoolai',
     name: 'ocoolAI',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://api.ocoolai.com',
     models: SYSTEM_MODELS.ocoolai,
@@ -58,7 +58,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'deepseek',
     name: 'deepseek',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://api.deepseek.com',
     models: SYSTEM_MODELS.deepseek,
@@ -68,7 +68,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'openrouter',
     name: 'OpenRouter',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://openrouter.ai/api/v1/',
     models: SYSTEM_MODELS.openrouter,
@@ -78,7 +78,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'ppio',
     name: 'PPIO',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://api.ppinfra.com/v3/openai',
     models: SYSTEM_MODELS.ppio,
@@ -88,7 +88,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'alayanew',
     name: 'AlayaNew',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://deepseek.alayanew.com',
     models: SYSTEM_MODELS.alayanew,
@@ -98,7 +98,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'infini',
     name: 'Infini',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://cloud.infini-ai.com/maas',
     models: SYSTEM_MODELS.infini,
@@ -108,7 +108,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'qiniu',
     name: 'Qiniu',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://api.qnaigc.com',
     models: SYSTEM_MODELS.qiniu,
@@ -118,7 +118,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'dmxapi',
     name: 'DMXAPI',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://www.dmxapi.cn',
     models: SYSTEM_MODELS.dmxapi,
@@ -128,7 +128,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'o3',
     name: 'O3',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://api.o3.fan',
     models: SYSTEM_MODELS.o3,
@@ -138,7 +138,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'ollama',
     name: 'Ollama',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'http://localhost:11434',
     models: SYSTEM_MODELS.ollama,
@@ -148,7 +148,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'lmstudio',
     name: 'LM Studio',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'http://localhost:1234',
     models: SYSTEM_MODELS.lmstudio,
@@ -168,7 +168,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'openai',
     name: 'OpenAI',
-    type: 'openai',
+    type: 'openai-response',
     apiKey: '',
     apiHost: 'https://api.openai.com',
     models: SYSTEM_MODELS.openai,
@@ -178,7 +178,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'azure-openai',
     name: 'Azure OpenAI',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: '',
     apiVersion: '',
@@ -199,7 +199,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'zhipu',
     name: 'ZhiPu',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://open.bigmodel.cn/api/paas/v4/',
     models: SYSTEM_MODELS.zhipu,
@@ -209,7 +209,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'github',
     name: 'Github Models',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://models.inference.ai.azure.com/',
     models: SYSTEM_MODELS.github,
@@ -219,7 +219,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'copilot',
     name: 'Github Copilot',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://api.githubcopilot.com/',
     models: SYSTEM_MODELS.copilot,
@@ -230,7 +230,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'yi',
     name: 'Yi',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://api.lingyiwanwu.com',
     models: SYSTEM_MODELS.yi,
@@ -240,7 +240,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'moonshot',
     name: 'Moonshot AI',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://api.moonshot.cn',
     models: SYSTEM_MODELS.moonshot,
@@ -250,7 +250,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'baichuan',
     name: 'BAICHUAN AI',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://api.baichuan-ai.com',
     models: SYSTEM_MODELS.baichuan,
@@ -260,7 +260,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'dashscope',
     name: 'Bailian',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://dashscope.aliyuncs.com/compatible-mode/v1/',
     models: SYSTEM_MODELS.bailian,
@@ -270,7 +270,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'stepfun',
     name: 'StepFun',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://api.stepfun.com',
     models: SYSTEM_MODELS.stepfun,
@@ -280,7 +280,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'doubao',
     name: 'doubao',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://ark.cn-beijing.volces.com/api/v3/',
     models: SYSTEM_MODELS.doubao,
@@ -290,7 +290,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'minimax',
     name: 'MiniMax',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://api.minimax.chat/v1/',
     models: SYSTEM_MODELS.minimax,
@@ -300,7 +300,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'groq',
     name: 'Groq',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://api.groq.com/openai',
     models: SYSTEM_MODELS.groq,
@@ -310,7 +310,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'together',
     name: 'Together',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://api.together.xyz',
     models: SYSTEM_MODELS.together,
@@ -320,7 +320,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'fireworks',
     name: 'Fireworks',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://api.fireworks.ai/inference',
     models: SYSTEM_MODELS.fireworks,
@@ -330,7 +330,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'zhinao',
     name: 'zhinao',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://api.360.cn',
     models: SYSTEM_MODELS.zhinao,
@@ -340,7 +340,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'hunyuan',
     name: 'hunyuan',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://api.hunyuan.cloud.tencent.com',
     models: SYSTEM_MODELS.hunyuan,
@@ -350,7 +350,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'nvidia',
     name: 'nvidia',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://integrate.api.nvidia.com',
     models: SYSTEM_MODELS.nvidia,
@@ -360,7 +360,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'grok',
     name: 'Grok',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://api.x.ai',
     models: SYSTEM_MODELS.grok,
@@ -370,7 +370,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'hyperbolic',
     name: 'Hyperbolic',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://api.hyperbolic.xyz',
     models: SYSTEM_MODELS.hyperbolic,
@@ -380,7 +380,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'mistral',
     name: 'Mistral',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://api.mistral.ai',
     models: SYSTEM_MODELS.mistral,
@@ -390,7 +390,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'jina',
     name: 'Jina',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://api.jina.ai',
     models: SYSTEM_MODELS.jina,
@@ -400,7 +400,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'gitee-ai',
     name: 'gitee ai',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://ai.gitee.com',
     models: SYSTEM_MODELS['gitee-ai'],
@@ -410,7 +410,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'perplexity',
     name: 'Perplexity',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://api.perplexity.ai/',
     models: SYSTEM_MODELS.perplexity,
@@ -420,7 +420,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'modelscope',
     name: 'ModelScope',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://api-inference.modelscope.cn/v1/',
     models: SYSTEM_MODELS.modelscope,
@@ -430,7 +430,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'xirang',
     name: 'Xirang',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://wishub-x1.ctyun.cn',
     models: SYSTEM_MODELS.xirang,
@@ -440,7 +440,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'tencent-cloud-ti',
     name: 'Tencent Cloud TI',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://api.lkeap.cloud.tencent.com',
     models: SYSTEM_MODELS['tencent-cloud-ti'],
@@ -450,7 +450,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'baidu-cloud',
     name: 'Baidu Cloud',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://qianfan.baidubce.com/v2/',
     models: SYSTEM_MODELS['baidu-cloud'],
@@ -460,7 +460,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'gpustack',
     name: 'GPUStack',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: '',
     models: SYSTEM_MODELS.gpustack,
@@ -470,7 +470,7 @@ export const INITIAL_PROVIDERS: Provider[] = [
   {
     id: 'voyageai',
     name: 'VoyageAI',
-    type: 'openai-compatible',
+    type: 'openai',
     apiKey: '',
     apiHost: 'https://api.voyageai.com',
     models: SYSTEM_MODELS.voyageai,
diff --git a/src/renderer/src/store/messageBlock.ts b/src/renderer/src/store/messageBlock.ts
index 33c00200da..2a4ac9845c 100644
--- a/src/renderer/src/store/messageBlock.ts
+++ b/src/renderer/src/store/messageBlock.ts
@@ -101,7 +101,7 @@ const formatCitationsFromBlock = (block: CitationMessageBlock | undefined): Cita
           })) || []
         break
       }
-      case WebSearchSource.OPENAI:
+      case WebSearchSource.OPENAI_RESPONSE:
         formattedCitations =
           (block.response.results as OpenAI.Responses.ResponseOutputText.URLCitation[])?.map((result, index) => {
             let hostname: string | undefined
@@ -120,7 +120,7 @@ const formatCitationsFromBlock = (block: CitationMessageBlock | undefined): Cita
             }
           }) || []
         break
-      case WebSearchSource.OPENAI_COMPATIBLE:
+      case WebSearchSource.OPENAI:
         formattedCitations =
           (block.response.results as OpenAI.Chat.Completions.ChatCompletionMessage.Annotation[])?.map((url, index) => {
             const urlCitation = url.url_citation
diff --git a/src/renderer/src/store/migrate.ts b/src/renderer/src/store/migrate.ts
index ab852b18f6..e88cac33ef 100644
--- a/src/renderer/src/store/migrate.ts
+++ b/src/renderer/src/store/migrate.ts
@@ -1257,6 +1257,7 @@ const migrateConfig = {
     try {
       state.llm.providers.forEach((provider) => {
         if (provider.type === 'openai' && provider.id !== 'openai') {
+          // @ts-ignore eslint-disable-next-line
           provider.type = 'openai-compatible'
         }
       })
@@ -1296,6 +1297,22 @@ const migrateConfig = {
     } catch (error) {
       return state
     }
+  },
+  '100': (state: RootState) => {
+    try {
+      state.llm.providers.forEach((provider) => {
+        // @ts-ignore eslint-disable-next-line
+        if (['openai-compatible', 'openai'].includes(provider.type)) {
+          provider.type = 'openai'
+        }
+        if (provider.id === 'openai') {
+          provider.type = 'openai-response'
+        }
+      })
+      return state
+    } catch (error) {
+      return state
+    }
   }
 }
 
diff --git a/src/renderer/src/types/index.ts b/src/renderer/src/types/index.ts
index 0873fc0a99..e66e629043 100644
--- a/src/renderer/src/types/index.ts
+++ b/src/renderer/src/types/index.ts
@@ -162,7 +162,7 @@ export type Provider = {
   notes?: string
 }
 
-export type ProviderType = 'openai' | 'openai-compatible' | 'anthropic' | 'gemini' | 'qwenlm' | 'azure-openai'
+export type ProviderType = 'openai' | 'openai-response' | 'anthropic' | 'gemini' | 'qwenlm' | 'azure-openai'
 
 export type ModelType = 'text' | 'vision' | 'embedding' | 'reasoning' | 'function_calling' | 'web_search'
 
@@ -462,7 +462,7 @@ export type WebSearchResults =
 export enum WebSearchSource {
   WEBSEARCH = 'websearch',
   OPENAI = 'openai',
-  OPENAI_COMPATIBLE = 'openai-compatible',
+  OPENAI_RESPONSE = 'openai-response',
   OPENROUTER = 'openrouter',
   ANTHROPIC = 'anthropic',
   GEMINI = 'gemini',

From f414b1881c7556fdaa071732ba505a967d0867f0 Mon Sep 17 00:00:00 2001
From: kangfenmao <kangfenmao@qq.com>
Date: Mon, 12 May 2025 23:16:07 +0800
Subject: [PATCH 22/50] fix: OpenAIResponseProvider summaryForSearch impl model
 wrong

---
 src/renderer/src/providers/AiProvider/OpenAIProvider.ts    | 1 +
 .../src/providers/AiProvider/OpenAIResponseProvider.ts     | 7 ++++++-
 src/renderer/src/store/migrate.ts                          | 3 +++
 3 files changed, 10 insertions(+), 1 deletion(-)

diff --git a/src/renderer/src/providers/AiProvider/OpenAIProvider.ts b/src/renderer/src/providers/AiProvider/OpenAIProvider.ts
index 650960fc65..e7a553cc24 100644
--- a/src/renderer/src/providers/AiProvider/OpenAIProvider.ts
+++ b/src/renderer/src/providers/AiProvider/OpenAIProvider.ts
@@ -1011,6 +1011,7 @@ export default class OpenAIProvider extends BaseOpenAiProvider {
     }
 
     const lastUserMessage = messages[messages.length - 1]
+
     const { abortController, cleanup } = this.createAbortController(lastUserMessage?.id)
     const { signal } = abortController
 
diff --git a/src/renderer/src/providers/AiProvider/OpenAIResponseProvider.ts b/src/renderer/src/providers/AiProvider/OpenAIResponseProvider.ts
index 8ebcc475a1..db94c0df54 100644
--- a/src/renderer/src/providers/AiProvider/OpenAIResponseProvider.ts
+++ b/src/renderer/src/providers/AiProvider/OpenAIResponseProvider.ts
@@ -925,18 +925,23 @@ export abstract class BaseOpenAiProvider extends BaseProvider {
   }
 
   public async summaryForSearch(messages: Message[], assistant: Assistant): Promise<string | null> {
-    const model = getTopNamingModel() || assistant.model || getDefaultModel()
+    const model = assistant.model || getDefaultModel()
+
     const systemMessage: OpenAI.Responses.EasyInputMessage = {
       role: 'system',
       content: assistant.prompt
     }
+
     const messageContents = messages.map((m) => getMainTextContent(m))
     const userMessageContent = messageContents.join('\n')
+
     const userMessage: OpenAI.Responses.EasyInputMessage = {
       role: 'user',
       content: userMessageContent
     }
+
     const lastUserMessage = messages[messages.length - 1]
+
     const { abortController, cleanup } = this.createAbortController(lastUserMessage?.id)
     const { signal } = abortController
 
diff --git a/src/renderer/src/store/migrate.ts b/src/renderer/src/store/migrate.ts
index e88cac33ef..4e60ee922b 100644
--- a/src/renderer/src/store/migrate.ts
+++ b/src/renderer/src/store/migrate.ts
@@ -1309,6 +1309,9 @@ const migrateConfig = {
           provider.type = 'openai-response'
         }
       })
+      state.assistants.assistants.forEach((assistant) => {
+        assistant.knowledgeRecognition = 'off'
+      })
       return state
     } catch (error) {
       return state

From fa00ceac1a363e121f8e569e7a65d7fb1b8833d6 Mon Sep 17 00:00:00 2001
From: kangfenmao <kangfenmao@qq.com>
Date: Tue, 13 May 2025 20:41:15 +0800
Subject: [PATCH 23/50] fix: Grouped message should not reset model and modelId

* Updated the reset logic to conditionally handle model and modelId for grouped messages.
* Ensured that the original model is retained when regenerating responses for grouped messages.
---
 src/renderer/src/store/thunk/messageThunk.ts | 20 ++++++++++++++------
 1 file changed, 14 insertions(+), 6 deletions(-)

diff --git a/src/renderer/src/store/thunk/messageThunk.ts b/src/renderer/src/store/thunk/messageThunk.ts
index 4e631bba65..09311ae8ba 100644
--- a/src/renderer/src/store/thunk/messageThunk.ts
+++ b/src/renderer/src/store/thunk/messageThunk.ts
@@ -987,12 +987,20 @@ export const regenerateAssistantResponseThunk =
       const blockIdsToDelete = [...(messageToResetEntity.blocks || [])]
 
       // 5. Reset the message entity in Redux
-      const resetAssistantMsg = resetAssistantMessage(messageToResetEntity, {
-        status: AssistantMessageStatus.PENDING,
-        updatedAt: new Date().toISOString(),
-        model: assistant.model,
-        modelId: assistant?.model?.id
-      })
+      const resetAssistantMsg = resetAssistantMessage(
+        messageToResetEntity,
+        // Grouped message (mentioned model message) should not reset model and modelId, always use the original model
+        assistantMessageToRegenerate.modelId
+          ? {
+              status: AssistantMessageStatus.PENDING,
+              updatedAt: new Date().toISOString()
+            }
+          : {
+              status: AssistantMessageStatus.PENDING,
+              updatedAt: new Date().toISOString(),
+              model: assistant.model
+            }
+      )
 
       dispatch(
         newMessagesActions.updateMessage({

From 151bc78e013a40b3adf1e6aa7f12b2e9247ba924 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?=E4=B8=8A=E6=88=BF=E6=8F=AD=E7=93=A6?= <hoaobo@foxmail.com>
Date: Tue, 13 May 2025 23:09:38 +0800
Subject: [PATCH 24/50] =?UTF-8?q?=E6=B7=BB=E5=8A=A0=E6=99=BA=E8=83=BD?=
 =?UTF-8?q?=E4=BD=93=E8=AE=A2=E9=98=85=E5=8A=9F=E8=83=BD=20(#5954)?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

* 添加智能体订阅功能

* 修改图标

* 修改hook点

修改图标

* 优雅的引用图标

* feat(i18n): add settings title for agents in multiple languages

* fix(i18n): update translations for improved clarity

* Merge branch 'main' into Subscribe

---------

Co-authored-by: VM 96 <eov@88.com>
Co-authored-by: suyao <sy20010504@gmail.com>
---
 src/renderer/src/i18n/locales/en-us.json      |  3 ++
 src/renderer/src/i18n/locales/ja-jp.json      |  5 +-
 src/renderer/src/i18n/locales/ru-ru.json      |  3 ++
 src/renderer/src/i18n/locales/zh-cn.json      |  5 +-
 src/renderer/src/i18n/locales/zh-tw.json      |  5 +-
 src/renderer/src/pages/agents/index.ts        | 29 ++++++++++--
 .../AgentsSubscribeUrlSettings.tsx            | 47 +++++++++++++++++++
 .../settings/DataSettings/DataSettings.tsx    | 10 +++-
 src/renderer/src/store/settings.ts            |  7 +++
 9 files changed, 105 insertions(+), 9 deletions(-)
 create mode 100755 src/renderer/src/pages/settings/DataSettings/AgentsSubscribeUrlSettings.tsx

diff --git a/src/renderer/src/i18n/locales/en-us.json b/src/renderer/src/i18n/locales/en-us.json
index 171d5a9786..a8d8a173e6 100644
--- a/src/renderer/src/i18n/locales/en-us.json
+++ b/src/renderer/src/i18n/locales/en-us.json
@@ -44,6 +44,9 @@
       "my_agents": "My Agents",
       "search.no_results": "No results found",
       "sorting.title": "Sorting",
+      "settings": {
+        "title": "Agent Setting"
+      },
       "tag.agent": "Agent",
       "tag.default": "Default",
       "tag.new": "New",
diff --git a/src/renderer/src/i18n/locales/ja-jp.json b/src/renderer/src/i18n/locales/ja-jp.json
index a403b3292c..f30f699611 100644
--- a/src/renderer/src/i18n/locales/ja-jp.json
+++ b/src/renderer/src/i18n/locales/ja-jp.json
@@ -48,7 +48,10 @@
       "tag.default": "デフォルト",
       "tag.new": "新規",
       "tag.system": "システム",
-      "title": "エージェント"
+      "title": "エージェント",
+      "settings": {
+        "title": "エージェント設定"
+      }
     },
     "assistants": {
       "title": "アシスタント",
diff --git a/src/renderer/src/i18n/locales/ru-ru.json b/src/renderer/src/i18n/locales/ru-ru.json
index d0920fd2cf..254f65b009 100644
--- a/src/renderer/src/i18n/locales/ru-ru.json
+++ b/src/renderer/src/i18n/locales/ru-ru.json
@@ -48,6 +48,9 @@
       },
       "export": {
         "agent": "Экспорт агента"
+      },
+      "settings": {
+        "title": "Настройки агента"
       }
     },
     "assistants": {
diff --git a/src/renderer/src/i18n/locales/zh-cn.json b/src/renderer/src/i18n/locales/zh-cn.json
index b194461eba..71aa95a73e 100644
--- a/src/renderer/src/i18n/locales/zh-cn.json
+++ b/src/renderer/src/i18n/locales/zh-cn.json
@@ -48,7 +48,10 @@
       "tag.default": "默认",
       "tag.new": "新建",
       "tag.system": "系统",
-      "title": "智能体"
+      "title": "智能体",
+      "settings": {
+        "title": "智能体配置"
+      }
     },
     "assistants": {
       "title": "助手",
diff --git a/src/renderer/src/i18n/locales/zh-tw.json b/src/renderer/src/i18n/locales/zh-tw.json
index 0279639c8c..16facb9ae0 100644
--- a/src/renderer/src/i18n/locales/zh-tw.json
+++ b/src/renderer/src/i18n/locales/zh-tw.json
@@ -48,7 +48,10 @@
       "tag.default": "預設",
       "tag.new": "新增",
       "tag.system": "系統",
-      "title": "智慧代理人"
+      "title": "智慧代理人",
+      "settings": {
+        "title": "智慧代理人設定"
+      }
     },
     "assistants": {
       "title": "助手",
diff --git a/src/renderer/src/pages/agents/index.ts b/src/renderer/src/pages/agents/index.ts
index cf07d1df95..708cacc1f3 100644
--- a/src/renderer/src/pages/agents/index.ts
+++ b/src/renderer/src/pages/agents/index.ts
@@ -2,6 +2,8 @@ import { useRuntime } from '@renderer/hooks/useRuntime'
 import { useSettings } from '@renderer/hooks/useSettings'
 import { Agent } from '@renderer/types'
 import { useEffect, useState } from 'react'
+import store from '@renderer/store'
+
 let _agents: Agent[] = []
 
 export const getAgentsFromSystemAgents = (systemAgents: any) => {
@@ -19,27 +21,44 @@ export function useSystemAgents() {
   const { defaultAgent } = useSettings()
   const [agents, setAgents] = useState<Agent[]>([])
   const { resourcesPath } = useRuntime()
+  const { agentssubscribeUrl } = store.getState().settings
 
   useEffect(() => {
     const loadAgents = async () => {
       try {
-        // 始终加载本地 agents
+        // 检查是否使用远程数据源
+        if (agentssubscribeUrl && agentssubscribeUrl.startsWith('http')) {
+          try {
+            await new Promise(resolve => setTimeout(resolve, 500));
+            const response = await fetch(agentssubscribeUrl);
+            if (!response.ok) {
+              throw new Error(`HTTP error! Status: ${response.status}`);
+            }
+            const agentsData = await response.json() as Agent[];
+            setAgents(agentsData);
+            return;
+          } catch (error) {
+            console.error("Failed to load remote agents:", error);
+            // 远程加载失败，继续尝试加载本地数据
+          }
+        }
+        
+        // 如果没有远程配置或获取失败，加载本地代理
         if (resourcesPath && _agents.length === 0) {
           const localAgentsData = await window.api.fs.read(resourcesPath + '/data/agents.json')
           _agents = JSON.parse(localAgentsData) as Agent[]
         }
-
-        // 如果没有远程配置或获取失败，使用本地 agents
+        
         setAgents(_agents)
       } catch (error) {
         console.error('Failed to load agents:', error)
-        // 发生错误时使用本地 agents
+        // 发生错误时使用已加载的本地 agents
         setAgents(_agents)
       }
     }
 
     loadAgents()
-  }, [defaultAgent, resourcesPath])
+  }, [defaultAgent, resourcesPath, agentssubscribeUrl])
 
   return agents
 }
diff --git a/src/renderer/src/pages/settings/DataSettings/AgentsSubscribeUrlSettings.tsx b/src/renderer/src/pages/settings/DataSettings/AgentsSubscribeUrlSettings.tsx
new file mode 100755
index 0000000000..eb37f41737
--- /dev/null
+++ b/src/renderer/src/pages/settings/DataSettings/AgentsSubscribeUrlSettings.tsx
@@ -0,0 +1,47 @@
+import { HStack } from '@renderer/components/Layout'
+import { useTheme } from '@renderer/context/ThemeProvider'
+import { useSettings } from '@renderer/hooks/useSettings'
+import { useAppDispatch } from '@renderer/store'
+import { setAgentssubscribeUrl } from '@renderer/store/settings'
+import Input from 'antd/es/input/Input'
+import { FC } from 'react'
+import { useTranslation } from 'react-i18next'
+
+import { SettingDivider, SettingGroup, SettingRow, SettingRowTitle, SettingTitle } from '..'
+
+const AgentsSubscribeUrlSettings: FC = () => {
+  const { t } = useTranslation()
+  const { theme } = useTheme()
+  const dispatch = useAppDispatch()
+
+  const { agentssubscribeUrl } = useSettings()
+
+  const handleAgentChange = (e: React.ChangeEvent<HTMLInputElement>) => {
+    dispatch(setAgentssubscribeUrl(e.target.value))
+  }
+
+  return (
+    <SettingGroup theme={theme}>
+      <SettingTitle>
+        {t('agents.tag.agent')}
+        {t('settings.websearch.subscribe_add')}
+      </SettingTitle>
+      <SettingDivider />
+      <SettingRow>
+        <SettingRowTitle>{t('settings.websearch.subscribe_url')}</SettingRowTitle>
+        <HStack alignItems="center" gap="5px" style={{ width: 315 }}>
+          <Input
+            type="text"
+            value={agentssubscribeUrl || ''}
+            onChange={handleAgentChange}
+            style={{ width: 315 }}
+            placeholder={t('settings.websearch.subscribe_name.placeholder')}
+          />
+        </HStack>
+      </SettingRow>
+      <SettingDivider />
+    </SettingGroup>
+  )
+}
+
+export default AgentsSubscribeUrlSettings
diff --git a/src/renderer/src/pages/settings/DataSettings/DataSettings.tsx b/src/renderer/src/pages/settings/DataSettings/DataSettings.tsx
index 32d6e0e926..50f838ce37 100644
--- a/src/renderer/src/pages/settings/DataSettings/DataSettings.tsx
+++ b/src/renderer/src/pages/settings/DataSettings/DataSettings.tsx
@@ -17,12 +17,13 @@ import { reset } from '@renderer/services/BackupService'
 import { AppInfo } from '@renderer/types'
 import { formatFileSize } from '@renderer/utils'
 import { Button, Typography } from 'antd'
-import { FileText, FolderCog, FolderInput } from 'lucide-react'
+import { FileText, FolderCog, FolderInput, Sparkle } from 'lucide-react'
 import { FC, useEffect, useState } from 'react'
 import { useTranslation } from 'react-i18next'
 import styled from 'styled-components'
 
 import { SettingContainer, SettingDivider, SettingGroup, SettingRow, SettingRowTitle, SettingTitle } from '..'
+import AgentsSubscribeUrlSettings from './AgentsSubscribeUrlSettings'
 import ExportMenuOptions from './ExportMenuSettings'
 import JoplinSettings from './JoplinSettings'
 import MarkdownExportSettings from './MarkdownExportSettings'
@@ -81,6 +82,7 @@ const DataSettings: FC = () => {
       title: 'settings.data.markdown_export.title',
       icon: <FileText size={16} />
     },
+
     { key: 'divider_3', isDivider: true, text: t('settings.data.divider.third_party') },
     { key: 'notion', title: 'settings.data.notion.title', icon: <i className="iconfont icon-notion" /> },
     {
@@ -102,6 +104,11 @@ const DataSettings: FC = () => {
       key: 'siyuan',
       title: 'settings.data.siyuan.title',
       icon: <SiyuanIcon />
+    },
+    {
+      key: 'agentssubscribe_url',
+      title: 'agents.settings.title',
+      icon: <Sparkle size={16} className="icon" />
     }
   ]
 
@@ -253,6 +260,7 @@ const DataSettings: FC = () => {
         {menu === 'joplin' && <JoplinSettings />}
         {menu === 'obsidian' && <ObsidianSettings />}
         {menu === 'siyuan' && <SiyuanSettings />}
+        {menu === 'agentssubscribe_url' && <AgentsSubscribeUrlSettings />}
       </SettingContainer>
     </Container>
   )
diff --git a/src/renderer/src/store/settings.ts b/src/renderer/src/store/settings.ts
index 639646717b..4dcc7203a8 100644
--- a/src/renderer/src/store/settings.ts
+++ b/src/renderer/src/store/settings.ts
@@ -111,6 +111,8 @@ export interface SettingsState {
   siyuanToken: string | null
   siyuanBoxId: string | null
   siyuanRootPath: string | null
+  // 订阅的助手地址
+  agentssubscribeUrl: string | null
   // MinApps
   maxKeepAliveMinapps: number
   showOpenedMinappsInSidebar: boolean
@@ -218,6 +220,7 @@ export const initialState: SettingsState = {
   siyuanToken: null,
   siyuanBoxId: null,
   siyuanRootPath: null,
+  agentssubscribeUrl: '',
   // MinApps
   maxKeepAliveMinapps: 3,
   showOpenedMinappsInSidebar: true,
@@ -493,6 +496,9 @@ const settingsSlice = createSlice({
     setSiyuanRootPath: (state, action: PayloadAction<string>) => {
       state.siyuanRootPath = action.payload
     },
+    setAgentssubscribeUrl: (state, action: PayloadAction<string>) => {
+      state.agentssubscribeUrl = action.payload
+    },
     setMaxKeepAliveMinapps: (state, action: PayloadAction<number>) => {
       state.maxKeepAliveMinapps = action.payload
     },
@@ -599,6 +605,7 @@ export const {
   setSiyuanApiUrl,
   setSiyuanToken,
   setSiyuanBoxId,
+  setAgentssubscribeUrl,
   setSiyuanRootPath,
   setMaxKeepAliveMinapps,
   setShowOpenedMinappsInSidebar,

From 3a1ba4eb20a023bfa44834e3f05276724876a65f Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?=E8=87=AA=E7=94=B1=E7=9A=84=E4=B8=96=E7=95=8C=E4=BA=BA?=
 <3196812536@qq.com>
Date: Wed, 14 May 2025 00:13:00 +0800
Subject: [PATCH 25/50] feat: add citation content copy button (#5966)

* feat: add citation content copy button

* fix: build error
---
 .../home/Messages/Blocks/MainTextBlock.tsx    | 11 +++-
 .../src/pages/home/Messages/CitationsList.tsx | 61 +++++++++++++------
 src/renderer/src/utils/extract.ts             |  4 +-
 src/renderer/src/utils/formats.ts             | 20 +++++-
 4 files changed, 72 insertions(+), 24 deletions(-)

diff --git a/src/renderer/src/pages/home/Messages/Blocks/MainTextBlock.tsx b/src/renderer/src/pages/home/Messages/Blocks/MainTextBlock.tsx
index f21cc47131..b004e784a9 100644
--- a/src/renderer/src/pages/home/Messages/Blocks/MainTextBlock.tsx
+++ b/src/renderer/src/pages/home/Messages/Blocks/MainTextBlock.tsx
@@ -5,6 +5,7 @@ import type { RootState } from '@renderer/store'
 import { selectFormattedCitationsByBlockId } from '@renderer/store/messageBlock'
 import { type Model, WebSearchSource } from '@renderer/types'
 import type { MainTextMessageBlock, Message } from '@renderer/types/newMessage'
+import { cleanMarkdownContent } from '@renderer/utils/formats'
 import { Flex } from 'antd'
 import React, { useMemo } from 'react'
 import { useSelector } from 'react-redux'
@@ -37,9 +38,13 @@ const MainTextBlock: React.FC<Props> = ({ block, citationBlockId, role, mentions
   // Use the passed citationBlockId directly in the selector
   const { renderInputMessageAsMarkdown } = useSettings()
 
-  const formattedCitations = useSelector((state: RootState) =>
-    selectFormattedCitationsByBlockId(state, citationBlockId)
-  )
+  const formattedCitations = useSelector((state: RootState) => {
+    const citations = selectFormattedCitationsByBlockId(state, citationBlockId)
+    return citations.map((citation) => ({
+      ...citation,
+      content: citation.content ? cleanMarkdownContent(citation.content) : citation.content
+    }))
+  })
 
   const processedContent = useMemo(() => {
     let content = block.content
diff --git a/src/renderer/src/pages/home/Messages/CitationsList.tsx b/src/renderer/src/pages/home/Messages/CitationsList.tsx
index d674db4e18..230767a3a8 100644
--- a/src/renderer/src/pages/home/Messages/CitationsList.tsx
+++ b/src/renderer/src/pages/home/Messages/CitationsList.tsx
@@ -1,9 +1,10 @@
 import Favicon from '@renderer/components/Icons/FallbackFavicon'
 import { HStack } from '@renderer/components/Layout'
 import { fetchWebContent } from '@renderer/utils/fetch'
+import { cleanMarkdownContent } from '@renderer/utils/formats'
 import { QueryClient, QueryClientProvider, useQuery } from '@tanstack/react-query'
-import { Button, Drawer, Skeleton } from 'antd'
-import { FileSearch } from 'lucide-react'
+import { Button, Drawer, message, Skeleton } from 'antd'
+import { Check, Copy, FileSearch } from 'lucide-react'
 import React, { useState } from 'react'
 import { useTranslation } from 'react-i18next'
 import styled from 'styled-components'
@@ -44,21 +45,6 @@ const truncateText = (text: string, maxLength = 100) => {
   return text.length > maxLength ? text.slice(0, maxLength) + '...' : text
 }
 
-/**
- * 清理Markdown内容
- * @param text
- */
-const cleanMarkdownContent = (text: string): string => {
-  if (!text) return ''
-  let cleaned = text.replace(/!\[.*?]\(.*?\)/g, '')
-  cleaned = cleaned.replace(/\[(.*?)]\(.*?\)/g, '$1')
-  cleaned = cleaned.replace(/https?:\/\/\S+/g, '')
-  cleaned = cleaned.replace(/[-—–_=+]{3,}/g, ' ')
-  cleaned = cleaned.replace(/[￥$€£¥%@#&*^()[\]{}<>~`'"\\|/_.]+/g, '')
-  cleaned = cleaned.replace(/\s+/g, ' ').trim()
-  return cleaned
-}
-
 const CitationsList: React.FC<CitationsListProps> = ({ citations }) => {
   const { t } = useTranslation()
   const [open, setOpen] = useState(false)
@@ -115,6 +101,27 @@ const handleLinkClick = (url: string, event: React.MouseEvent) => {
   else window.api.file.openPath(url)
 }
 
+const CopyButton: React.FC<{ content: string }> = ({ content }) => {
+  const [copied, setCopied] = useState(false)
+  const { t } = useTranslation()
+
+  const handleCopy = () => {
+    if (!content) return
+    navigator.clipboard
+      .writeText(content)
+      .then(() => {
+        setCopied(true)
+        message.success(t('common.copied'))
+        setTimeout(() => setCopied(false), 2000)
+      })
+      .catch(() => {
+        message.error(t('message.copy.failed'))
+      })
+  }
+
+  return <CopyIconWrapper onClick={handleCopy}>{copied ? <Check size={14} /> : <Copy size={14} />}</CopyIconWrapper>
+}
+
 const WebSearchCitation: React.FC<{ citation: Citation }> = ({ citation }) => {
   const { data: fetchedContent, isLoading } = useQuery({
     queryKey: ['webContent', citation.url],
@@ -136,6 +143,7 @@ const WebSearchCitation: React.FC<{ citation: Citation }> = ({ citation }) => {
         <CitationLink className="text-nowrap" href={citation.url} onClick={(e) => handleLinkClick(citation.url, e)}>
           {citation.title || <span className="hostname">{citation.hostname}</span>}
         </CitationLink>
+        {fetchedContent && <CopyButton content={fetchedContent} />}
       </WebSearchCardHeader>
       {isLoading ? (
         <Skeleton active paragraph={{ rows: 1 }} title={false} />
@@ -153,6 +161,7 @@ const KnowledgeCitation: React.FC<{ citation: Citation }> = ({ citation }) => (
       <CitationLink className="text-nowrap" href={citation.url} onClick={(e) => handleLinkClick(citation.url, e)}>
         {citation.title}
       </CitationLink>
+      {citation.content && <CopyButton content={citation.content} />}
     </WebSearchCardHeader>
     <WebSearchCardContent>{citation.content && truncateText(citation.content, 100)}</WebSearchCardContent>
   </WebSearchCard>
@@ -203,6 +212,23 @@ const CitationLink = styled.a`
   }
 `
 
+const CopyIconWrapper = styled.div`
+  cursor: pointer;
+  display: flex;
+  align-items: center;
+  justify-content: center;
+  color: var(--color-text-2);
+  opacity: 0.6;
+  margin-left: auto;
+  padding: 4px;
+  border-radius: 4px;
+
+  &:hover {
+    opacity: 1;
+    background-color: var(--color-background-soft);
+  }
+`
+
 const WebSearchCard = styled.div`
   display: flex;
   flex-direction: column;
@@ -219,6 +245,7 @@ const WebSearchCardHeader = styled.div`
   align-items: center;
   gap: 8px;
   margin-bottom: 6px;
+  width: 100%;
 `
 
 const WebSearchCardContent = styled.div`
diff --git a/src/renderer/src/utils/extract.ts b/src/renderer/src/utils/extract.ts
index 4dd02ead69..2c71345255 100644
--- a/src/renderer/src/utils/extract.ts
+++ b/src/renderer/src/utils/extract.ts
@@ -1,4 +1,5 @@
 import { XMLParser } from 'fast-xml-parser'
+
 export interface ExtractResults {
   websearch?: WebsearchExtractResults
   knowledge?: KnowledgeExtractResults
@@ -27,7 +28,6 @@ export const extractInfoFromXML = (text: string): ExtractResults => {
       return name === 'question' || name === 'links'
     }
   })
-  const extractResults: ExtractResults = parser.parse(text)
   // Logger.log('Extracted results:', extractResults)
-  return extractResults
+  return parser.parse(text)
 }
diff --git a/src/renderer/src/utils/formats.ts b/src/renderer/src/utils/formats.ts
index 43f539d79f..a83ca4c632 100644
--- a/src/renderer/src/utils/formats.ts
+++ b/src/renderer/src/utils/formats.ts
@@ -2,6 +2,22 @@ import type { Message } from '@renderer/types/newMessage'
 
 import { findImageBlocks, getMainTextContent } from './messageUtils/find'
 
+/**
+ * 清理Markdown内容
+ * @param text 要清理的文本
+ * @returns 清理后的文本
+ */
+export function cleanMarkdownContent(text: string): string {
+  if (!text) return ''
+  let cleaned = text.replace(/!\[.*?]\(.*?\)/g, '') // 移除图片
+  cleaned = cleaned.replace(/\[(.*?)]\(.*?\)/g, '$1') // 替换链接为纯文本
+  cleaned = cleaned.replace(/https?:\/\/\S+/g, '') // 移除URL
+  cleaned = cleaned.replace(/[-—–_=+]{3,}/g, ' ') // 替换分隔符为空格
+  cleaned = cleaned.replace(/[￥$€£¥%@#&*^()[\]{}<>~`'"\\|/_.]+/g, '') // 移除特殊字符
+  cleaned = cleaned.replace(/\s+/g, ' ').trim() // 规范化空白
+  return cleaned
+}
+
 export function escapeDollarNumber(text: string) {
   let escapedText = ''
 
@@ -20,7 +36,7 @@ export function escapeDollarNumber(text: string) {
 }
 
 export function escapeBrackets(text: string) {
-  const pattern = /(```[\s\S]*?```|`.*?`)|\\\[([\s\S]*?[^\\])\\\]|\\\((.*?)\\\)/g
+  const pattern = /(```[\s\S]*?```|`.*?`)|\\\[([\s\S]*?[^\\])\\]|\\\((.*?)\\\)/g
   return text.replace(pattern, (match, codeBlock, squareBracket, roundBracket) => {
     if (codeBlock) {
       return codeBlock
@@ -102,7 +118,7 @@ export function withGenerateImage(message: Message): { content: string; images?:
   const originalContent = getMainTextContent(message)
   const imagePattern = new RegExp(`!\\[[^\\]]*\\]\\((.*?)\\s*("(?:.*[^"])")?\\s*\\)`)
   const images: string[] = []
-  let processedContent = originalContent
+  let processedContent: string
 
   processedContent = originalContent.replace(imagePattern, (_, url) => {
     if (url) {

From e9afab7725648244adeaafc1c92f9728ce6b19d6 Mon Sep 17 00:00:00 2001
From: one <wangan.cs@gmail.com>
Date: Wed, 14 May 2025 00:52:25 +0800
Subject: [PATCH 26/50] fix: quickpanel auto-scroll behaviour (#5950)

* fix: quickpanel scrollto changed to smart

* fix: add scrollTrigger as the replacement for scrollBlock

* fix: add a 'none' trigger to prevent accidental scrolling
---
 .../src/components/QuickPanel/types.ts        |  2 +
 .../src/components/QuickPanel/view.tsx        | 38 +++++++++++++++----
 2 files changed, 33 insertions(+), 7 deletions(-)

diff --git a/src/renderer/src/components/QuickPanel/types.ts b/src/renderer/src/components/QuickPanel/types.ts
index e122aa1d29..7cef05be23 100644
--- a/src/renderer/src/components/QuickPanel/types.ts
+++ b/src/renderer/src/components/QuickPanel/types.ts
@@ -64,3 +64,5 @@ export interface QuickPanelContextType {
   readonly beforeAction?: (Options: QuickPanelCallBackOptions) => void
   readonly afterAction?: (Options: QuickPanelCallBackOptions) => void
 }
+
+export type QuickPanelScrollTrigger = 'initial' | 'keyboard' | 'none'
diff --git a/src/renderer/src/components/QuickPanel/view.tsx b/src/renderer/src/components/QuickPanel/view.tsx
index 2bd1b14349..1602b6a4ac 100644
--- a/src/renderer/src/components/QuickPanel/view.tsx
+++ b/src/renderer/src/components/QuickPanel/view.tsx
@@ -6,13 +6,19 @@ import { theme } from 'antd'
 import Color from 'color'
 import { t } from 'i18next'
 import { Check } from 'lucide-react'
-import React, { use, useCallback, useDeferredValue, useEffect, useMemo, useRef, useState } from 'react'
+import React, { use, useCallback, useDeferredValue, useEffect, useLayoutEffect, useMemo, useRef, useState } from 'react'
 import { FixedSizeList } from 'react-window'
 import styled from 'styled-components'
 import * as tinyPinyin from 'tiny-pinyin'
 
 import { QuickPanelContext } from './provider'
-import { QuickPanelCallBackOptions, QuickPanelCloseAction, QuickPanelListItem, QuickPanelOpenOptions } from './types'
+import {
+  QuickPanelCallBackOptions,
+  QuickPanelCloseAction,
+  QuickPanelListItem,
+  QuickPanelOpenOptions,
+  QuickPanelScrollTrigger
+} from './types'
 
 const ITEM_HEIGHT = 31
 
@@ -45,6 +51,7 @@ export const QuickPanelView: React.FC<Props> = ({ setInputText }) => {
   // 避免上下翻页时，鼠标干扰
   const [isMouseOver, setIsMouseOver] = useState(false)
 
+  const scrollTriggerRef = useRef<QuickPanelScrollTrigger>('initial')
   const [_index, setIndex] = useState(ctx.defaultIndex)
   const index = useDeferredValue(_index)
   const [historyPanel, setHistoryPanel] = useState<QuickPanelOpenOptions[]>([])
@@ -140,6 +147,7 @@ export const QuickPanelView: React.FC<Props> = ({ setInputText }) => {
     (action?: QuickPanelCloseAction) => {
       ctx.close(action)
       setHistoryPanel([])
+      scrollTriggerRef.current = 'initial'
 
       if (action === 'delete-symbol') {
         const textArea = document.querySelector('.inputbar textarea') as HTMLTextAreaElement
@@ -249,10 +257,13 @@ export const QuickPanelView: React.FC<Props> = ({ setInputText }) => {
     // eslint-disable-next-line react-hooks/exhaustive-deps
   }, [ctx.isVisible])
 
-  useEffect(() => {
-    if (index >= 0) {
-      listRef.current?.scrollToItem(index, 'auto')
-    }
+  useLayoutEffect(() => {
+    if (!listRef.current || index < 0 || scrollTriggerRef.current === 'none') return
+
+    const alignment = scrollTriggerRef.current === 'keyboard' ? 'auto' : 'smart'
+    listRef.current?.scrollToItem(index, alignment)
+
+    scrollTriggerRef.current = 'none'
   }, [index])
 
   // 处理键盘事件
@@ -277,6 +288,7 @@ export const QuickPanelView: React.FC<Props> = ({ setInputText }) => {
 
       switch (e.key) {
         case 'ArrowUp':
+          scrollTriggerRef.current = 'keyboard'
           if (isAssistiveKeyPressed) {
             setIndex((prev) => {
               const newIndex = prev - ctx.pageSize
@@ -289,6 +301,7 @@ export const QuickPanelView: React.FC<Props> = ({ setInputText }) => {
           break
 
         case 'ArrowDown':
+          scrollTriggerRef.current = 'keyboard'
           if (isAssistiveKeyPressed) {
             setIndex((prev) => {
               const newIndex = prev + ctx.pageSize
@@ -301,6 +314,7 @@ export const QuickPanelView: React.FC<Props> = ({ setInputText }) => {
           break
 
         case 'PageUp':
+          scrollTriggerRef.current = 'keyboard'
           setIndex((prev) => {
             const newIndex = prev - ctx.pageSize
             return newIndex < 0 ? 0 : newIndex
@@ -308,6 +322,7 @@ export const QuickPanelView: React.FC<Props> = ({ setInputText }) => {
           break
 
         case 'PageDown':
+          scrollTriggerRef.current = 'keyboard'
           setIndex((prev) => {
             const newIndex = prev + ctx.pageSize
             return newIndex >= list.length ? list.length - 1 : newIndex
@@ -317,6 +332,7 @@ export const QuickPanelView: React.FC<Props> = ({ setInputText }) => {
         case 'ArrowLeft':
           if (!isAssistiveKeyPressed) return
           if (!historyPanel.length) return
+          scrollTriggerRef.current = 'initial'
           clearSearchText(false)
           if (historyPanel.length > 0) {
             const lastPanel = historyPanel.pop()
@@ -329,6 +345,7 @@ export const QuickPanelView: React.FC<Props> = ({ setInputText }) => {
         case 'ArrowRight':
           if (!isAssistiveKeyPressed) return
           if (!list?.[index]?.isMenu) return
+          scrollTriggerRef.current = 'initial'
           clearSearchText(false)
           handleItemAction(list[index], 'enter')
           break
@@ -413,7 +430,14 @@ export const QuickPanelView: React.FC<Props> = ({ setInputText }) => {
       $selectedColor={selectedColor}
       $selectedColorHover={selectedColorHover}
       className={ctx.isVisible ? 'visible' : ''}>
-      <QuickPanelBody ref={bodyRef} onMouseMove={() => setIsMouseOver(true)}>
+      <QuickPanelBody
+        ref={bodyRef}
+        onMouseMove={() =>
+          setIsMouseOver((prev) => {
+            scrollTriggerRef.current = 'initial'
+            return prev ? prev : true
+          })
+        }>
         <FixedSizeList
           ref={listRef}
           itemCount={list.length}

From 0d38fabfac3584b6a16d031e72b9b1b9d5850e3e Mon Sep 17 00:00:00 2001
From: SuYao <sy20010504@gmail.com>
Date: Wed, 14 May 2025 13:51:25 +0800
Subject: [PATCH 27/50] fix: improve citation deduplication logic for
 non-knowledge citations (#5981)

---
 src/renderer/src/store/messageBlock.ts | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/src/renderer/src/store/messageBlock.ts b/src/renderer/src/store/messageBlock.ts
index 2a4ac9845c..c9cc55cec3 100644
--- a/src/renderer/src/store/messageBlock.ts
+++ b/src/renderer/src/store/messageBlock.ts
@@ -236,10 +236,11 @@ const formatCitationsFromBlock = (block: CitationMessageBlock | undefined): Cita
       })
     )
   }
-  // 4. Deduplicate by URL and Renumber Sequentially
+  // 4. Deduplicate non-knowledge citations by URL and Renumber Sequentially
   const urlSet = new Set<string>()
   return formattedCitations
     .filter((citation) => {
+      if (citation.type === 'knowledge') return true
       if (!citation.url || urlSet.has(citation.url)) return false
       urlSet.add(citation.url)
       return true

From 51061d4d1aae4dcedd66515b6e63f0af8b66366a Mon Sep 17 00:00:00 2001
From: SuYao <sy20010504@gmail.com>
Date: Wed, 14 May 2025 13:52:31 +0800
Subject: [PATCH 28/50] fix: append topic prompt if exists (#5969)

---
 src/renderer/src/pages/home/Inputbar/Inputbar.tsx | 4 ++++
 1 file changed, 4 insertions(+)

diff --git a/src/renderer/src/pages/home/Inputbar/Inputbar.tsx b/src/renderer/src/pages/home/Inputbar/Inputbar.tsx
index ab13fe2489..39621cc85d 100644
--- a/src/renderer/src/pages/home/Inputbar/Inputbar.tsx
+++ b/src/renderer/src/pages/home/Inputbar/Inputbar.tsx
@@ -215,6 +215,10 @@ const Inputbar: FC<Props> = ({ assistant: _assistant, setActiveTopic, topic }) =
         )
       }
 
+      if (topic.prompt) {
+        baseUserMessage.assistant.prompt = assistant.prompt ? `${assistant.prompt}\n${topic.prompt}` : topic.prompt
+      }
+
       baseUserMessage.usage = await estimateUserPromptUsage(baseUserMessage)
 
       const { message, blocks } = getUserMessage(baseUserMessage)

From 4cb4890be750c283599a10eb4ef796113c2cc6fd Mon Sep 17 00:00:00 2001
From: Lao <laodanfeng@hotmail.com>
Date: Wed, 14 May 2025 17:01:33 +0800
Subject: [PATCH 29/50] fix lint errors (#5987)

* Fix code snippets that don't comply with code standards by applying lint rules

* update package.json:add test:lint script
---
 package.json                                  |  1 +
 src/main/services/BackupManager.ts            |  2 +-
 .../pages/agents/components/AddAgentPopup.tsx | 18 +++++++++--------
 src/renderer/src/pages/agents/index.ts        | 20 +++++++++----------
 .../src/pages/home/Messages/MessageTokens.tsx |  4 ++--
 5 files changed, 24 insertions(+), 21 deletions(-)

diff --git a/package.json b/package.json
index 9d769d9a25..b1668efbb7 100644
--- a/package.json
+++ b/package.json
@@ -50,6 +50,7 @@
     "test:renderer": "vitest run",
     "test:renderer:ui": "vitest --ui",
     "test:renderer:coverage": "vitest run --coverage",
+    "test:lint":"eslint . --ext .js,.jsx,.cjs,.mjs,.ts,.tsx,.cts,.mts",
     "format": "prettier --write .",
     "lint": "eslint . --ext .js,.jsx,.cjs,.mjs,.ts,.tsx,.cts,.mts --fix",
     "postinstall": "electron-builder install-app-deps",
diff --git a/src/main/services/BackupManager.ts b/src/main/services/BackupManager.ts
index 6be19d035b..ea8521aa16 100644
--- a/src/main/services/BackupManager.ts
+++ b/src/main/services/BackupManager.ts
@@ -4,8 +4,8 @@ import archiver from 'archiver'
 import { exec } from 'child_process'
 import { app } from 'electron'
 import Logger from 'electron-log'
-import StreamZip from 'node-stream-zip'
 import * as fs from 'fs-extra'
+import StreamZip from 'node-stream-zip'
 import * as path from 'path'
 import { createClient, CreateDirectoryOptions, FileStat } from 'webdav'
 
diff --git a/src/renderer/src/pages/agents/components/AddAgentPopup.tsx b/src/renderer/src/pages/agents/components/AddAgentPopup.tsx
index eeca7a39c8..fc341e970e 100644
--- a/src/renderer/src/pages/agents/components/AddAgentPopup.tsx
+++ b/src/renderer/src/pages/agents/components/AddAgentPopup.tsx
@@ -1,6 +1,6 @@
 import 'emoji-picker-element'
 
-import { CheckOutlined, LoadingOutlined, ThunderboltOutlined, RollbackOutlined } from '@ant-design/icons'
+import { CheckOutlined, LoadingOutlined, RollbackOutlined, ThunderboltOutlined } from '@ant-design/icons'
 import EmojiPicker from '@renderer/components/EmojiPicker'
 import { TopView } from '@renderer/components/TopView'
 import { AGENT_PROMPT } from '@renderer/config/prompts'
@@ -132,8 +132,8 @@ const PopupContainer: React.FC<Props> = ({ resolve }) => {
   }
 
   const handleUndoButtonClick = async () => {
-      form.setFieldsValue({ prompt: originalPrompt })
-      setShowUndoButton(false)
+    form.setFieldsValue({ prompt: originalPrompt })
+    setShowUndoButton(false)
   }
 
   // Compute label width based on the longest label
@@ -191,11 +191,13 @@ const PopupContainer: React.FC<Props> = ({ resolve }) => {
             style={{ position: 'absolute', top: 8, right: 8 }}
             disabled={loading}
           />
-          {showUndoButton && <Button
-            icon={<RollbackOutlined />}
-            onClick={handleUndoButtonClick}
-            style={{ position: 'absolute', top: 8, right: 48 }}
-          />}
+          {showUndoButton && (
+            <Button
+              icon={<RollbackOutlined />}
+              onClick={handleUndoButtonClick}
+              style={{ position: 'absolute', top: 8, right: 48 }}
+            />
+          )}
         </div>
         {showKnowledgeIcon && (
           <Form.Item name="knowledge_base_ids" label={t('agents.add.knowledge_base')} rules={[{ required: false }]}>
diff --git a/src/renderer/src/pages/agents/index.ts b/src/renderer/src/pages/agents/index.ts
index 708cacc1f3..3bc31bd1be 100644
--- a/src/renderer/src/pages/agents/index.ts
+++ b/src/renderer/src/pages/agents/index.ts
@@ -1,8 +1,8 @@
 import { useRuntime } from '@renderer/hooks/useRuntime'
 import { useSettings } from '@renderer/hooks/useSettings'
+import store from '@renderer/store'
 import { Agent } from '@renderer/types'
 import { useEffect, useState } from 'react'
-import store from '@renderer/store'
 
 let _agents: Agent[] = []
 
@@ -29,26 +29,26 @@ export function useSystemAgents() {
         // 检查是否使用远程数据源
         if (agentssubscribeUrl && agentssubscribeUrl.startsWith('http')) {
           try {
-            await new Promise(resolve => setTimeout(resolve, 500));
-            const response = await fetch(agentssubscribeUrl);
+            await new Promise((resolve) => setTimeout(resolve, 500))
+            const response = await fetch(agentssubscribeUrl)
             if (!response.ok) {
-              throw new Error(`HTTP error! Status: ${response.status}`);
+              throw new Error(`HTTP error! Status: ${response.status}`)
             }
-            const agentsData = await response.json() as Agent[];
-            setAgents(agentsData);
-            return;
+            const agentsData = (await response.json()) as Agent[]
+            setAgents(agentsData)
+            return
           } catch (error) {
-            console.error("Failed to load remote agents:", error);
+            console.error('Failed to load remote agents:', error)
             // 远程加载失败，继续尝试加载本地数据
           }
         }
-        
+
         // 如果没有远程配置或获取失败，加载本地代理
         if (resourcesPath && _agents.length === 0) {
           const localAgentsData = await window.api.fs.read(resourcesPath + '/data/agents.json')
           _agents = JSON.parse(localAgentsData) as Agent[]
         }
-        
+
         setAgents(_agents)
       } catch (error) {
         console.error('Failed to load agents:', error)
diff --git a/src/renderer/src/pages/home/Messages/MessageTokens.tsx b/src/renderer/src/pages/home/Messages/MessageTokens.tsx
index 390b3530df..98d3f8f88a 100644
--- a/src/renderer/src/pages/home/Messages/MessageTokens.tsx
+++ b/src/renderer/src/pages/home/Messages/MessageTokens.tsx
@@ -44,7 +44,7 @@ const MessgeTokens: React.FC<MessageTokensProps> = ({ message }) => {
       <MessageMetadata className={`message-tokens ${hasMetrics ? 'has-metrics' : ''}`} onClick={locateMessage}>
         <span className="metrics">{metrixs}</span>
         <span className="tokens">
-          Tokens: 
+          Tokens:
           <span>{message?.usage?.total_tokens}</span>
           <span>↑{message?.usage?.prompt_tokens}</span>
           <span>↓{message?.usage?.completion_tokens}</span>
@@ -72,7 +72,7 @@ const MessageMetadata = styled.div`
     display: block;
 
     span {
-      padding:0 2px;
+      padding: 0 2px;
     }
   }
 

From 568fd155c5cd2dd6f5808ce6b30ab41174551b8a Mon Sep 17 00:00:00 2001
From: Konv Suu <2583695112@qq.com>
Date: Wed, 14 May 2025 18:57:02 +0800
Subject: [PATCH 30/50] fix: define line-clamp for compatibility (#5983)

---
 src/renderer/src/assets/styles/index.scss | 1 +
 1 file changed, 1 insertion(+)

diff --git a/src/renderer/src/assets/styles/index.scss b/src/renderer/src/assets/styles/index.scss
index 0662045cb9..3b5d98e941 100644
--- a/src/renderer/src/assets/styles/index.scss
+++ b/src/renderer/src/assets/styles/index.scss
@@ -230,6 +230,7 @@ body,
   display: -webkit-box !important;
   -webkit-line-clamp: 1;
   -webkit-box-orient: vertical;
+  line-clamp: 1;
   overflow: hidden;
   text-overflow: ellipsis;
   white-space: normal;

From 577d180e1d0ebf8086ecb1f73f7ebe0183b30635 Mon Sep 17 00:00:00 2001
From: George Zhao <38124587+CreatorZZY@users.noreply.github.com>
Date: Wed, 14 May 2025 19:37:37 +0800
Subject: [PATCH 31/50] =?UTF-8?q?feat:=20=E6=9B=B4=E9=95=BF=E4=B8=8A?=
 =?UTF-8?q?=E4=B8=8B=E6=96=87=20(#5963)?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

* feat: Extended the fillable context length to 100. #5514

Update src/renderer/src/pages/home/Tabs/SettingsTab.tsx

fix: update context length settings and localization for multiple languages

* fix: adjust context count slider limits and behavior based on max contexts setting

* feat: implement event handling for max contexts changes in settings

* feat: update context count handling to use EXTENDED_CONTEXT_LIMIT in settings

* feat: update context count logic to use EXTENDED_CONTEXT_LIMIT when max contexts are enabled

* refactor: remove unused EXTENDED_CONTEXT_LIMIT import from AssistantService

* feat: simplify context count logic with validAndChangeContextCount function

* feat: 移除TokenCount组件中对最大计数为20的特殊处理，简化上下文计数显示逻辑

* refactor: simplify getContextCount logic by removing max context handling

* feat: adjust step value for context count input based on max contexts setting

---------

Co-authored-by: George Zhao <georgezhao@SKJLAB>
---
 src/renderer/src/config/constant.ts           |  1 +
 src/renderer/src/i18n/locales/en-us.json      |  1 +
 src/renderer/src/i18n/locales/ja-jp.json      |  1 +
 src/renderer/src/i18n/locales/ru-ru.json      |  1 +
 src/renderer/src/i18n/locales/zh-cn.json      |  1 +
 src/renderer/src/i18n/locales/zh-tw.json      |  1 +
 .../src/pages/home/Inputbar/TokenCount.tsx    | 14 +----
 .../src/pages/home/Tabs/SettingsTab.tsx       | 55 +++++++++++++++++--
 .../AssistantModelSettings.tsx                | 55 ++++++++++++++++---
 src/renderer/src/services/AssistantService.ts |  3 +-
 src/renderer/src/services/EventService.ts     |  3 +-
 src/renderer/src/services/MessagesService.ts  |  4 +-
 src/renderer/src/types/index.ts               |  1 +
 13 files changed, 109 insertions(+), 32 deletions(-)

diff --git a/src/renderer/src/config/constant.ts b/src/renderer/src/config/constant.ts
index 5d2376d12f..7f26bff5b5 100644
--- a/src/renderer/src/config/constant.ts
+++ b/src/renderer/src/config/constant.ts
@@ -1,5 +1,6 @@
 export const DEFAULT_TEMPERATURE = 1.0
 export const DEFAULT_CONTEXTCOUNT = 5
+export const EXTENDED_CONTEXT_LIMIT = 100
 export const DEFAULT_MAX_TOKENS = 4096
 export const DEFAULT_KNOWLEDGE_DOCUMENT_COUNT = 6
 export const DEFAULT_KNOWLEDGE_THRESHOLD = 0.0
diff --git a/src/renderer/src/i18n/locales/en-us.json b/src/renderer/src/i18n/locales/en-us.json
index a8d8a173e6..f2cd67fe8e 100644
--- a/src/renderer/src/i18n/locales/en-us.json
+++ b/src/renderer/src/i18n/locales/en-us.json
@@ -208,6 +208,7 @@
       "settings.context_count": "Context",
       "settings.context_count.tip": "The number of previous messages to keep in the context.",
       "settings.max": "Max",
+      "settings.max_contexts": "More Contexts Length",
       "settings.max_tokens": "Enable max tokens limit",
       "settings.max_tokens.confirm": "Enable max tokens limit",
       "settings.max_tokens.confirm_content": "Enable max tokens limit, affects the length of the result. Need to consider the context limit of the model, otherwise an error will be reported",
diff --git a/src/renderer/src/i18n/locales/ja-jp.json b/src/renderer/src/i18n/locales/ja-jp.json
index f30f699611..641c8116e3 100644
--- a/src/renderer/src/i18n/locales/ja-jp.json
+++ b/src/renderer/src/i18n/locales/ja-jp.json
@@ -208,6 +208,7 @@
       "settings.context_count": "コンテキスト",
       "settings.context_count.tip": "コンテキストに保持する以前のメッセージの数",
       "settings.max": "最大",
+      "settings.max_contexts": "より長いコンテキスト制限",
       "settings.max_tokens": "最大トークン制限を有効にする",
       "settings.max_tokens.confirm": "最大トークン制限を有効にする",
       "settings.max_tokens.confirm_content": "最大トークン制限を有効にすると、モデルが生成できる最大トークン数が制限されます。これにより、返される結果の長さに影響が出る可能性があります。モデルのコンテキスト制限に基づいて設定する必要があります。そうしないとエラーが発生します",
diff --git a/src/renderer/src/i18n/locales/ru-ru.json b/src/renderer/src/i18n/locales/ru-ru.json
index 254f65b009..8b52c52722 100644
--- a/src/renderer/src/i18n/locales/ru-ru.json
+++ b/src/renderer/src/i18n/locales/ru-ru.json
@@ -208,6 +208,7 @@
       "settings.context_count": "Контекст",
       "settings.context_count.tip": "Количество предыдущих сообщений, которые нужно сохранить в контексте.",
       "settings.max": "Максимум",
+      "settings.max_contexts": "Более длительные ограничения контекста",
       "settings.max_tokens": "Включить лимит максимальных токенов",
       "settings.max_tokens.confirm": "Включить лимит максимальных токенов",
       "settings.max_tokens.confirm_content": "Включить лимит максимальных токенов, влияет на длину результата. Нужно учитывать контекст модели, иначе будет ошибка",
diff --git a/src/renderer/src/i18n/locales/zh-cn.json b/src/renderer/src/i18n/locales/zh-cn.json
index 71aa95a73e..52f3f5930f 100644
--- a/src/renderer/src/i18n/locales/zh-cn.json
+++ b/src/renderer/src/i18n/locales/zh-cn.json
@@ -222,6 +222,7 @@
       "settings.context_count": "上下文数",
       "settings.context_count.tip": "要保留在上下文中的消息数量，数值越大，上下文越长，消耗的 token 越多。普通聊天建议 5-10",
       "settings.max": "不限",
+      "settings.max_contexts": "更多上下文长度限制",
       "settings.max_tokens": "开启消息长度限制",
       "settings.max_tokens.confirm": "开启消息长度限制",
       "settings.max_tokens.confirm_content": "开启消息长度限制后，单次交互所用的最大 Token 数, 会影响返回结果的长度。要根据模型上下文限制来设置，否则会报错",
diff --git a/src/renderer/src/i18n/locales/zh-tw.json b/src/renderer/src/i18n/locales/zh-tw.json
index 16facb9ae0..fbfebd7266 100644
--- a/src/renderer/src/i18n/locales/zh-tw.json
+++ b/src/renderer/src/i18n/locales/zh-tw.json
@@ -208,6 +208,7 @@
       "settings.context_count": "上下文",
       "settings.context_count.tip": "在上下文中保留的前幾則訊息。",
       "settings.max": "最大",
+      "settings.max_contexts": "更多上下文長度限制",
       "settings.max_tokens": "啟用最大 Token 限制",
       "settings.max_tokens.confirm": "啟用訊息長度限制",
       "settings.max_tokens.confirm_content": "啟用訊息長度限制後，單次互動所用的最大 Token 數，會影響返回結果的長度。要根據模型上下文限制來設定，否則會發生錯誤。",
diff --git a/src/renderer/src/pages/home/Inputbar/TokenCount.tsx b/src/renderer/src/pages/home/Inputbar/TokenCount.tsx
index cb08b9b5fd..b7ca3b351b 100644
--- a/src/renderer/src/pages/home/Inputbar/TokenCount.tsx
+++ b/src/renderer/src/pages/home/Inputbar/TokenCount.tsx
@@ -22,18 +22,6 @@ const TokenCount: FC<Props> = ({ estimateTokenCount, inputTokenCount, contextCou
   }
 
   const formatMaxCount = (max: number) => {
-    if (max == 20) {
-      return (
-        <span
-          style={{
-            fontSize: '16px',
-            position: 'relative',
-            top: '1px'
-          }}>
-          ∞
-        </span>
-      )
-    }
     return max.toString()
   }
 
@@ -43,7 +31,7 @@ const TokenCount: FC<Props> = ({ estimateTokenCount, inputTokenCount, contextCou
         <HStack justifyContent="space-between" w="100%">
           <Text>{t('chat.input.context_count.tip')}</Text>
           <Text>
-            {contextCount.current} / {contextCount.max == 20 ? '∞' : contextCount.max}
+            {contextCount.current} / {contextCount.max}
           </Text>
         </HStack>
         <Divider style={{ margin: '5px 0' }} />
diff --git a/src/renderer/src/pages/home/Tabs/SettingsTab.tsx b/src/renderer/src/pages/home/Tabs/SettingsTab.tsx
index 1b35190be0..0e69481210 100644
--- a/src/renderer/src/pages/home/Tabs/SettingsTab.tsx
+++ b/src/renderer/src/pages/home/Tabs/SettingsTab.tsx
@@ -5,6 +5,7 @@ import {
   DEFAULT_CONTEXTCOUNT,
   DEFAULT_MAX_TOKENS,
   DEFAULT_TEMPERATURE,
+  EXTENDED_CONTEXT_LIMIT,
   isMac,
   isWindows
 } from '@renderer/config/constant'
@@ -13,6 +14,7 @@ import { useAssistant } from '@renderer/hooks/useAssistant'
 import { useSettings } from '@renderer/hooks/useSettings'
 import { SettingDivider, SettingRow, SettingRowTitle, SettingSubtitle } from '@renderer/pages/settings'
 import AssistantSettingsPopup from '@renderer/pages/settings/AssistantSettings'
+import { EVENT_NAMES, EventEmitter } from '@renderer/services/EventService'
 import { useAppDispatch } from '@renderer/store'
 import {
   SendMessageShortcut,
@@ -51,7 +53,7 @@ import {
   TranslateLanguageVarious
 } from '@renderer/types'
 import { modalConfirm } from '@renderer/utils'
-import { Button, Col, InputNumber, Row, Select, Slider, Switch, Tooltip } from 'antd'
+import { Button, Col, Divider, InputNumber, Row, Select, Slider, Switch, Tooltip } from 'antd'
 import { CircleHelp, RotateCcw, Settings2 } from 'lucide-react'
 import { FC, useEffect, useState } from 'react'
 import { useTranslation } from 'react-i18next'
@@ -67,6 +69,7 @@ const SettingsTab: FC<Props> = (props) => {
 
   const [temperature, setTemperature] = useState(assistant?.settings?.temperature ?? DEFAULT_TEMPERATURE)
   const [contextCount, setContextCount] = useState(assistant?.settings?.contextCount ?? DEFAULT_CONTEXTCOUNT)
+  const [enableMaxContexts, setEnableMaxContexts] = useState(assistant?.settings?.enableMaxContexts ?? false)
   const [enableMaxTokens, setEnableMaxTokens] = useState(assistant?.settings?.enableMaxTokens ?? false)
   const [maxTokens, setMaxTokens] = useState(assistant?.settings?.maxTokens ?? 0)
   const [fontSizeValue, setFontSizeValue] = useState(fontSize)
@@ -155,10 +158,18 @@ const SettingsTab: FC<Props> = (props) => {
 
   const formatSliderTooltip = (value?: number) => {
     if (value === undefined) return ''
-    return value === 20 ? '∞' : value.toString()
+    return value.toString()
   }
 
-  return (
+  const validAndChangeContextCount = (contextCount, enableMaxContexts, EXTENDED_CONTEXT_LIMIT) => {
+    if ((typeof contextCount === 'number' ? contextCount : 0) > (enableMaxContexts ? EXTENDED_CONTEXT_LIMIT : 10)) {
+      return enableMaxContexts ? EXTENDED_CONTEXT_LIMIT : 10
+    } else {
+      return typeof contextCount === 'number' ? contextCount : 0
+    }
+  }
+
+  const container = (
     <Container className="settings-tab">
       <SettingGroup style={{ marginTop: 10 }}>
         <SettingSubtitle style={{ marginTop: 0, display: 'flex', justifyContent: 'space-between' }}>
@@ -204,15 +215,31 @@ const SettingsTab: FC<Props> = (props) => {
           <Col span={24}>
             <Slider
               min={0}
-              max={10}
+              max={!enableMaxContexts ? 10 : EXTENDED_CONTEXT_LIMIT}
               onChange={setContextCount}
               onChangeComplete={onContextCountChange}
-              value={typeof contextCount === 'number' ? contextCount : 0}
-              step={1}
+              value={validAndChangeContextCount(contextCount, enableMaxContexts, EXTENDED_CONTEXT_LIMIT)}
+              step={!enableMaxContexts ? 1 : 10}
               tooltip={{ formatter: formatSliderTooltip }}
             />
           </Col>
         </Row>
+        <SettingRow>
+          <SettingRowTitleSmall>{t('chat.settings.max_contexts')}</SettingRowTitleSmall>
+          <Switch
+            size="small"
+            checked={enableMaxContexts}
+            onChange={(checked) => {
+              setEnableMaxContexts(checked)
+              updateAssistantSettings({ enableMaxContexts: checked })
+              if (!checked && contextCount > 10) {
+                setContextCount(10)
+                onUpdateAssistantSettings({ contextCount: 10 })
+              }
+            }}
+          />
+        </SettingRow>
+        <Divider style={{ margin: '10px 0' }} />
         <SettingRow>
           <SettingRowTitleSmall>{t('models.stream_output')}</SettingRowTitleSmall>
           <Switch
@@ -627,6 +654,22 @@ const SettingsTab: FC<Props> = (props) => {
       </SettingGroup>
     </Container>
   )
+  EventEmitter.on(EVENT_NAMES.MAX_CONTEXTS_CHANGED, ({ check, context }): any => {
+    setEnableMaxContexts(check)
+    updateAssistantSettings({ enableMaxContexts: check })
+
+    // Ensure contextCount is within the new valid range
+    let newContextCount = context
+    if (!check && newContextCount > 10) {
+      newContextCount = 10
+    } else if (check && newContextCount > EXTENDED_CONTEXT_LIMIT) {
+      newContextCount = EXTENDED_CONTEXT_LIMIT
+    }
+
+    setContextCount(newContextCount)
+    onUpdateAssistantSettings({ contextCount: newContextCount })
+  })
+  return container
 }
 
 const Container = styled(Scrollbar)`
diff --git a/src/renderer/src/pages/settings/AssistantSettings/AssistantModelSettings.tsx b/src/renderer/src/pages/settings/AssistantSettings/AssistantModelSettings.tsx
index 1c494b2ee2..ac203189c1 100644
--- a/src/renderer/src/pages/settings/AssistantSettings/AssistantModelSettings.tsx
+++ b/src/renderer/src/pages/settings/AssistantSettings/AssistantModelSettings.tsx
@@ -2,8 +2,9 @@ import { DeleteOutlined, PlusOutlined, QuestionCircleOutlined } from '@ant-desig
 import ModelAvatar from '@renderer/components/Avatar/ModelAvatar'
 import { HStack } from '@renderer/components/Layout'
 import SelectModelPopup from '@renderer/components/Popups/SelectModelPopup'
-import { DEFAULT_CONTEXTCOUNT, DEFAULT_TEMPERATURE } from '@renderer/config/constant'
+import { DEFAULT_CONTEXTCOUNT, DEFAULT_TEMPERATURE, EXTENDED_CONTEXT_LIMIT } from '@renderer/config/constant'
 import { SettingRow } from '@renderer/pages/settings'
+import { EVENT_NAMES, EventEmitter } from '@renderer/services/EventService'
 import { Assistant, AssistantSettingCustomParameters, AssistantSettings } from '@renderer/types'
 import { modalConfirm } from '@renderer/utils'
 import { Button, Col, Divider, Input, InputNumber, Row, Select, Slider, Switch, Tooltip } from 'antd'
@@ -21,6 +22,7 @@ interface Props {
 const AssistantModelSettings: FC<Props> = ({ assistant, updateAssistant, updateAssistantSettings }) => {
   const [temperature, setTemperature] = useState(assistant?.settings?.temperature ?? DEFAULT_TEMPERATURE)
   const [contextCount, setContextCount] = useState(assistant?.settings?.contextCount ?? DEFAULT_CONTEXTCOUNT)
+  const [enableMaxContexts, setEnableMaxContexts] = useState(assistant?.settings?.enableMaxContexts ?? false)
   const [enableMaxTokens, setEnableMaxTokens] = useState(assistant?.settings?.enableMaxTokens ?? false)
   const [maxTokens, setMaxTokens] = useState(assistant?.settings?.maxTokens ?? 0)
   const [streamOutput, setStreamOutput] = useState(assistant?.settings?.streamOutput ?? true)
@@ -31,6 +33,10 @@ const AssistantModelSettings: FC<Props> = ({ assistant, updateAssistant, updateA
     assistant?.settings?.customParameters ?? []
   )
 
+  const onUpdateAssistantSettings = (settings: Partial<AssistantSettings>) => {
+    updateAssistantSettings(settings)
+  }
+
   const customParametersRef = useRef(customParameters)
 
   customParametersRef.current = customParameters
@@ -181,7 +187,15 @@ const AssistantModelSettings: FC<Props> = ({ assistant, updateAssistant, updateA
 
   const formatSliderTooltip = (value?: number) => {
     if (value === undefined) return ''
-    return value === 20 ? '∞' : value.toString()
+    return value.toString()
+  }
+
+  const validAndChangeContextCount = (contextCount, enableMaxContexts, EXTENDED_CONTEXT_LIMIT) => {
+    if ((typeof contextCount === 'number' ? contextCount : 0) > (enableMaxContexts ? EXTENDED_CONTEXT_LIMIT : 10)) {
+      return enableMaxContexts ? EXTENDED_CONTEXT_LIMIT : 10
+    } else {
+      return typeof contextCount === 'number' ? contextCount : 0
+    }
   }
 
   return (
@@ -292,26 +306,28 @@ const AssistantModelSettings: FC<Props> = ({ assistant, updateAssistant, updateA
         <Col span={20}>
           <Slider
             min={0}
-            max={20}
+            max={!enableMaxContexts ? 10 : EXTENDED_CONTEXT_LIMIT}
             onChange={setContextCount}
             onChangeComplete={onContextCountChange}
-            value={typeof contextCount === 'number' ? contextCount : 0}
-            marks={{ 0: '0', 5: '5', 10: '10', 15: '15', 20: t('chat.settings.max') }}
-            step={1}
+            value={validAndChangeContextCount(contextCount, enableMaxContexts, EXTENDED_CONTEXT_LIMIT)}
+            step={!enableMaxContexts ? 1 : 10}
             tooltip={{ formatter: formatSliderTooltip }}
           />
         </Col>
         <Col span={4}>
           <InputNumber
             min={0}
-            max={20}
-            step={1}
+            max={!enableMaxContexts ? 10 : EXTENDED_CONTEXT_LIMIT}
+            step={!enableMaxContexts ? 1 : 10}
             value={contextCount}
             changeOnBlur
             onChange={(value) => {
               if (!isNull(value)) {
                 setContextCount(value)
-                setTimeout(() => updateAssistantSettings({ contextCount: value }), 500)
+                setTimeout(() => {
+                  updateAssistantSettings({ contextCount: value })
+                  onUpdateAssistantSettings({ contextCount: value })
+                }, 500)
               }
             }}
             style={{ width: '100%' }}
@@ -319,6 +335,27 @@ const AssistantModelSettings: FC<Props> = ({ assistant, updateAssistant, updateA
         </Col>
       </Row>
       <Divider style={{ margin: '10px 0' }} />
+      <SettingRow style={{ minHeight: 30 }}>
+        <HStack alignItems="center">
+          <Label>{t('chat.settings.max_contexts')}</Label>
+        </HStack>
+        <Switch
+          checked={enableMaxContexts}
+          onChange={(checked) => {
+            setEnableMaxContexts(checked)
+            updateAssistantSettings({ enableMaxContexts: checked })
+            if (!checked && contextCount > 10) {
+              setContextCount(10)
+              onUpdateAssistantSettings({ contextCount: 10 })
+            }
+            EventEmitter.emit(EVENT_NAMES.MAX_CONTEXTS_CHANGED, {
+              check: checked,
+              context: contextCount
+            })
+          }}
+        />
+      </SettingRow>
+      <Divider style={{ margin: '10px 0' }} />
       <SettingRow style={{ minHeight: 30 }}>
         <HStack alignItems="center">
           <Label>{t('chat.settings.max_tokens')}</Label>
diff --git a/src/renderer/src/services/AssistantService.ts b/src/renderer/src/services/AssistantService.ts
index 418ce6b4a3..eb843ed8ff 100644
--- a/src/renderer/src/services/AssistantService.ts
+++ b/src/renderer/src/services/AssistantService.ts
@@ -102,7 +102,8 @@ export const getAssistantSettings = (assistant: Assistant): AssistantSettings =>
   }
 
   return {
-    contextCount: contextCount === 20 ? 100000 : contextCount,
+    enableMaxContexts: assistant?.settings?.enableMaxContexts ?? false,
+    contextCount: contextCount,
     temperature: assistant?.settings?.temperature ?? DEFAULT_TEMPERATURE,
     topP: assistant?.settings?.topP ?? 1,
     enableMaxTokens: assistant?.settings?.enableMaxTokens ?? false,
diff --git a/src/renderer/src/services/EventService.ts b/src/renderer/src/services/EventService.ts
index 309947c9bb..110e763177 100644
--- a/src/renderer/src/services/EventService.ts
+++ b/src/renderer/src/services/EventService.ts
@@ -26,5 +26,6 @@ export const EVENT_NAMES = {
   ADD_NEW_TOPIC: 'ADD_NEW_TOPIC',
   RESEND_MESSAGE: 'RESEND_MESSAGE',
   SHOW_MODEL_SELECTOR: 'SHOW_MODEL_SELECTOR',
-  QUOTE_TEXT: 'QUOTE_TEXT'
+  QUOTE_TEXT: 'QUOTE_TEXT',
+  MAX_CONTEXTS_CHANGED: 'MAX_CONTEXTS_CHANGED'
 }
diff --git a/src/renderer/src/services/MessagesService.ts b/src/renderer/src/services/MessagesService.ts
index d1dea18b9f..e8371b3108 100644
--- a/src/renderer/src/services/MessagesService.ts
+++ b/src/renderer/src/services/MessagesService.ts
@@ -41,9 +41,9 @@ export {
 
 export function getContextCount(assistant: Assistant, messages: Message[]) {
   const rawContextCount = assistant?.settings?.contextCount ?? DEFAULT_CONTEXTCOUNT
-  const maxContextCount = rawContextCount === 20 ? 100000 : rawContextCount
+  const maxContextCount = rawContextCount
 
-  const _messages = rawContextCount === 20 ? takeRight(messages, 1000) : takeRight(messages, maxContextCount)
+  const _messages = takeRight(messages, maxContextCount)
 
   const clearIndex = _messages.findLastIndex((message) => message.type === 'clear')
 
diff --git a/src/renderer/src/types/index.ts b/src/renderer/src/types/index.ts
index e66e629043..5b732847ba 100644
--- a/src/renderer/src/types/index.ts
+++ b/src/renderer/src/types/index.ts
@@ -51,6 +51,7 @@ export const EFFORT_RATIO: EffortRatio = {
 
 export type AssistantSettings = {
   contextCount: number
+  enableMaxContexts: boolean
   temperature: number
   topP: number
   maxTokens: number | undefined

From 79f66f0d50dbb83a2aaf88306f6214e22f56a3f0 Mon Sep 17 00:00:00 2001
From: George Zhao <38124587+CreatorZZY@users.noreply.github.com>
Date: Wed, 14 May 2025 20:08:47 +0800
Subject: [PATCH 32/50] fix: use EXTENDED_CONTEXT_STEP for slider step value in
 settings (#5989)

Co-authored-by: George Zhao <georgezhao@SKJLAB>
---
 src/renderer/src/config/constant.ts                   |  1 +
 src/renderer/src/pages/home/Tabs/SettingsTab.tsx      |  3 ++-
 .../AssistantSettings/AssistantModelSettings.tsx      | 11 ++++++++---
 3 files changed, 11 insertions(+), 4 deletions(-)

diff --git a/src/renderer/src/config/constant.ts b/src/renderer/src/config/constant.ts
index 7f26bff5b5..0240cac126 100644
--- a/src/renderer/src/config/constant.ts
+++ b/src/renderer/src/config/constant.ts
@@ -1,6 +1,7 @@
 export const DEFAULT_TEMPERATURE = 1.0
 export const DEFAULT_CONTEXTCOUNT = 5
 export const EXTENDED_CONTEXT_LIMIT = 100
+export const EXTENDED_CONTEXT_STEP = 1
 export const DEFAULT_MAX_TOKENS = 4096
 export const DEFAULT_KNOWLEDGE_DOCUMENT_COUNT = 6
 export const DEFAULT_KNOWLEDGE_THRESHOLD = 0.0
diff --git a/src/renderer/src/pages/home/Tabs/SettingsTab.tsx b/src/renderer/src/pages/home/Tabs/SettingsTab.tsx
index 0e69481210..6125f93b1a 100644
--- a/src/renderer/src/pages/home/Tabs/SettingsTab.tsx
+++ b/src/renderer/src/pages/home/Tabs/SettingsTab.tsx
@@ -6,6 +6,7 @@ import {
   DEFAULT_MAX_TOKENS,
   DEFAULT_TEMPERATURE,
   EXTENDED_CONTEXT_LIMIT,
+  EXTENDED_CONTEXT_STEP,
   isMac,
   isWindows
 } from '@renderer/config/constant'
@@ -219,7 +220,7 @@ const SettingsTab: FC<Props> = (props) => {
               onChange={setContextCount}
               onChangeComplete={onContextCountChange}
               value={validAndChangeContextCount(contextCount, enableMaxContexts, EXTENDED_CONTEXT_LIMIT)}
-              step={!enableMaxContexts ? 1 : 10}
+              step={!enableMaxContexts ? 1 : EXTENDED_CONTEXT_STEP}
               tooltip={{ formatter: formatSliderTooltip }}
             />
           </Col>
diff --git a/src/renderer/src/pages/settings/AssistantSettings/AssistantModelSettings.tsx b/src/renderer/src/pages/settings/AssistantSettings/AssistantModelSettings.tsx
index ac203189c1..5f33f4c164 100644
--- a/src/renderer/src/pages/settings/AssistantSettings/AssistantModelSettings.tsx
+++ b/src/renderer/src/pages/settings/AssistantSettings/AssistantModelSettings.tsx
@@ -2,7 +2,12 @@ import { DeleteOutlined, PlusOutlined, QuestionCircleOutlined } from '@ant-desig
 import ModelAvatar from '@renderer/components/Avatar/ModelAvatar'
 import { HStack } from '@renderer/components/Layout'
 import SelectModelPopup from '@renderer/components/Popups/SelectModelPopup'
-import { DEFAULT_CONTEXTCOUNT, DEFAULT_TEMPERATURE, EXTENDED_CONTEXT_LIMIT } from '@renderer/config/constant'
+import {
+  DEFAULT_CONTEXTCOUNT,
+  DEFAULT_TEMPERATURE,
+  EXTENDED_CONTEXT_LIMIT,
+  EXTENDED_CONTEXT_STEP
+} from '@renderer/config/constant'
 import { SettingRow } from '@renderer/pages/settings'
 import { EVENT_NAMES, EventEmitter } from '@renderer/services/EventService'
 import { Assistant, AssistantSettingCustomParameters, AssistantSettings } from '@renderer/types'
@@ -310,7 +315,7 @@ const AssistantModelSettings: FC<Props> = ({ assistant, updateAssistant, updateA
             onChange={setContextCount}
             onChangeComplete={onContextCountChange}
             value={validAndChangeContextCount(contextCount, enableMaxContexts, EXTENDED_CONTEXT_LIMIT)}
-            step={!enableMaxContexts ? 1 : 10}
+            step={!enableMaxContexts ? 1 : EXTENDED_CONTEXT_STEP}
             tooltip={{ formatter: formatSliderTooltip }}
           />
         </Col>
@@ -318,7 +323,7 @@ const AssistantModelSettings: FC<Props> = ({ assistant, updateAssistant, updateA
           <InputNumber
             min={0}
             max={!enableMaxContexts ? 10 : EXTENDED_CONTEXT_LIMIT}
-            step={!enableMaxContexts ? 1 : 10}
+            step={!enableMaxContexts ? 1 : EXTENDED_CONTEXT_STEP}
             value={contextCount}
             changeOnBlur
             onChange={(value) => {

From 729752f96a35e9cd90bb933b5f8de58861026e0d Mon Sep 17 00:00:00 2001
From: SuYao <sy20010504@gmail.com>
Date: Wed, 14 May 2025 20:53:08 +0800
Subject: [PATCH 33/50] fix: timing measurement before sending request (#5970)

---
 src/renderer/src/providers/AiProvider/GeminiProvider.ts | 4 +++-
 1 file changed, 3 insertions(+), 1 deletion(-)

diff --git a/src/renderer/src/providers/AiProvider/GeminiProvider.ts b/src/renderer/src/providers/AiProvider/GeminiProvider.ts
index be7707c4d2..b329116a7b 100644
--- a/src/renderer/src/providers/AiProvider/GeminiProvider.ts
+++ b/src/renderer/src/providers/AiProvider/GeminiProvider.ts
@@ -633,6 +633,9 @@ export default class GeminiProvider extends BaseProvider {
       }
     }
 
+    // 在发起请求之前开始计时
+    const start_time_millsec = new Date().getTime()
+
     if (!streamOutput) {
       const response = await chat.sendMessage({
         message: messageContents as PartUnion,
@@ -646,7 +649,6 @@ export default class GeminiProvider extends BaseProvider {
     }
 
     onChunk({ type: ChunkType.LLM_RESPONSE_CREATED })
-    const start_time_millsec = new Date().getTime()
     const userMessagesStream = await chat.sendMessageStream({
       message: messageContents as PartUnion,
       config: {

From 5b49f77965b57320fb8fdad8f63a858f296de447 Mon Sep 17 00:00:00 2001
From: SuYao <sy20010504@gmail.com>
Date: Wed, 14 May 2025 20:55:03 +0800
Subject: [PATCH 34/50] fix: enhance image block handling in message processing
 (#5971)

---
 src/renderer/src/config/models.ts             |   3 +
 .../providers/AiProvider/OpenAIProvider.ts    |   4 +-
 .../AiProvider/OpenAIResponseProvider.ts      | 137 ++++--------------
 src/renderer/src/store/thunk/messageThunk.ts  |  20 ++-
 4 files changed, 50 insertions(+), 114 deletions(-)

diff --git a/src/renderer/src/config/models.ts b/src/renderer/src/config/models.ts
index f00f2d1a88..5fe9b44525 100644
--- a/src/renderer/src/config/models.ts
+++ b/src/renderer/src/config/models.ts
@@ -2233,6 +2233,9 @@ export function isOpenAILLMModel(model: Model): boolean {
   if (!model) {
     return false
   }
+  if (model.id.includes('gpt-4o-image')) {
+    return false
+  }
   if (isOpenAIReasoningModel(model)) {
     return true
   }
diff --git a/src/renderer/src/providers/AiProvider/OpenAIProvider.ts b/src/renderer/src/providers/AiProvider/OpenAIProvider.ts
index e7a553cc24..81a9fa9caf 100644
--- a/src/renderer/src/providers/AiProvider/OpenAIProvider.ts
+++ b/src/renderer/src/providers/AiProvider/OpenAIProvider.ts
@@ -73,7 +73,7 @@ import {
 } from 'openai/resources'
 
 import { CompletionsParams } from '.'
-import { BaseOpenAiProvider } from './OpenAIResponseProvider'
+import { BaseOpenAIProvider } from './OpenAIResponseProvider'
 
 // 1. 定义联合类型
 export type OpenAIStreamChunk =
@@ -81,7 +81,7 @@ export type OpenAIStreamChunk =
   | { type: 'tool-calls'; delta: any }
   | { type: 'finish'; finishReason: any; usage: any; delta: any; chunk: any }
 
-export default class OpenAIProvider extends BaseOpenAiProvider {
+export default class OpenAIProvider extends BaseOpenAIProvider {
   constructor(provider: Provider) {
     super(provider)
 
diff --git a/src/renderer/src/providers/AiProvider/OpenAIResponseProvider.ts b/src/renderer/src/providers/AiProvider/OpenAIResponseProvider.ts
index db94c0df54..6cac0d0ab5 100644
--- a/src/renderer/src/providers/AiProvider/OpenAIResponseProvider.ts
+++ b/src/renderer/src/providers/AiProvider/OpenAIResponseProvider.ts
@@ -1,5 +1,4 @@
 import {
-  getOpenAIWebSearchParams,
   isOpenAILLMModel,
   isOpenAIReasoningModel,
   isOpenAIWebSearch,
@@ -53,8 +52,9 @@ import { FileLike, toFile } from 'openai/uploads'
 
 import { CompletionsParams } from '.'
 import BaseProvider from './BaseProvider'
+import OpenAIProvider from './OpenAIProvider'
 
-export abstract class BaseOpenAiProvider extends BaseProvider {
+export abstract class BaseOpenAIProvider extends BaseProvider {
   protected sdk: OpenAI
 
   constructor(provider: Provider) {
@@ -311,112 +311,7 @@ export abstract class BaseOpenAiProvider extends BaseProvider {
     const model = assistant.model || defaultModel
     const { contextCount, maxTokens, streamOutput, enableToolUse } = getAssistantSettings(assistant)
     const isEnabledBuiltinWebSearch = assistant.enableWebSearch
-    // 退回到 OpenAI 兼容模式
-    if (isOpenAIWebSearch(model)) {
-      const systemMessage = { role: 'system', content: assistant.prompt || '' }
-      const userMessages: ChatCompletionMessageParam[] = []
-      const _messages = filterUserRoleStartMessages(
-        filterEmptyMessages(filterContextMessages(takeRight(messages, contextCount + 1)))
-      )
-      onFilterMessages(_messages)
 
-      for (const message of _messages) {
-        userMessages.push(await this.getMessageParam(message, model))
-      }
-      //当 systemMessage 内容为空时不发送 systemMessage
-      let reqMessages: ChatCompletionMessageParam[]
-      if (!systemMessage.content) {
-        reqMessages = [...userMessages]
-      } else {
-        reqMessages = [systemMessage, ...userMessages].filter(Boolean) as ChatCompletionMessageParam[]
-      }
-      const lastUserMessage = _messages.findLast((m) => m.role === 'user')
-      const { abortController, cleanup, signalPromise } = this.createAbortController(lastUserMessage?.id, true)
-      const { signal } = abortController
-      const start_time_millsec = new Date().getTime()
-      const response = await this.sdk.chat.completions
-        // @ts-ignore key is not typed
-        .create(
-          {
-            model: model.id,
-            messages: reqMessages,
-            stream: true,
-            temperature: this.getTemperature(assistant, model),
-            top_p: this.getTopP(assistant, model),
-            max_tokens: maxTokens,
-            ...getOpenAIWebSearchParams(assistant, model),
-            ...this.getCustomParameters(assistant)
-          },
-          {
-            signal
-          }
-        )
-      const processStream = async (stream: any) => {
-        let content = ''
-        let isFirstChunk = true
-        const finalUsage: Usage = {
-          completion_tokens: 0,
-          prompt_tokens: 0,
-          total_tokens: 0
-        }
-
-        const finalMetrics: Metrics = {
-          completion_tokens: 0,
-          time_completion_millsec: 0,
-          time_first_token_millsec: 0
-        }
-        for await (const chunk of stream as any) {
-          if (window.keyv.get(EVENT_NAMES.CHAT_COMPLETION_PAUSED)) {
-            break
-          }
-          const delta = chunk.choices[0]?.delta
-          const finishReason = chunk.choices[0]?.finish_reason
-          if (delta?.content) {
-            if (isOpenAIWebSearch(model)) {
-              delta.content = convertLinks(delta.content || '', isFirstChunk)
-            }
-            if (isFirstChunk) {
-              isFirstChunk = false
-              finalMetrics.time_first_token_millsec = new Date().getTime() - start_time_millsec
-            }
-            content += delta.content
-            onChunk({ type: ChunkType.TEXT_DELTA, text: delta.content })
-          }
-          if (!isEmpty(finishReason) || chunk?.annotations) {
-            onChunk({ type: ChunkType.TEXT_COMPLETE, text: content })
-            finalMetrics.time_completion_millsec = new Date().getTime() - start_time_millsec
-            if (chunk.usage) {
-              const usage = chunk.usage as OpenAI.Completions.CompletionUsage
-              finalUsage.completion_tokens = usage.completion_tokens
-              finalUsage.prompt_tokens = usage.prompt_tokens
-              finalUsage.total_tokens = usage.total_tokens
-            }
-            finalMetrics.completion_tokens = finalUsage.completion_tokens
-          }
-          if (delta?.annotations) {
-            onChunk({
-              type: ChunkType.LLM_WEB_SEARCH_COMPLETE,
-              llm_web_search: {
-                results: delta.annotations,
-                source: WebSearchSource.OPENAI
-              }
-            })
-          }
-        }
-        onChunk({
-          type: ChunkType.BLOCK_COMPLETE,
-          response: {
-            usage: finalUsage,
-            metrics: finalMetrics
-          }
-        })
-      }
-      await processStream(response).finally(cleanup)
-      await signalPromise?.promise?.catch((error) => {
-        throw error
-      })
-      return
-    }
     let tools: OpenAI.Responses.Tool[] = []
     const toolChoices: OpenAI.Responses.ToolChoiceTypes = {
       type: 'web_search_preview'
@@ -1164,6 +1059,11 @@ export abstract class BaseOpenAiProvider extends BaseProvider {
         )
         images = images.concat(assistantImages.filter(Boolean) as FileLike[])
       }
+
+      onChunk({
+        type: ChunkType.LLM_RESPONSE_CREATED
+      })
+
       onChunk({
         type: ChunkType.IMAGE_CREATED
       })
@@ -1242,9 +1142,30 @@ export abstract class BaseOpenAiProvider extends BaseProvider {
   }
 }
 
-export default class OpenAIResponseProvider extends BaseOpenAiProvider {
+export default class OpenAIResponseProvider extends BaseOpenAIProvider {
+  private providers: Map<string, BaseOpenAIProvider> = new Map()
+
   constructor(provider: Provider) {
     super(provider)
+    this.providers.set('openai-compatible', new OpenAIProvider(provider))
+  }
+
+  private getProvider(model: Model): BaseOpenAIProvider {
+    if (isOpenAIWebSearch(model)) {
+      return this.providers.get('openai-compatible')!
+    } else {
+      return this
+    }
+  }
+
+  public completions(params: CompletionsParams): Promise<void> {
+    const model = params.assistant.model
+    if (!model) {
+      return Promise.reject(new Error('Model is required'))
+    }
+
+    const provider = this.getProvider(model)
+    return provider === this ? super.completions(params) : provider.completions(params)
   }
 
   public convertMcpTools<T>(mcpTools: MCPTool[]) {
diff --git a/src/renderer/src/store/thunk/messageThunk.ts b/src/renderer/src/store/thunk/messageThunk.ts
index 09311ae8ba..d090c392e9 100644
--- a/src/renderer/src/store/thunk/messageThunk.ts
+++ b/src/renderer/src/store/thunk/messageThunk.ts
@@ -536,10 +536,22 @@ const fetchAndProcessAssistantResponseImpl = async (
         }
       },
       onImageCreated: () => {
-        const imageBlock = createImageBlock(assistantMsgId, {
-          status: MessageBlockStatus.PROCESSING
-        })
-        handleBlockTransition(imageBlock, MessageBlockType.IMAGE)
+        if (lastBlockId) {
+          if (lastBlockType === MessageBlockType.UNKNOWN) {
+            const initialChanges: Partial<MessageBlock> = {
+              type: MessageBlockType.IMAGE,
+              status: MessageBlockStatus.STREAMING
+            }
+            lastBlockType = MessageBlockType.IMAGE
+            dispatch(updateOneBlock({ id: lastBlockId, changes: initialChanges }))
+            saveUpdatedBlockToDB(lastBlockId, assistantMsgId, topicId, getState)
+          } else {
+            const imageBlock = createImageBlock(assistantMsgId, {
+              status: MessageBlockStatus.PROCESSING
+            })
+            handleBlockTransition(imageBlock, MessageBlockType.IMAGE)
+          }
+        }
       },
       onImageGenerated: (imageData) => {
         const imageUrl = imageData.images?.[0] || 'placeholder_image_url'

From c3f3fe5b79668727bbf2f2fbf6b1740ca1a133d6 Mon Sep 17 00:00:00 2001
From: George Zhao <38124587+CreatorZZY@users.noreply.github.com>
Date: Wed, 14 May 2025 21:40:47 +0800
Subject: [PATCH 35/50] =?UTF-8?q?docs:=20=E8=B4=A1=E7=8C=AE=E8=80=85?=
 =?UTF-8?q?=E6=95=B0=E6=8D=AE=E6=BA=90=20(#5992)?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

更新贡献者数据源。
---
 README.md | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/README.md b/README.md
index efcc7db72c..96f727a96e 100644
--- a/README.md
+++ b/README.md
@@ -130,7 +130,7 @@ Thank you for your support and contributions!
 # 🚀 Contributors
 
 <a href="https://github.com/CherryHQ/cherry-studio/graphs/contributors">
-  <img src="https://contrib.rocks/image?repo=kangfenmao/cherry-studio" />
+  <img src="https://contrib.rocks/image?repo=CherryHQ/cherry-studio" />
 </a>
 <br /><br />
 

From 8f7c5eed75a2779e6561e8c568fc7b3ae5b47eac Mon Sep 17 00:00:00 2001
From: SuYao <sy20010504@gmail.com>
Date: Wed, 14 May 2025 22:08:04 +0800
Subject: [PATCH 36/50] fix: inaccurate temperature param (#5973)

* fix: inaccurate temperature param

* fix: enhance model support check for reasoning and web search models
---
 src/renderer/src/config/models.ts             | 12 +++++++
 .../providers/AiProvider/AnthropicProvider.ts | 28 ++++++---------
 .../src/providers/AiProvider/BaseProvider.ts  | 10 +++++-
 .../providers/AiProvider/GeminiProvider.ts    |  4 +--
 .../providers/AiProvider/OpenAIProvider.ts    | 36 +++++++------------
 .../AiProvider/OpenAIResponseProvider.ts      | 20 -----------
 6 files changed, 47 insertions(+), 63 deletions(-)

diff --git a/src/renderer/src/config/models.ts b/src/renderer/src/config/models.ts
index 5fe9b44525..be66317d88 100644
--- a/src/renderer/src/config/models.ts
+++ b/src/renderer/src/config/models.ts
@@ -2386,6 +2386,18 @@ export function isSupportedModel(model: OpenAI.Models.Model): boolean {
   return !NOT_SUPPORTED_REGEX.test(model.id)
 }
 
+export function isNotSupportTemperatureAndTopP(model: Model): boolean {
+  if (!model) {
+    return true
+  }
+
+  if (isOpenAIReasoningModel(model) || isOpenAIWebSearch(model)) {
+    return true
+  }
+
+  return false
+}
+
 export function isWebSearchModel(model: Model): boolean {
   if (!model) {
     return false
diff --git a/src/renderer/src/providers/AiProvider/AnthropicProvider.ts b/src/renderer/src/providers/AiProvider/AnthropicProvider.ts
index 79e7207e72..51f2eaff13 100644
--- a/src/renderer/src/providers/AiProvider/AnthropicProvider.ts
+++ b/src/renderer/src/providers/AiProvider/AnthropicProvider.ts
@@ -13,7 +13,7 @@ import {
   WebSearchToolResultError
 } from '@anthropic-ai/sdk/resources'
 import { DEFAULT_MAX_TOKENS } from '@renderer/config/constant'
-import { isReasoningModel, isWebSearchModel } from '@renderer/config/models'
+import { isClaudeReasoningModel, isReasoningModel, isWebSearchModel } from '@renderer/config/models'
 import { getStoreSetting } from '@renderer/hooks/useSettings'
 import i18n from '@renderer/i18n'
 import { getAssistantSettings, getDefaultModel, getTopNamingModel } from '@renderer/services/AssistantService'
@@ -152,24 +152,18 @@ export default class AnthropicProvider extends BaseProvider {
     } as WebSearchTool20250305
   }
 
-  /**
-   * Get the temperature
-   * @param assistant - The assistant
-   * @param model - The model
-   * @returns The temperature
-   */
-  private getTemperature(assistant: Assistant, model: Model) {
-    return isReasoningModel(model) ? undefined : assistant?.settings?.temperature
+  override getTemperature(assistant: Assistant, model: Model): number | undefined {
+    if (assistant.settings?.reasoning_effort && isClaudeReasoningModel(model)) {
+      return undefined
+    }
+    return assistant.settings?.temperature
   }
 
-  /**
-   * Get the top P
-   * @param assistant - The assistant
-   * @param model - The model
-   * @returns The top P
-   */
-  private getTopP(assistant: Assistant, model: Model) {
-    return isReasoningModel(model) ? undefined : assistant?.settings?.topP
+  override getTopP(assistant: Assistant, model: Model): number | undefined {
+    if (assistant.settings?.reasoning_effort && isClaudeReasoningModel(model)) {
+      return undefined
+    }
+    return assistant.settings?.topP
   }
 
   /**
diff --git a/src/renderer/src/providers/AiProvider/BaseProvider.ts b/src/renderer/src/providers/AiProvider/BaseProvider.ts
index 5773550022..48c1e34839 100644
--- a/src/renderer/src/providers/AiProvider/BaseProvider.ts
+++ b/src/renderer/src/providers/AiProvider/BaseProvider.ts
@@ -1,5 +1,5 @@
 import Logger from '@renderer/config/logger'
-import { isFunctionCallingModel } from '@renderer/config/models'
+import { isFunctionCallingModel, isNotSupportTemperatureAndTopP } from '@renderer/config/models'
 import { REFERENCE_PROMPT } from '@renderer/config/prompts'
 import { getLMStudioKeepAliveTime } from '@renderer/hooks/useLMStudio'
 import type {
@@ -103,6 +103,14 @@ export default abstract class BaseProvider {
     return this.provider.id === 'lmstudio' ? getLMStudioKeepAliveTime() : undefined
   }
 
+  public getTemperature(assistant: Assistant, model: Model): number | undefined {
+    return isNotSupportTemperatureAndTopP(model) ? undefined : assistant.settings?.temperature
+  }
+
+  public getTopP(assistant: Assistant, model: Model): number | undefined {
+    return isNotSupportTemperatureAndTopP(model) ? undefined : assistant.settings?.topP
+  }
+
   public async fakeCompletions({ onChunk }: CompletionsParams) {
     for (let i = 0; i < 100; i++) {
       await delay(0.01)
diff --git a/src/renderer/src/providers/AiProvider/GeminiProvider.ts b/src/renderer/src/providers/AiProvider/GeminiProvider.ts
index b329116a7b..03656645a2 100644
--- a/src/renderer/src/providers/AiProvider/GeminiProvider.ts
+++ b/src/renderer/src/providers/AiProvider/GeminiProvider.ts
@@ -379,8 +379,8 @@ export default class GeminiProvider extends BaseProvider {
       safetySettings: this.getSafetySettings(),
       // generate image don't need system instruction
       systemInstruction: isGemmaModel(model) ? undefined : systemInstruction,
-      temperature: assistant?.settings?.temperature,
-      topP: assistant?.settings?.topP,
+      temperature: this.getTemperature(assistant, model),
+      topP: this.getTopP(assistant, model),
       maxOutputTokens: maxTokens,
       tools: tools,
       ...this.getBudgetToken(assistant, model),
diff --git a/src/renderer/src/providers/AiProvider/OpenAIProvider.ts b/src/renderer/src/providers/AiProvider/OpenAIProvider.ts
index 81a9fa9caf..ab48778158 100644
--- a/src/renderer/src/providers/AiProvider/OpenAIProvider.ts
+++ b/src/renderer/src/providers/AiProvider/OpenAIProvider.ts
@@ -1,9 +1,9 @@
 import {
   findTokenLimit,
   getOpenAIWebSearchParams,
+  isClaudeReasoningModel,
   isHunyuanSearchModel,
   isOpenAIReasoningModel,
-  isOpenAIWebSearch,
   isReasoningModel,
   isSupportedModel,
   isSupportedReasoningEffortGrokModel,
@@ -192,14 +192,18 @@ export default class OpenAIProvider extends BaseOpenAIProvider {
     } as ChatCompletionMessageParam
   }
 
-  /**
-   * Get the temperature for the assistant
-   * @param assistant - The assistant
-   * @param model - The model
-   * @returns The temperature
-   */
-  override getTemperature(assistant: Assistant, model: Model) {
-    return isReasoningModel(model) || isOpenAIWebSearch(model) ? undefined : assistant?.settings?.temperature
+  override getTemperature(assistant: Assistant, model: Model): number | undefined {
+    if (isOpenAIReasoningModel(model) || (assistant.settings?.reasoning_effort && isClaudeReasoningModel(model))) {
+      return undefined
+    }
+    return assistant.settings?.temperature
+  }
+
+  override getTopP(assistant: Assistant, model: Model): number | undefined {
+    if (isOpenAIReasoningModel(model) || (assistant.settings?.reasoning_effort && isClaudeReasoningModel(model))) {
+      return undefined
+    }
+    return assistant.settings?.topP
   }
 
   /**
@@ -229,20 +233,6 @@ export default class OpenAIProvider extends BaseOpenAIProvider {
     return {}
   }
 
-  /**
-   * Get the top P for the assistant
-   * @param assistant - The assistant
-   * @param model - The model
-   * @returns The top P
-   */
-  override getTopP(assistant: Assistant, model: Model) {
-    if (isReasoningModel(model) || isOpenAIWebSearch(model)) {
-      return undefined
-    }
-
-    return assistant?.settings?.topP
-  }
-
   /**
    * Get the reasoning effort for the assistant
    * @param assistant - The assistant
diff --git a/src/renderer/src/providers/AiProvider/OpenAIResponseProvider.ts b/src/renderer/src/providers/AiProvider/OpenAIResponseProvider.ts
index 6cac0d0ab5..4d9a6f57bf 100644
--- a/src/renderer/src/providers/AiProvider/OpenAIResponseProvider.ts
+++ b/src/renderer/src/providers/AiProvider/OpenAIResponseProvider.ts
@@ -191,26 +191,6 @@ export abstract class BaseOpenAIProvider extends BaseProvider {
     return 5 * 1000 * 60
   }
 
-  /**
-   * Get the temperature for the assistant
-   * @param assistant - The assistant
-   * @param model - The model
-   * @returns The temperature
-   */
-  protected getTemperature(assistant: Assistant, model: Model) {
-    return isOpenAIReasoningModel(model) || isOpenAILLMModel(model) ? undefined : assistant?.settings?.temperature
-  }
-
-  /**
-   * Get the top P for the assistant
-   * @param assistant - The assistant
-   * @param model - The model
-   * @returns The top P
-   */
-  protected getTopP(assistant: Assistant, model: Model) {
-    return isOpenAIReasoningModel(model) || isOpenAILLMModel(model) ? undefined : assistant?.settings?.topP
-  }
-
   private getResponseReasoningEffort(assistant: Assistant, model: Model) {
     if (!isSupportedReasoningEffortOpenAIModel(model)) {
       return {}

From 5e0080c5a1dbe9313e3b959591b0e164d0fb9a3c Mon Sep 17 00:00:00 2001
From: George Zhao <38124587+CreatorZZY@users.noreply.github.com>
Date: Wed, 14 May 2025 23:35:02 +0800
Subject: [PATCH 37/50] feat: add support for allowing Escape key to exit
 fullscreen mode (#5930)
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

* feat: add support for allowing Escape key to exit fullscreen mode

* feat(i18n): add translation for allowing ESC key to exit fullscreen mode in multiple locales

* feat: enable Escape key to exit fullscreen mode regardless of platform

* feat: 添加允许使用Escape键退出全屏模式的功能，并更新相关国际化支持

* fix: 修复全屏模式下Escape键退出功能的状态管理，移除相关设置项

* feat: 添加全屏状态管理功能至导航栏，更新右侧导航栏组件以支持全屏模式

* feat: 更新导航栏以支持全屏模式，调整右侧导航栏的内边距

* fix: 更新全屏模式下Escape键退出功能的默认设置为启用

* refactor: 移除全屏模式下Escape键退出功能的状态管理逻辑

* fix: 移除全屏模式下Escape键退出功能的调试日志

* feat: 添加全屏模式下Escape键的快捷键配置，默认启用

* refactor: 移除与全屏模式下Escape键退出功能相关的IPC通道和配置

* refactor: 移除全屏模式下Escape键退出功能的配置项

* refactor: 移除Navbar和McpSettingsNavbar中与全屏模式相关的代码

* refactor: 移动exit_fullscreen快捷键配置到shortcuts数组末尾

* refactor: 添加全屏模式下快捷键未设置时直接退出全屏的逻辑

* refactor: 添加全屏模式下快捷键未设置时直接退出全屏的逻辑

* refactor: remove unused useFullscreen hook

* refactor: remove 'allow ESC key to exit fullscreen mode' translations from multiple locale files

---------

Co-authored-by: George Zhao <georgezhao@SKJLAB>
---
 src/main/services/WindowService.ts       | 17 ++++++++++++++---
 src/renderer/src/i18n/locales/en-us.json |  1 +
 src/renderer/src/i18n/locales/ja-jp.json |  1 +
 src/renderer/src/i18n/locales/ru-ru.json |  1 +
 src/renderer/src/i18n/locales/zh-cn.json |  1 +
 src/renderer/src/store/migrate.ts        | 16 ++++++++++++++++
 src/renderer/src/store/shortcuts.ts      |  7 +++++++
 7 files changed, 41 insertions(+), 3 deletions(-)

diff --git a/src/main/services/WindowService.ts b/src/main/services/WindowService.ts
index bac15cca07..aff511d748 100644
--- a/src/main/services/WindowService.ts
+++ b/src/main/services/WindowService.ts
@@ -198,10 +198,21 @@ export class WindowService {
       // 当按下Escape键且窗口处于全屏状态时退出全屏
       if (input.key === 'Escape' && !input.alt && !input.control && !input.meta && !input.shift) {
         if (mainWindow.isFullScreen()) {
-          event.preventDefault()
-          mainWindow.setFullScreen(false)
+          // 获取 shortcuts 配置
+          const shortcuts = configManager.getShortcuts()
+          const exitFullscreenShortcut = shortcuts.find((s) => s.key === 'exit_fullscreen')
+          if (exitFullscreenShortcut == undefined) {
+            mainWindow.setFullScreen(false)
+            return
+          }
+          if (exitFullscreenShortcut?.enabled) {
+            event.preventDefault()
+            mainWindow.setFullScreen(false)
+            return
+          }
         }
       }
+      return
     })
   }
 
@@ -306,7 +317,7 @@ export class WindowService {
 
       /**
        * 上述逻辑以下:
-       * win/linux: 是“开启托盘+设置关闭时最小化到托盘”的情况
+       * win/linux: 是"开启托盘+设置关闭时最小化到托盘"的情况
        * mac: 任何情况都会到这里，因此需要单独处理mac
        */
 
diff --git a/src/renderer/src/i18n/locales/en-us.json b/src/renderer/src/i18n/locales/en-us.json
index f2cd67fe8e..4b3d496a95 100644
--- a/src/renderer/src/i18n/locales/en-us.json
+++ b/src/renderer/src/i18n/locales/en-us.json
@@ -1530,6 +1530,7 @@
         "clear_shortcut": "Clear Shortcut",
         "clear_topic": "Clear Messages",
         "copy_last_message": "Copy Last Message",
+        "exit_fullscreen": "Exit Fullscreen",
         "key": "Key",
         "mini_window": "Quick Assistant",
         "new_topic": "New Topic",
diff --git a/src/renderer/src/i18n/locales/ja-jp.json b/src/renderer/src/i18n/locales/ja-jp.json
index 641c8116e3..e8c2108ba7 100644
--- a/src/renderer/src/i18n/locales/ja-jp.json
+++ b/src/renderer/src/i18n/locales/ja-jp.json
@@ -1526,6 +1526,7 @@
         "clear_shortcut": "ショートカットをクリア",
         "clear_topic": "メッセージを消去",
         "copy_last_message": "最後のメッセージをコピー",
+        "exit_fullscreen": "フルスクリーンを終了",
         "key": "キー",
         "mini_window": "クイックアシスタント",
         "new_topic": "新しいトピック",
diff --git a/src/renderer/src/i18n/locales/ru-ru.json b/src/renderer/src/i18n/locales/ru-ru.json
index 8b52c52722..433c2047b5 100644
--- a/src/renderer/src/i18n/locales/ru-ru.json
+++ b/src/renderer/src/i18n/locales/ru-ru.json
@@ -1526,6 +1526,7 @@
         "clear_shortcut": "Очистить сочетание клавиш",
         "clear_topic": "Очистить все сообщения",
         "copy_last_message": "Копировать последнее сообщение",
+        "exit_fullscreen": "Выйти из полноэкранного режима",
         "key": "Клавиша",
         "mini_window": "Быстрый помощник",
         "new_topic": "Новый топик",
diff --git a/src/renderer/src/i18n/locales/zh-cn.json b/src/renderer/src/i18n/locales/zh-cn.json
index 52f3f5930f..9fc89be591 100644
--- a/src/renderer/src/i18n/locales/zh-cn.json
+++ b/src/renderer/src/i18n/locales/zh-cn.json
@@ -1530,6 +1530,7 @@
         "clear_shortcut": "清除快捷键",
         "clear_topic": "清空消息",
         "copy_last_message": "复制上一条消息",
+        "exit_fullscreen": "退出全屏",
         "key": "按键",
         "mini_window": "快捷助手",
         "new_topic": "新建话题",
diff --git a/src/renderer/src/store/migrate.ts b/src/renderer/src/store/migrate.ts
index 4e60ee922b..9ed708248b 100644
--- a/src/renderer/src/store/migrate.ts
+++ b/src/renderer/src/store/migrate.ts
@@ -1316,6 +1316,22 @@ const migrateConfig = {
     } catch (error) {
       return state
     }
+  },
+  '101': (state: RootState) => {
+    try {
+      if (state.shortcuts) {
+        state.shortcuts.shortcuts.push({
+          key: 'exit_fullscreen',
+          shortcut: ['Escape'],
+          editable: false,
+          enabled: true,
+          system: true
+        })
+      }
+      return state
+    } catch (error) {
+      return state
+    }
   }
 }
 
diff --git a/src/renderer/src/store/shortcuts.ts b/src/renderer/src/store/shortcuts.ts
index 03f7eaee3c..cafe278856 100644
--- a/src/renderer/src/store/shortcuts.ts
+++ b/src/renderer/src/store/shortcuts.ts
@@ -79,6 +79,13 @@ const initialState: ShortcutsState = {
       editable: true,
       enabled: true,
       system: false
+    },
+    {
+      key: 'exit_fullscreen',
+      shortcut: ['Escape'],
+      editable: false,
+      enabled: true,
+      system: true
     }
   ]
 }

From 596532a8c8338db4bdda6a46094e763b54c72984 Mon Sep 17 00:00:00 2001
From: Konv Suu <2583695112@qq.com>
Date: Wed, 14 May 2025 23:38:19 +0800
Subject: [PATCH 38/50] fix: strange corner style in miniapp pop up (#5976)

* fix: strange corner style in miniapp pop up
---
 src/renderer/src/components/MinApp/MinappPopupContainer.tsx | 5 ++++-
 src/renderer/src/hooks/useAppInit.ts                        | 3 ++-
 2 files changed, 6 insertions(+), 2 deletions(-)

diff --git a/src/renderer/src/components/MinApp/MinappPopupContainer.tsx b/src/renderer/src/components/MinApp/MinappPopupContainer.tsx
index 3b728fa307..a2dd31cfab 100644
--- a/src/renderer/src/components/MinApp/MinappPopupContainer.tsx
+++ b/src/renderer/src/components/MinApp/MinappPopupContainer.tsx
@@ -367,7 +367,10 @@ const MinappPopupContainer: React.FC = () => {
       height={'100%'}
       maskClosable={false}
       closeIcon={null}
-      style={{ marginLeft: 'var(--sidebar-width)', backgroundColor: 'var(--color-background)' }}>
+      style={{
+        marginLeft: 'var(--sidebar-width)',
+        backgroundColor: window.root.style.background
+      }}>
       {!isReady && (
         <EmptyView>
           <Avatar
diff --git a/src/renderer/src/hooks/useAppInit.ts b/src/renderer/src/hooks/useAppInit.ts
index b31c325400..c42752ff00 100644
--- a/src/renderer/src/hooks/useAppInit.ts
+++ b/src/renderer/src/hooks/useAppInit.ts
@@ -61,7 +61,8 @@ export function useAppInit() {
     const transparentWindow = windowStyle === 'transparent' && isMac && !minappShow
 
     if (minappShow) {
-      window.root.style.background = theme === 'dark' ? 'var(--color-black)' : 'var(--color-white)'
+      window.root.style.background =
+        windowStyle === 'transparent' && isMac ? 'var(--color-background)' : 'var(--navbar-background)'
       return
     }
 

From 9262f92bffd886d0684eb0c1a2f49f3fe1325168 Mon Sep 17 00:00:00 2001
From: MyPrototypeWhat <43230886+MyPrototypeWhat@users.noreply.github.com>
Date: Wed, 14 May 2025 23:44:48 +0800
Subject: [PATCH 39/50] =?UTF-8?q?refactor:=20update=20ImageBlockGroup=20la?=
 =?UTF-8?q?yout=20to=20use=20CSS=20grid=20for=20better=20re=E2=80=A6=20(#5?=
 =?UTF-8?q?998)?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

refactor: update ImageBlockGroup layout to use CSS grid for better responsiveness
---
 .../src/pages/home/Messages/Blocks/index.tsx     | 16 ++++++++++------
 1 file changed, 10 insertions(+), 6 deletions(-)

diff --git a/src/renderer/src/pages/home/Messages/Blocks/index.tsx b/src/renderer/src/pages/home/Messages/Blocks/index.tsx
index c7233089bc..4f5350be3c 100644
--- a/src/renderer/src/pages/home/Messages/Blocks/index.tsx
+++ b/src/renderer/src/pages/home/Messages/Blocks/index.tsx
@@ -162,15 +162,19 @@ const MessageBlockRenderer: React.FC<Props> = ({ blocks, message }) => {
 export default React.memo(MessageBlockRenderer)
 
 const ImageBlockGroup = styled.div`
-  display: flex;
-  flex-wrap: wrap;
-  justify-content: flex-start;
-  align-items: center;
+  display: grid;
+  grid-template-columns: repeat(3, minmax(200px, 1fr));
   gap: 8px;
   width: 100%;
-  margin: 8px 0;
+  max-width: 960px;
   > * {
-    flex: 0 0 auto;
     min-width: 200px;
   }
+  @media (min-width: 1536px) {
+    grid-template-columns: repeat(4, minmax(250px, 1fr));
+    max-width: 1280px;
+    > * {
+      min-width: 250px;
+    }
+  }
 `

From c7a15d291e51d9be971741a3f4d5d0ea7db00062 Mon Sep 17 00:00:00 2001
From: one <wangan.cs@gmail.com>
Date: Thu, 15 May 2025 01:42:18 +0800
Subject: [PATCH 40/50] fix: update current topic id and support EmojiAvatar
 for ChatFlowHistory (#5861)

* fix: update current topic id for ChatFlowHistory to work

* refactor: set current topic id early in loadTopicMessagesThunk

* refactor: extract EmojiAvatar

* fix: style
---
 .../src/components/Avatar/EmojiAvatar.tsx     | 52 +++++++++++++++++++
 .../src/components/Popups/UserPopup.tsx       | 26 +++-------
 src/renderer/src/components/app/Sidebar.tsx   | 28 ++++------
 .../pages/home/Messages/ChatFlowHistory.tsx   | 11 +++-
 .../pages/home/Messages/MessageAnchorLine.tsx | 24 ++++-----
 .../src/pages/home/Messages/MessageHeader.tsx | 19 ++-----
 src/renderer/src/store/thunk/messageThunk.ts  |  1 +
 7 files changed, 95 insertions(+), 66 deletions(-)
 create mode 100644 src/renderer/src/components/Avatar/EmojiAvatar.tsx

diff --git a/src/renderer/src/components/Avatar/EmojiAvatar.tsx b/src/renderer/src/components/Avatar/EmojiAvatar.tsx
new file mode 100644
index 0000000000..553869698a
--- /dev/null
+++ b/src/renderer/src/components/Avatar/EmojiAvatar.tsx
@@ -0,0 +1,52 @@
+import React, { memo } from 'react'
+import styled from 'styled-components'
+
+interface EmojiAvatarProps {
+  children: string
+  size?: number
+  fontSize?: number
+  onClick?: React.MouseEventHandler<HTMLDivElement>
+  className?: string
+  style?: React.CSSProperties
+}
+
+const EmojiAvatar = ({
+  ref,
+  children,
+  size = 31,
+  fontSize,
+  onClick,
+  className,
+  style
+}: EmojiAvatarProps & { ref?: React.RefObject<HTMLDivElement | null> }) => (
+  <StyledEmojiAvatar
+    ref={ref}
+    $size={size}
+    $fontSize={fontSize ?? size * 0.5}
+    onClick={onClick}
+    className={className}
+    style={style}>
+    {children}
+  </StyledEmojiAvatar>
+)
+
+EmojiAvatar.displayName = 'EmojiAvatar'
+
+const StyledEmojiAvatar = styled.div<{ $size: number; $fontSize: number }>`
+  display: flex;
+  align-items: center;
+  justify-content: center;
+  background-color: var(--color-background-soft);
+  border: 0.5px solid var(--color-border);
+  border-radius: 20%;
+  cursor: pointer;
+  width: ${(props) => props.$size}px;
+  height: ${(props) => props.$size}px;
+  font-size: ${(props) => props.$fontSize}px;
+  transition: opacity 0.3s ease;
+  &:hover {
+    opacity: 0.8;
+  }
+`
+
+export default memo(EmojiAvatar)
diff --git a/src/renderer/src/components/Popups/UserPopup.tsx b/src/renderer/src/components/Popups/UserPopup.tsx
index 9d7569effa..ac4b9eca93 100644
--- a/src/renderer/src/components/Popups/UserPopup.tsx
+++ b/src/renderer/src/components/Popups/UserPopup.tsx
@@ -1,4 +1,5 @@
 import DefaultAvatar from '@renderer/assets/images/avatar.png'
+import EmojiAvatar from '@renderer/components/Avatar/EmojiAvatar'
 import useAvatar from '@renderer/hooks/useAvatar'
 import { useSettings } from '@renderer/hooks/useSettings'
 import ImageStorage from '@renderer/services/ImageStorage'
@@ -154,7 +155,13 @@ const PopupContainer: React.FC<Props> = ({ resolve }) => {
                 }
               }}
               placement="bottom">
-              {isEmoji(avatar) ? <EmojiAvatar>{avatar}</EmojiAvatar> : <UserAvatar src={avatar} />}
+              {isEmoji(avatar) ? (
+                <EmojiAvatar size={80} fontSize={40}>
+                  {avatar}
+                </EmojiAvatar>
+              ) : (
+                <UserAvatar src={avatar} />
+              )}
             </Popover>
           </Dropdown>
         </VStack>
@@ -182,23 +189,6 @@ const UserAvatar = styled(Avatar)`
   }
 `
 
-const EmojiAvatar = styled.div`
-  cursor: pointer;
-  width: 80px;
-  height: 80px;
-  border-radius: 20%;
-  background-color: var(--color-background-soft);
-  display: flex;
-  align-items: center;
-  justify-content: center;
-  font-size: 40px;
-  transition: opacity 0.3s ease;
-  border: 0.5px solid var(--color-border);
-  &:hover {
-    opacity: 0.8;
-  }
-`
-
 export default class UserPopup {
   static topviewId = 0
   static hide() {
diff --git a/src/renderer/src/components/app/Sidebar.tsx b/src/renderer/src/components/app/Sidebar.tsx
index 8b50bdd7d2..c319123d29 100644
--- a/src/renderer/src/components/app/Sidebar.tsx
+++ b/src/renderer/src/components/app/Sidebar.tsx
@@ -1,3 +1,4 @@
+import EmojiAvatar from '@renderer/components/Avatar/EmojiAvatar'
 import { isMac } from '@renderer/config/constant'
 import { AppLogo, UserAvatar } from '@renderer/config/env'
 import { useTheme } from '@renderer/context/ThemeProvider'
@@ -70,7 +71,9 @@ const Sidebar: FC = () => {
   return (
     <Container id="app-sidebar" style={{ backgroundColor, zIndex: minappShow ? 10000 : 'initial' }}>
       {isEmoji(avatar) ? (
-        <EmojiAvatar onClick={onEditUser}>{avatar}</EmojiAvatar>
+        <EmojiAvatar onClick={onEditUser} className="sidebar-avatar" size={31} fontSize={18}>
+          {avatar}
+        </EmojiAvatar>
       ) : (
         <AvatarImg src={avatar || UserAvatar} draggable={false} className="nodrag" onClick={onEditUser} />
       )}
@@ -319,6 +322,12 @@ const Container = styled.div`
   height: ${isMac ? 'calc(100vh - var(--navbar-height))' : '100vh'};
   -webkit-app-region: drag !important;
   margin-top: ${isMac ? 'var(--navbar-height)' : 0};
+
+  .sidebar-avatar {
+    margin-bottom: ${isMac ? '12px' : '12px'};
+    margin-top: ${isMac ? '0px' : '2px'};
+    -webkit-app-region: none;
+  }
 `
 
 const AvatarImg = styled(Avatar)`
@@ -331,23 +340,6 @@ const AvatarImg = styled(Avatar)`
   cursor: pointer;
 `
 
-const EmojiAvatar = styled.div`
-  width: 31px;
-  height: 31px;
-  background-color: var(--color-background-soft);
-  margin-bottom: ${isMac ? '12px' : '12px'};
-  margin-top: ${isMac ? '0px' : '2px'};
-  border-radius: 20%;
-  display: flex;
-  align-items: center;
-  justify-content: center;
-  font-size: 16px;
-  cursor: pointer;
-  -webkit-app-region: none;
-  border: 0.5px solid var(--color-border);
-  font-size: 20px;
-`
-
 const MainMenusContainer = styled.div`
   display: flex;
   flex: 1;
diff --git a/src/renderer/src/pages/home/Messages/ChatFlowHistory.tsx b/src/renderer/src/pages/home/Messages/ChatFlowHistory.tsx
index 73a3208ca2..99d3c51193 100644
--- a/src/renderer/src/pages/home/Messages/ChatFlowHistory.tsx
+++ b/src/renderer/src/pages/home/Messages/ChatFlowHistory.tsx
@@ -1,14 +1,17 @@
 import '@xyflow/react/dist/style.css'
 
 import { RobotOutlined, UserOutlined } from '@ant-design/icons'
+import EmojiAvatar from '@renderer/components/Avatar/EmojiAvatar'
 import ModelAvatar from '@renderer/components/Avatar/ModelAvatar'
 import { getModelLogo } from '@renderer/config/models'
 import { useTheme } from '@renderer/context/ThemeProvider'
+import useAvatar from '@renderer/hooks/useAvatar'
 import { useSettings } from '@renderer/hooks/useSettings'
 import { EVENT_NAMES, EventEmitter } from '@renderer/services/EventService'
 import { RootState } from '@renderer/store'
 import { selectMessagesForTopic } from '@renderer/store/newMessage'
 import { Model } from '@renderer/types'
+import { isEmoji } from '@renderer/utils'
 import { getMainTextContent } from '@renderer/utils/messageUtils/find'
 import { Controls, Handle, MiniMap, ReactFlow, ReactFlowProvider } from '@xyflow/react'
 import { Edge, Node, NodeTypes, Position, useEdgesState, useNodesState } from '@xyflow/react'
@@ -63,7 +66,11 @@ const CustomNode: FC<{ data: any }> = ({ data }) => {
 
     // 用户头像
     if (data.userAvatar) {
-      avatar = <Avatar src={data.userAvatar} alt={title} />
+      if (isEmoji(data.userAvatar)) {
+        avatar = <EmojiAvatar size={32}>{data.userAvatar}</EmojiAvatar>
+      } else {
+        avatar = <Avatar src={data.userAvatar} alt={title} />
+      }
     } else {
       avatar = <Avatar icon={<UserOutlined />} style={{ backgroundColor: 'var(--color-info)' }} />
     }
@@ -221,7 +228,7 @@ const ChatFlowHistory: FC<ChatFlowHistoryProps> = ({ conversationId }) => {
   )
 
   // 获取用户头像
-  const userAvatar = useSelector((state: RootState) => state.runtime.avatar)
+  const userAvatar = useAvatar()
 
   // 消息过滤
   const { userMessages, assistantMessages } = useMemo(() => {
diff --git a/src/renderer/src/pages/home/Messages/MessageAnchorLine.tsx b/src/renderer/src/pages/home/Messages/MessageAnchorLine.tsx
index adffe18737..258c9d264e 100644
--- a/src/renderer/src/pages/home/Messages/MessageAnchorLine.tsx
+++ b/src/renderer/src/pages/home/Messages/MessageAnchorLine.tsx
@@ -1,4 +1,5 @@
 import { DownOutlined } from '@ant-design/icons'
+import EmojiAvatar from '@renderer/components/Avatar/EmojiAvatar'
 import { APP_NAME, AppLogo, isLocalAi } from '@renderer/config/env'
 import { getModelLogo } from '@renderer/config/models'
 import { useTheme } from '@renderer/context/ThemeProvider'
@@ -16,6 +17,7 @@ import { Avatar } from 'antd'
 import { type FC, useCallback, useEffect, useRef, useState } from 'react'
 import { useTranslation } from 'react-i18next'
 import styled from 'styled-components'
+
 interface MessageLineProps {
   messages: Message[]
 }
@@ -230,7 +232,15 @@ const MessageAnchorLine: FC<MessageLineProps> = ({ messages }) => {
               ) : (
                 <>
                   {isEmoji(avatar) ? (
-                    <EmojiAvatar size={size}>{avatar}</EmojiAvatar>
+                    <EmojiAvatar
+                      size={size}
+                      fontSize={size * 0.6}
+                      style={{
+                        cursor: 'default',
+                        pointerEvents: 'none'
+                      }}>
+                      {avatar}
+                    </EmojiAvatar>
                   ) : (
                     <Avatar src={avatar} size={size} />
                   )}
@@ -314,16 +324,4 @@ const MessageItemContent = styled.div`
   max-width: 200px;
 `
 
-const EmojiAvatar = styled.div<{ size: number }>`
-  width: ${(props) => props.size}px;
-  height: ${(props) => props.size}px;
-  background-color: var(--color-background-soft);
-  border-radius: 20%;
-  display: flex;
-  align-items: center;
-  justify-content: center;
-  font-size: ${(props) => props.size * 0.6}px;
-  border: 0.5px solid var(--color-border);
-`
-
 export default MessageAnchorLine
diff --git a/src/renderer/src/pages/home/Messages/MessageHeader.tsx b/src/renderer/src/pages/home/Messages/MessageHeader.tsx
index cf25fd36f1..eaed4b08a5 100644
--- a/src/renderer/src/pages/home/Messages/MessageHeader.tsx
+++ b/src/renderer/src/pages/home/Messages/MessageHeader.tsx
@@ -1,3 +1,4 @@
+import EmojiAvatar from '@renderer/components/Avatar/EmojiAvatar'
 import UserPopup from '@renderer/components/Popups/UserPopup'
 import { APP_NAME, AppLogo, isLocalAi } from '@renderer/config/env'
 import { getModelLogo } from '@renderer/config/models'
@@ -87,7 +88,9 @@ const MessageHeader: FC<Props> = memo(({ assistant, model, message }) => {
         ) : (
           <>
             {isEmoji(avatar) ? (
-              <EmojiAvatar onClick={() => UserPopup.show()}>{avatar}</EmojiAvatar>
+              <EmojiAvatar onClick={() => UserPopup.show()} size={35} fontSize={20}>
+                {avatar}
+              </EmojiAvatar>
             ) : (
               <Avatar
                 src={avatar}
@@ -111,20 +114,6 @@ const MessageHeader: FC<Props> = memo(({ assistant, model, message }) => {
 
 MessageHeader.displayName = 'MessageHeader'
 
-const EmojiAvatar = styled.div`
-  width: 35px;
-  height: 35px;
-  background-color: var(--color-background-soft);
-  border-radius: 20%;
-  display: flex;
-  align-items: center;
-  justify-content: center;
-  font-size: 18px;
-  cursor: pointer;
-  border: 0.5px solid var(--color-border);
-  font-size: 20px;
-`
-
 const Container = styled.div`
   display: flex;
   flex-direction: row;
diff --git a/src/renderer/src/store/thunk/messageThunk.ts b/src/renderer/src/store/thunk/messageThunk.ts
index d090c392e9..95019b02ed 100644
--- a/src/renderer/src/store/thunk/messageThunk.ts
+++ b/src/renderer/src/store/thunk/messageThunk.ts
@@ -726,6 +726,7 @@ export const loadTopicMessagesThunk =
   async (dispatch: AppDispatch, getState: () => RootState) => {
     const state = getState()
     const topicMessagesExist = !!state.messages.messageIdsByTopic[topicId]
+    dispatch(newMessagesActions.setCurrentTopicId(topicId))
 
     if (topicMessagesExist && !forceReload) {
       return

From 12a07b853e1409fa2fb653361681bfa81d88cb0b Mon Sep 17 00:00:00 2001
From: Lao <laodanfeng@hotmail.com>
Date: Thu, 15 May 2025 17:50:52 +0800
Subject: [PATCH 41/50] fix: Update Server McpSettings (#6018)
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

fix:初始化一个新的MCP Server时，没有防止用户多次点击启用开关
---
 src/renderer/src/pages/settings/MCPSettings/McpSettings.tsx | 1 +
 1 file changed, 1 insertion(+)

diff --git a/src/renderer/src/pages/settings/MCPSettings/McpSettings.tsx b/src/renderer/src/pages/settings/MCPSettings/McpSettings.tsx
index 2443d3e142..18b3c18cdd 100644
--- a/src/renderer/src/pages/settings/MCPSettings/McpSettings.tsx
+++ b/src/renderer/src/pages/settings/MCPSettings/McpSettings.tsx
@@ -167,6 +167,7 @@ const McpSettings: React.FC = () => {
         const localTools = await window.api.mcp.listTools(server)
         setTools(localTools)
       } catch (error) {
+        setLoadingServer(server.id)
         window.message.error({
           content: t('settings.mcp.tools.loadError') + ' ' + formatError(error),
           key: 'mcp-tools-error'

From fe78ce1d706986d5d58904b8da3d393b30c01ef2 Mon Sep 17 00:00:00 2001
From: SuYao <sy20010504@gmail.com>
Date: Thu, 15 May 2025 17:51:08 +0800
Subject: [PATCH 42/50] fix: update geminiapi check (#6002)

---
 .../providers/AiProvider/GeminiProvider.ts    | 31 ++++++++++++++-----
 1 file changed, 24 insertions(+), 7 deletions(-)

diff --git a/src/renderer/src/providers/AiProvider/GeminiProvider.ts b/src/renderer/src/providers/AiProvider/GeminiProvider.ts
index 03656645a2..900bed0e94 100644
--- a/src/renderer/src/providers/AiProvider/GeminiProvider.ts
+++ b/src/renderer/src/providers/AiProvider/GeminiProvider.ts
@@ -1,6 +1,7 @@
 import {
   Content,
   File,
+  FinishReason,
   FunctionCall,
   GenerateContentConfig,
   GenerateContentResponse,
@@ -912,14 +913,32 @@ export default class GeminiProvider extends BaseProvider {
       return { valid: false, error: new Error('No model found') }
     }
 
+    let config: GenerateContentConfig = {
+      maxOutputTokens: 1
+    }
+    if (isGeminiReasoningModel(model)) {
+      config = {
+        ...config,
+        thinkingConfig: {
+          includeThoughts: false
+        } as ThinkingConfig
+      }
+    }
+
+    if (isGenerateImageModel(model)) {
+      config = {
+        ...config,
+        responseModalities: [Modality.TEXT, Modality.IMAGE],
+        responseMimeType: 'text/plain'
+      }
+    }
+
     try {
       if (!stream) {
         const result = await this.sdk.models.generateContent({
           model: model.id,
           contents: [{ role: 'user', parts: [{ text: 'hi' }] }],
-          config: {
-            maxOutputTokens: 1
-          }
+          config: config
         })
         if (isEmpty(result.text)) {
           throw new Error('Empty response')
@@ -928,14 +947,12 @@ export default class GeminiProvider extends BaseProvider {
         const response = await this.sdk.models.generateContentStream({
           model: model.id,
           contents: [{ role: 'user', parts: [{ text: 'hi' }] }],
-          config: {
-            maxOutputTokens: 1
-          }
+          config: config
         })
         // 等待整个流式响应结束
         let hasContent = false
         for await (const chunk of response) {
-          if (chunk.text && chunk.text.length > 0) {
+          if (chunk.candidates && chunk.candidates[0].finishReason === FinishReason.MAX_TOKENS) {
             hasContent = true
             break
           }

From dee44a8d2769abfb92a8fca5e8884bcc42811551 Mon Sep 17 00:00:00 2001
From: Chen Tao <70054568+eeee0717@users.noreply.github.com>
Date: Thu, 15 May 2025 18:05:29 +0800
Subject: [PATCH 43/50] fix: remove dimensions(except voyage) (#6015)

* fix: remove dimensions(except voyage)

* fix: #6016
---
 package.json                                  |  22 +-
 src/main/embeddings/EmbeddingsFactory.ts      |   4 +-
 src/main/embeddings/VoyageEmbeddings.ts       |   2 -
 .../src/pages/knowledge/KnowledgeContent.tsx  |   8 +-
 .../providers/AiProvider/OpenAIProvider.ts    |  14 +-
 yarn.lock                                     | 189 ++++++++++--------
 6 files changed, 132 insertions(+), 107 deletions(-)

diff --git a/package.json b/package.json
index b1668efbb7..0009d0d4d0 100644
--- a/package.json
+++ b/package.json
@@ -57,17 +57,17 @@
     "prepare": "husky"
   },
   "dependencies": {
-    "@cherrystudio/embedjs": "^0.1.28",
-    "@cherrystudio/embedjs-libsql": "^0.1.28",
-    "@cherrystudio/embedjs-loader-csv": "^0.1.28",
-    "@cherrystudio/embedjs-loader-image": "^0.1.28",
-    "@cherrystudio/embedjs-loader-markdown": "^0.1.28",
-    "@cherrystudio/embedjs-loader-msoffice": "^0.1.28",
-    "@cherrystudio/embedjs-loader-pdf": "^0.1.28",
-    "@cherrystudio/embedjs-loader-sitemap": "^0.1.28",
-    "@cherrystudio/embedjs-loader-web": "^0.1.28",
-    "@cherrystudio/embedjs-loader-xml": "^0.1.28",
-    "@cherrystudio/embedjs-openai": "^0.1.28",
+    "@cherrystudio/embedjs": "^0.1.31",
+    "@cherrystudio/embedjs-libsql": "^0.1.31",
+    "@cherrystudio/embedjs-loader-csv": "^0.1.31",
+    "@cherrystudio/embedjs-loader-image": "^0.1.31",
+    "@cherrystudio/embedjs-loader-markdown": "^0.1.31",
+    "@cherrystudio/embedjs-loader-msoffice": "^0.1.31",
+    "@cherrystudio/embedjs-loader-pdf": "^0.1.31",
+    "@cherrystudio/embedjs-loader-sitemap": "^0.1.31",
+    "@cherrystudio/embedjs-loader-web": "^0.1.31",
+    "@cherrystudio/embedjs-loader-xml": "^0.1.31",
+    "@cherrystudio/embedjs-openai": "^0.1.31",
     "@electron-toolkit/utils": "^3.0.0",
     "@electron/notarize": "^2.5.0",
     "@langchain/community": "^0.3.36",
diff --git a/src/main/embeddings/EmbeddingsFactory.ts b/src/main/embeddings/EmbeddingsFactory.ts
index 5924d00d7d..69de15171e 100644
--- a/src/main/embeddings/EmbeddingsFactory.ts
+++ b/src/main/embeddings/EmbeddingsFactory.ts
@@ -23,14 +23,14 @@ export default class EmbeddingsFactory {
         azureOpenAIApiVersion: apiVersion,
         azureOpenAIApiDeploymentName: model,
         azureOpenAIApiInstanceName: getInstanceName(baseURL),
-        dimensions,
+        // dimensions,
         batchSize
       })
     }
     return new OpenAiEmbeddings({
       model,
       apiKey,
-      dimensions,
+      // dimensions,
       batchSize,
       configuration: { baseURL }
     })
diff --git a/src/main/embeddings/VoyageEmbeddings.ts b/src/main/embeddings/VoyageEmbeddings.ts
index fc0c8b9fe7..ce21afe580 100644
--- a/src/main/embeddings/VoyageEmbeddings.ts
+++ b/src/main/embeddings/VoyageEmbeddings.ts
@@ -1,6 +1,5 @@
 import { BaseEmbeddings } from '@cherrystudio/embedjs-interfaces'
 import { VoyageEmbeddings as _VoyageEmbeddings } from '@langchain/community/embeddings/voyage'
-import Logger from 'electron-log'
 
 export default class VoyageEmbeddings extends BaseEmbeddings {
   private model: _VoyageEmbeddings
@@ -12,7 +11,6 @@ export default class VoyageEmbeddings extends BaseEmbeddings {
     if (!this.configuration.outputDimension) {
       throw new Error('You need to pass in the optional dimensions parameter for this model')
     }
-    Logger.log('VoyageEmbeddings', this.configuration)
     this.model = new _VoyageEmbeddings(this.configuration)
   }
   override async getDimensions(): Promise<number> {
diff --git a/src/renderer/src/pages/knowledge/KnowledgeContent.tsx b/src/renderer/src/pages/knowledge/KnowledgeContent.tsx
index fb8ec0f95d..3afccbd43d 100644
--- a/src/renderer/src/pages/knowledge/KnowledgeContent.tsx
+++ b/src/renderer/src/pages/knowledge/KnowledgeContent.tsx
@@ -245,9 +245,11 @@ const KnowledgeContent: FC<KnowledgeContentProps> = ({ selectedBase }) => {
                 </Tag>
               </div>
             </Tooltip>
-            <Tag color="cyan" style={{ borderRadius: 20, margin: 0 }}>
-              {t('models.dimensions', { dimensions: base.dimensions || 0 })}
-            </Tag>
+            {base.rerankModel && (
+              <Tag color="cyan" style={{ borderRadius: 20, margin: 0 }}>
+                {base.rerankModel.name}
+              </Tag>
+            )}
           </div>
         </ModelInfo>
         <HStack gap={8} alignItems="center">
diff --git a/src/renderer/src/providers/AiProvider/OpenAIProvider.ts b/src/renderer/src/providers/AiProvider/OpenAIProvider.ts
index ab48778158..62418ccdb0 100644
--- a/src/renderer/src/providers/AiProvider/OpenAIProvider.ts
+++ b/src/renderer/src/providers/AiProvider/OpenAIProvider.ts
@@ -1192,11 +1192,15 @@ export default class OpenAIProvider extends BaseOpenAIProvider {
   public async getEmbeddingDimensions(model: Model): Promise<number> {
     await this.checkIsCopilot()
 
-    const data = await this.sdk.embeddings.create({
-      model: model.id,
-      input: model?.provider === 'baidu-cloud' ? ['hi'] : 'hi'
-    })
-    return data.data[0].embedding.length
+    try {
+      const data = await this.sdk.embeddings.create({
+        model: model.id,
+        input: model?.provider === 'baidu-cloud' ? ['hi'] : 'hi'
+      })
+      return data.data[0].embedding.length
+    } catch (e) {
+      return 0
+    }
   }
 
   public async checkIsCopilot() {
diff --git a/yarn.lock b/yarn.lock
index 17f6773b91..e67fb60b98 100644
--- a/yarn.lock
+++ b/yarn.lock
@@ -467,173 +467,194 @@ __metadata:
   languageName: unknown
   linkType: soft
 
-"@cherrystudio/embedjs-interfaces@npm:0.1.29":
-  version: 0.1.29
-  resolution: "@cherrystudio/embedjs-interfaces@npm:0.1.29"
+"@cherrystudio/embedjs-interfaces@npm:0.1.30":
+  version: 0.1.30
+  resolution: "@cherrystudio/embedjs-interfaces@npm:0.1.30"
   dependencies:
     "@langchain/core": "npm:^0.3.26"
     debug: "npm:^4.4.0"
     md5: "npm:^2.3.0"
     uuid: "npm:^11.0.3"
-  checksum: 10c0/df7ac19aecae137e5af427bb1605232993ef1510e3d41875cb8dd604e7a692778758e5f640a6ab839aaa4193c21012a50b7dfb0aa42c434e668f99faa0fd04d7
+  checksum: 10c0/1d0eca816d89df25adfa15eb0b6ce67e8b3446966886c4e5e84f4c657daf3b5cad728c953479e8f317136a3c86ca512ebf13ceb070462da733eaab02937bc460
   languageName: node
   linkType: hard
 
-"@cherrystudio/embedjs-libsql@npm:^0.1.28":
-  version: 0.1.29
-  resolution: "@cherrystudio/embedjs-libsql@npm:0.1.29"
+"@cherrystudio/embedjs-interfaces@npm:0.1.31":
+  version: 0.1.31
+  resolution: "@cherrystudio/embedjs-interfaces@npm:0.1.31"
   dependencies:
-    "@cherrystudio/embedjs-interfaces": "npm:0.1.29"
-    "@cherrystudio/embedjs-utils": "npm:0.1.29"
+    "@langchain/core": "npm:^0.3.26"
+    debug: "npm:^4.4.0"
+    md5: "npm:^2.3.0"
+    uuid: "npm:^11.0.3"
+  checksum: 10c0/da4de44f48a332c20ed891899c1e0fc06e0238df8d34450f58a52394efe3cd598f21f6feaedb3410cef6d3a86c6a2e2ca1fad574fedb5e256c38b82c72668d55
+  languageName: node
+  linkType: hard
+
+"@cherrystudio/embedjs-libsql@npm:^0.1.31":
+  version: 0.1.31
+  resolution: "@cherrystudio/embedjs-libsql@npm:0.1.31"
+  dependencies:
+    "@cherrystudio/embedjs-interfaces": "npm:0.1.30"
+    "@cherrystudio/embedjs-utils": "npm:0.1.30"
     "@libsql/client": "npm:^0.14.0"
     debug: "npm:^4.4.0"
-  checksum: 10c0/655da13d5e192bb0d46e36cbe1ee444b290f6d98d39ad4ac72004fa0aa1a2f5c6dc7a41dd2a9631cc80014501e3423fbd3a822f9fcb331617ab0a43db9692410
+  checksum: 10c0/248453e07b7ff1661f18213f69d74a0ab2e5d722d3ae5409240fd38cf3c263da5c8a224635f6ec4cf823cdaa91846ba0f4890d64872133950810afcfd8512498
   languageName: node
   linkType: hard
 
-"@cherrystudio/embedjs-loader-csv@npm:^0.1.28":
-  version: 0.1.29
-  resolution: "@cherrystudio/embedjs-loader-csv@npm:0.1.29"
+"@cherrystudio/embedjs-loader-csv@npm:^0.1.31":
+  version: 0.1.31
+  resolution: "@cherrystudio/embedjs-loader-csv@npm:0.1.31"
   dependencies:
-    "@cherrystudio/embedjs-interfaces": "npm:0.1.29"
-    "@cherrystudio/embedjs-utils": "npm:0.1.29"
+    "@cherrystudio/embedjs-interfaces": "npm:0.1.31"
+    "@cherrystudio/embedjs-utils": "npm:0.1.31"
     csv-parse: "npm:^5.6.0"
     debug: "npm:^4.4.0"
     md5: "npm:^2.3.0"
-  checksum: 10c0/7c54791fe836839bf3b6a882a9e4c5656b4f30e54aa4e8967b380bc858fd76e03b2ca39b050bc5c06ffbc9e0c722d91d5dd0acf9edf576ff279805d718dfd437
+  checksum: 10c0/810a1eaf6bad7364856933b3752c698df033c4eb4c857eea22bd4da2143ae074e67857f106a7c9499817601e3420247d1d0e5ba319cf28d27f26a7274d75460e
   languageName: node
   linkType: hard
 
-"@cherrystudio/embedjs-loader-image@npm:^0.1.28":
-  version: 0.1.29
-  resolution: "@cherrystudio/embedjs-loader-image@npm:0.1.29"
+"@cherrystudio/embedjs-loader-image@npm:^0.1.31":
+  version: 0.1.31
+  resolution: "@cherrystudio/embedjs-loader-image@npm:0.1.31"
   dependencies:
-    "@cherrystudio/embedjs-interfaces": "npm:0.1.29"
-    "@cherrystudio/embedjs-utils": "npm:0.1.29"
+    "@cherrystudio/embedjs-interfaces": "npm:0.1.31"
+    "@cherrystudio/embedjs-utils": "npm:0.1.31"
     "@langchain/core": "npm:^0.3.26"
     debug: "npm:^4.4.0"
     exifremove: "npm:^1.0.1"
     md5: "npm:^2.3.0"
     mime: "npm:^4.0.6"
     stream-mime-type: "npm:^2.0.0"
-  checksum: 10c0/cbc43bf0be38ccd231a35ee06f160fee4628267a912f222c2c326e6d383a0477e1faad1910c9cd485ef8857b63d4404a9797c7e6a9661773345a4cca1ce956cf
+  checksum: 10c0/7e367a9722c30423dc26af795ef553120cc61c807c6d13e222eee336732bbe5a5e211cc66fb15941bc9fc05749a00200df6d741e3ae9ae9ec7a7d29db8dea075
   languageName: node
   linkType: hard
 
-"@cherrystudio/embedjs-loader-markdown@npm:^0.1.28":
-  version: 0.1.29
-  resolution: "@cherrystudio/embedjs-loader-markdown@npm:0.1.29"
+"@cherrystudio/embedjs-loader-markdown@npm:^0.1.31":
+  version: 0.1.31
+  resolution: "@cherrystudio/embedjs-loader-markdown@npm:0.1.31"
   dependencies:
-    "@cherrystudio/embedjs-interfaces": "npm:0.1.29"
-    "@cherrystudio/embedjs-loader-web": "npm:0.1.29"
+    "@cherrystudio/embedjs-interfaces": "npm:0.1.31"
+    "@cherrystudio/embedjs-loader-web": "npm:0.1.31"
     debug: "npm:^4.4.0"
     md5: "npm:^2.3.0"
     micromark: "npm:^4.0.1"
     micromark-extension-gfm: "npm:^3.0.0"
     micromark-extension-mdx-jsx: "npm:^3.0.1"
-  checksum: 10c0/068393c00321a03a7b7881bb9b4b3b115440a91496b4fef43ad9b7f352c763aa59a6a33f69c9db39f2ed4c0a727f7e1dcd28448f7a446a5ec6a62edbd035f5a8
+  checksum: 10c0/3e917eafe12331750a2702ae50d3aaf81a33ba43de111edcd0fe59a464c02149c44a124cfae8125374973313d70cd8d5ed2f091a85421238301859ec48aec4b0
   languageName: node
   linkType: hard
 
-"@cherrystudio/embedjs-loader-msoffice@npm:^0.1.28":
-  version: 0.1.29
-  resolution: "@cherrystudio/embedjs-loader-msoffice@npm:0.1.29"
+"@cherrystudio/embedjs-loader-msoffice@npm:^0.1.31":
+  version: 0.1.31
+  resolution: "@cherrystudio/embedjs-loader-msoffice@npm:0.1.31"
   dependencies:
-    "@cherrystudio/embedjs-interfaces": "npm:0.1.29"
-    "@cherrystudio/embedjs-utils": "npm:0.1.29"
+    "@cherrystudio/embedjs-interfaces": "npm:0.1.31"
+    "@cherrystudio/embedjs-utils": "npm:0.1.31"
     "@langchain/textsplitters": "npm:^0.1.0"
     md5: "npm:^2.3.0"
     office-text-extractor: "npm:^3.0.3"
-  checksum: 10c0/be97eb2278d29f06b569b0aa2fd2b3640caf43207268f5c5cbe16fb77776fe026e4e0d5a9c6360f61c4af439561022f6f4becbe97c2b903d1d446021ab3bf38f
+  checksum: 10c0/57e688611dfa3481710231721608d0934ab31b726a22d3932a88fc911a16e1c7781537ec01e2906a7d22173950e7e46f4a5c56e315415222087ee09fefbcb98d
   languageName: node
   linkType: hard
 
-"@cherrystudio/embedjs-loader-pdf@npm:^0.1.28":
-  version: 0.1.29
-  resolution: "@cherrystudio/embedjs-loader-pdf@npm:0.1.29"
+"@cherrystudio/embedjs-loader-pdf@npm:^0.1.31":
+  version: 0.1.31
+  resolution: "@cherrystudio/embedjs-loader-pdf@npm:0.1.31"
   dependencies:
-    "@cherrystudio/embedjs-interfaces": "npm:0.1.29"
-    "@cherrystudio/embedjs-utils": "npm:0.1.29"
+    "@cherrystudio/embedjs-interfaces": "npm:0.1.31"
+    "@cherrystudio/embedjs-utils": "npm:0.1.31"
     "@langchain/textsplitters": "npm:^0.1.0"
     md5: "npm:^2.3.0"
     office-text-extractor: "npm:^3.0.3"
-  checksum: 10c0/cd45963f9405cd1b817f9539ad876dd32e214d21b651459822fc9f829105dc4934daf1aded9cc7084efd9dc914901b4b72fc52a7c5aa9fb550454b0e465844cf
+  checksum: 10c0/67c36c8a18ce7ed7312544bda37d2378a4d604eefa454700b142fd5ed1cb3a80c9b02bb392610a9b7b797ebb5aab0bd2437b74c2b125765dabf3064d4f55c2fd
   languageName: node
   linkType: hard
 
-"@cherrystudio/embedjs-loader-sitemap@npm:^0.1.28":
-  version: 0.1.29
-  resolution: "@cherrystudio/embedjs-loader-sitemap@npm:0.1.29"
+"@cherrystudio/embedjs-loader-sitemap@npm:^0.1.31":
+  version: 0.1.31
+  resolution: "@cherrystudio/embedjs-loader-sitemap@npm:0.1.31"
   dependencies:
-    "@cherrystudio/embedjs-interfaces": "npm:0.1.29"
-    "@cherrystudio/embedjs-loader-web": "npm:0.1.29"
+    "@cherrystudio/embedjs-interfaces": "npm:0.1.31"
+    "@cherrystudio/embedjs-loader-web": "npm:0.1.31"
     debug: "npm:^4.4.0"
     md5: "npm:^2.3.0"
     sitemapper: "npm:^3.2.20"
-  checksum: 10c0/2cb5fba68f3e89026b08274f3d286b46c44192f3e8b499d72984e63f36d174bdc7da6c8122c922b8fd5660fa0bc1fbbdbaecc37dae134467d2a501fd1642f0d2
+  checksum: 10c0/9e8f644b7f248c3db86cae0945d841c35a4ecc8101a7737b8476250d6acf8b1b176d7144b044a6687dcbe1439528abdb4b0cc15057fd78b95dc65f4426eac50d
   languageName: node
   linkType: hard
 
-"@cherrystudio/embedjs-loader-web@npm:0.1.29, @cherrystudio/embedjs-loader-web@npm:^0.1.28":
-  version: 0.1.29
-  resolution: "@cherrystudio/embedjs-loader-web@npm:0.1.29"
+"@cherrystudio/embedjs-loader-web@npm:0.1.31, @cherrystudio/embedjs-loader-web@npm:^0.1.31":
+  version: 0.1.31
+  resolution: "@cherrystudio/embedjs-loader-web@npm:0.1.31"
   dependencies:
-    "@cherrystudio/embedjs-interfaces": "npm:0.1.29"
-    "@cherrystudio/embedjs-utils": "npm:0.1.29"
+    "@cherrystudio/embedjs-interfaces": "npm:0.1.31"
+    "@cherrystudio/embedjs-utils": "npm:0.1.31"
     "@langchain/textsplitters": "npm:^0.1.0"
     debug: "npm:^4.4.0"
     html-to-text: "npm:^9.0.5"
     md5: "npm:^2.3.0"
-  checksum: 10c0/a15529e45e309993644db7ee8546f970c0d94fd54baf5044d650a0af66cddb9729af5f3a3fb115c13cd7b7b2ab38bb3809cc088d4c6346e9ca33e478845820f3
+  checksum: 10c0/a5b06d597794520fd92aa4a711e5e8ea4858573a1d079981753ffe2d3dcb1a6212fe467695fe92a0400409db3148495bee91d1ee82863f8053698d7ffc2a792e
   languageName: node
   linkType: hard
 
-"@cherrystudio/embedjs-loader-xml@npm:^0.1.28":
-  version: 0.1.29
-  resolution: "@cherrystudio/embedjs-loader-xml@npm:0.1.29"
+"@cherrystudio/embedjs-loader-xml@npm:^0.1.31":
+  version: 0.1.31
+  resolution: "@cherrystudio/embedjs-loader-xml@npm:0.1.31"
   dependencies:
-    "@cherrystudio/embedjs-interfaces": "npm:0.1.29"
+    "@cherrystudio/embedjs-interfaces": "npm:0.1.31"
     debug: "npm:^4.4.0"
     fast-xml-parser: "npm:^4.5.1"
     md5: "npm:^2.3.0"
-  checksum: 10c0/cf24dc1b48d55197f3773a9f7490c521461c6cade86869a333bac6c05dae10529ecdbaa03dbfce0994e07215fe343c9801b81356a6141965aa10d50fe2e6c858
+  checksum: 10c0/bc41eb67741a2e2cc6a48147eb0c8600e4876a72259d5ce347fed1ad48d7efc186030301ff6965728d7b3c2cbfdbc867558c764b40edaffaa2480f004dc1d2ae
   languageName: node
   linkType: hard
 
-"@cherrystudio/embedjs-openai@npm:^0.1.28":
-  version: 0.1.29
-  resolution: "@cherrystudio/embedjs-openai@npm:0.1.29"
+"@cherrystudio/embedjs-openai@npm:^0.1.31":
+  version: 0.1.31
+  resolution: "@cherrystudio/embedjs-openai@npm:0.1.31"
   dependencies:
-    "@cherrystudio/embedjs-interfaces": "npm:0.1.29"
+    "@cherrystudio/embedjs-interfaces": "npm:0.1.31"
     "@langchain/core": "npm:^0.3.26"
     "@langchain/openai": "npm:^0.3.16"
     debug: "npm:^4.4.0"
-  checksum: 10c0/10451eb9e0c8f613ea3829b478120890ee44e2a9c7707a48797c21cbd4f4479ad56f86bd38099762900ddf17d42758dba938325eaaa9fae66f71e033c6b64dd5
+  checksum: 10c0/2fb50cbdd0f226c5be34ed5fc8b34f544cff17e3b1a295cba26404d327e08a369af30dd73f18632d8855adbaa063c3e14033cda1795a17b883d248d43feae0d1
   languageName: node
   linkType: hard
 
-"@cherrystudio/embedjs-utils@npm:0.1.29":
-  version: 0.1.29
-  resolution: "@cherrystudio/embedjs-utils@npm:0.1.29"
+"@cherrystudio/embedjs-utils@npm:0.1.30":
+  version: 0.1.30
+  resolution: "@cherrystudio/embedjs-utils@npm:0.1.30"
   dependencies:
-    "@cherrystudio/embedjs-interfaces": "npm:0.1.29"
-  checksum: 10c0/1b8d8e38207e7588ee134c316bc566dfb68d56023887be61793480cdeac0fc5a2dcc3c72f7727daae801abcaf16e8518ab9dcb7b0b0f7d3a16473a8830ba9dff
+    "@cherrystudio/embedjs-interfaces": "npm:0.1.30"
+  checksum: 10c0/1bd6151a69b6e4db6c93528622ff4f7834f80834681f28758d19f9780e8da36f29c21737d49809021ba5b6b1127dd7d2891e26864e2d696f83f577966d1cbf2c
   languageName: node
   linkType: hard
 
-"@cherrystudio/embedjs@npm:^0.1.28":
-  version: 0.1.29
-  resolution: "@cherrystudio/embedjs@npm:0.1.29"
+"@cherrystudio/embedjs-utils@npm:0.1.31":
+  version: 0.1.31
+  resolution: "@cherrystudio/embedjs-utils@npm:0.1.31"
   dependencies:
-    "@cherrystudio/embedjs-interfaces": "npm:0.1.29"
-    "@cherrystudio/embedjs-utils": "npm:0.1.29"
+    "@cherrystudio/embedjs-interfaces": "npm:0.1.31"
+  checksum: 10c0/249e0cbf84adf04948ef5d3071df56ceb1804a716ae577e68c167415ac90eb711ded49375c95de3d68b49700dbfdfc16ac80b00b571d15469672898dfc82be77
+  languageName: node
+  linkType: hard
+
+"@cherrystudio/embedjs@npm:^0.1.31":
+  version: 0.1.31
+  resolution: "@cherrystudio/embedjs@npm:0.1.31"
+  dependencies:
+    "@cherrystudio/embedjs-interfaces": "npm:0.1.31"
+    "@cherrystudio/embedjs-utils": "npm:0.1.31"
     "@langchain/textsplitters": "npm:^0.1.0"
     debug: "npm:^4.4.0"
     langchain: "npm:^0.3.8"
     md5: "npm:^2.3.0"
     mime: "npm:^4.0.6"
     stream-mime-type: "npm:^2.0.0"
-  checksum: 10c0/01487ab886e7c5c260fc65dee0d67407988e58fa82a1f0fdc4a332548a570cc63f5d39cc87878a7e3272be547a306fee5ec6caa805614eb4e139ce1259b7f6c9
+  checksum: 10c0/632d82848e24e57bbd4cd3bcfd63e753d7c694879d701b93c7eab1ad110b0655c6bf9f3781f63a5e564fac1a450cfe7f8ec848d8a12b6a7a1d0bf7f73eb3fa4a
   languageName: node
   linkType: hard
 
@@ -4339,17 +4360,17 @@ __metadata:
     "@agentic/tavily": "npm:^7.3.3"
     "@ant-design/v5-patch-for-react-19": "npm:^1.0.3"
     "@anthropic-ai/sdk": "npm:^0.41.0"
-    "@cherrystudio/embedjs": "npm:^0.1.28"
-    "@cherrystudio/embedjs-libsql": "npm:^0.1.28"
-    "@cherrystudio/embedjs-loader-csv": "npm:^0.1.28"
-    "@cherrystudio/embedjs-loader-image": "npm:^0.1.28"
-    "@cherrystudio/embedjs-loader-markdown": "npm:^0.1.28"
-    "@cherrystudio/embedjs-loader-msoffice": "npm:^0.1.28"
-    "@cherrystudio/embedjs-loader-pdf": "npm:^0.1.28"
-    "@cherrystudio/embedjs-loader-sitemap": "npm:^0.1.28"
-    "@cherrystudio/embedjs-loader-web": "npm:^0.1.28"
-    "@cherrystudio/embedjs-loader-xml": "npm:^0.1.28"
-    "@cherrystudio/embedjs-openai": "npm:^0.1.28"
+    "@cherrystudio/embedjs": "npm:^0.1.31"
+    "@cherrystudio/embedjs-libsql": "npm:^0.1.31"
+    "@cherrystudio/embedjs-loader-csv": "npm:^0.1.31"
+    "@cherrystudio/embedjs-loader-image": "npm:^0.1.31"
+    "@cherrystudio/embedjs-loader-markdown": "npm:^0.1.31"
+    "@cherrystudio/embedjs-loader-msoffice": "npm:^0.1.31"
+    "@cherrystudio/embedjs-loader-pdf": "npm:^0.1.31"
+    "@cherrystudio/embedjs-loader-sitemap": "npm:^0.1.31"
+    "@cherrystudio/embedjs-loader-web": "npm:^0.1.31"
+    "@cherrystudio/embedjs-loader-xml": "npm:^0.1.31"
+    "@cherrystudio/embedjs-openai": "npm:^0.1.31"
     "@electron-toolkit/eslint-config-prettier": "npm:^3.0.0"
     "@electron-toolkit/eslint-config-ts": "npm:^3.0.0"
     "@electron-toolkit/preload": "npm:^3.0.0"

From f3b9b3c84cebaeee33dbf01649bf6d4e03a0f790 Mon Sep 17 00:00:00 2001
From: MyPrototypeWhat <43230886+MyPrototypeWhat@users.noreply.github.com>
Date: Thu, 15 May 2025 22:09:53 +0800
Subject: [PATCH 44/50] fix: remove undici dependency and clean up ProxyManager
 code (#6020)

---
 package.json                                  |  2 --
 src/main/ipc.ts                               | 19 +++++-----
 src/main/services/ProxyManager.ts             | 35 +++++++++----------
 src/main/utils/index.ts                       | 18 ++++++++++
 .../settings/DataSettings/DataSettings.tsx    |  2 +-
 yarn.lock                                     | 17 ++-------
 6 files changed, 48 insertions(+), 45 deletions(-)

diff --git a/package.json b/package.json
index 49bbcf1f89..b069265ab3 100644
--- a/package.json
+++ b/package.json
@@ -87,7 +87,6 @@
     "fast-xml-parser": "^5.2.0",
     "fetch-socks": "^1.3.2",
     "fs-extra": "^11.2.0",
-    "go-get-folder-size": "^0.5.5",
     "got-scraping": "^4.1.1",
     "jsdom": "^26.0.0",
     "markdown-it": "^14.1.0",
@@ -100,7 +99,6 @@
     "tar": "^7.4.3",
     "turndown": "^7.2.0",
     "turndown-plugin-gfm": "^1.0.2",
-    "undici": "^7.4.0",
     "webdav": "^5.8.0",
     "ws": "^8.18.1",
     "zipread": "^1.3.3"
diff --git a/src/main/ipc.ts b/src/main/ipc.ts
index dd7a5ca3b3..665e8114b7 100644
--- a/src/main/ipc.ts
+++ b/src/main/ipc.ts
@@ -8,7 +8,6 @@ import { IpcChannel } from '@shared/IpcChannel'
 import { Shortcut, ThemeMode } from '@types'
 import { BrowserWindow, ipcMain, nativeTheme, session, shell } from 'electron'
 import log from 'electron-log'
-import { getFolderSizeBin } from 'go-get-folder-size'
 
 import { titleBarOverlayDark, titleBarOverlayLight } from './config'
 import AppUpdater from './services/AppUpdater'
@@ -30,7 +29,7 @@ import storeSyncService from './services/StoreSyncService'
 import { TrayService } from './services/TrayService'
 import { setOpenLinkExternal } from './services/WebviewService'
 import { windowService } from './services/WindowService'
-import { getResourcePath } from './utils'
+import { calculateDirectorySize, getResourcePath } from './utils'
 import { decrypt, encrypt } from './utils/aes'
 import { getCacheDir, getConfigDir, getFilesDir } from './utils/file'
 import { compress, decompress } from './utils/zip'
@@ -184,14 +183,16 @@ export function registerIpc(mainWindow: BrowserWindow, app: Electron.App) {
   // get cache size
   ipcMain.handle(IpcChannel.App_GetCacheSize, async () => {
     const cachePath = getCacheDir()
-    const size = await getFolderSizeBin(cachePath, true, {
-      // ignore files that we can't access
-      loose: true
-    }).catch((err) => {
-      log.error('Failed to get cache size:', err)
-    })
+    log.info(`Calculating cache size for path: ${cachePath}`)
 
-    return size || '0MB'
+    try {
+      const sizeInBytes = await calculateDirectorySize(cachePath)
+      const sizeInMB = (sizeInBytes / (1024 * 1024)).toFixed(2)
+      return `${sizeInMB}`
+    } catch (error: any) {
+      log.error(`Failed to calculate cache size for ${cachePath}: ${error.message}`)
+      return '0'
+    }
   })
 
   // check for update
diff --git a/src/main/services/ProxyManager.ts b/src/main/services/ProxyManager.ts
index 84d3f84038..3a4aa09438 100644
--- a/src/main/services/ProxyManager.ts
+++ b/src/main/services/ProxyManager.ts
@@ -1,8 +1,7 @@
 import { ProxyConfig as _ProxyConfig, session } from 'electron'
-import { socksDispatcher } from 'fetch-socks'
 import { getSystemProxy } from 'os-proxy-config'
 import { ProxyAgent as GeneralProxyAgent } from 'proxy-agent'
-import { ProxyAgent, setGlobalDispatcher } from 'undici'
+// import { ProxyAgent, setGlobalDispatcher } from 'undici'
 
 type ProxyMode = 'system' | 'custom' | 'none'
 
@@ -121,22 +120,22 @@ export class ProxyManager {
     return this.config.url || ''
   }
 
-  setGlobalProxy() {
-    const proxyUrl = this.config.url
-    if (proxyUrl) {
-      const [protocol, address] = proxyUrl.split('://')
-      const [host, port] = address.split(':')
-      if (!protocol.includes('socks')) {
-        setGlobalDispatcher(new ProxyAgent(proxyUrl))
-      } else {
-        global[Symbol.for('undici.globalDispatcher.1')] = socksDispatcher({
-          port: parseInt(port),
-          type: protocol === 'socks5' ? 5 : 4,
-          host: host
-        })
-      }
-    }
-  }
+  // setGlobalProxy() {
+  //   const proxyUrl = this.config.url
+  //   if (proxyUrl) {
+  //     const [protocol, address] = proxyUrl.split('://')
+  //     const [host, port] = address.split(':')
+  //     if (!protocol.includes('socks')) {
+  //       setGlobalDispatcher(new ProxyAgent(proxyUrl))
+  //     } else {
+  //       global[Symbol.for('undici.globalDispatcher.1')] = socksDispatcher({
+  //         port: parseInt(port),
+  //         type: protocol === 'socks5' ? 5 : 4,
+  //         host: host
+  //       })
+  //     }
+  //   }
+  // }
 }
 
 export const proxyManager = new ProxyManager()
diff --git a/src/main/utils/index.ts b/src/main/utils/index.ts
index 4a6fde670d..a5f63fcc42 100644
--- a/src/main/utils/index.ts
+++ b/src/main/utils/index.ts
@@ -1,4 +1,5 @@
 import fs from 'node:fs'
+import fsAsync from 'node:fs/promises'
 import path from 'node:path'
 
 import { app } from 'electron'
@@ -52,3 +53,20 @@ export function makeSureDirExists(dir: string) {
     fs.mkdirSync(dir, { recursive: true })
   }
 }
+
+export async function calculateDirectorySize(directoryPath: string): Promise<number> {
+  let totalSize = 0
+  const items = await fsAsync.readdir(directoryPath)
+
+  for (const item of items) {
+    const itemPath = path.join(directoryPath, item)
+    const stats = await fsAsync.stat(itemPath)
+
+    if (stats.isFile()) {
+      totalSize += stats.size
+    } else if (stats.isDirectory()) {
+      totalSize += await calculateDirectorySize(itemPath)
+    }
+  }
+  return totalSize
+}
diff --git a/src/renderer/src/pages/settings/DataSettings/DataSettings.tsx b/src/renderer/src/pages/settings/DataSettings/DataSettings.tsx
index 50f838ce37..ec31fd6ae7 100644
--- a/src/renderer/src/pages/settings/DataSettings/DataSettings.tsx
+++ b/src/renderer/src/pages/settings/DataSettings/DataSettings.tsx
@@ -240,7 +240,7 @@ const DataSettings: FC = () => {
               <SettingRow>
                 <SettingRowTitle>
                   {t('settings.data.clear_cache.title')}
-                  <CacheText>({cacheSize})</CacheText>
+                  {cacheSize && <CacheText>({cacheSize}MB)</CacheText>}
                 </SettingRowTitle>
                 <HStack gap="5px">
                   <Button onClick={handleClearCache} danger>
diff --git a/yarn.lock b/yarn.lock
index 97d4dadcc5..1dcaa49011 100644
--- a/yarn.lock
+++ b/yarn.lock
@@ -4431,7 +4431,6 @@ __metadata:
     fast-xml-parser: "npm:^5.2.0"
     fetch-socks: "npm:^1.3.2"
     fs-extra: "npm:^11.2.0"
-    go-get-folder-size: "npm:^0.5.5"
     got-scraping: "npm:^4.1.1"
     html-to-image: "npm:^1.11.13"
     husky: "npm:^9.1.7"
@@ -4484,7 +4483,6 @@ __metadata:
     turndown: "npm:^7.2.0"
     turndown-plugin-gfm: "npm:^1.0.2"
     typescript: "npm:^5.6.2"
-    undici: "npm:^7.4.0"
     uuid: "npm:^10.0.0"
     vite: "npm:6.2.6"
     vitest: "npm:^3.1.1"
@@ -8945,17 +8943,6 @@ __metadata:
   languageName: node
   linkType: hard
 
-"go-get-folder-size@npm:^0.5.5":
-  version: 0.5.5
-  resolution: "go-get-folder-size@npm:0.5.5"
-  dependencies:
-    std-env: "npm:^3.7.0"
-  bin:
-    go-get-folder-size: bin/cli.js
-  checksum: 10c0/eb69b686952218cc114dccf65763e0dff5056050fa3e9b2afa6161b933c3978500455503b104f9f28d96aab2fedd64ccb0255d6ea16d699fe020795f431ed7b8
-  languageName: node
-  linkType: hard
-
 "google-auth-library@npm:^9.14.2":
   version: 9.15.1
   resolution: "google-auth-library@npm:9.15.1"
@@ -15945,7 +15932,7 @@ __metadata:
   languageName: node
   linkType: hard
 
-"std-env@npm:^3.7.0, std-env@npm:^3.8.1":
+"std-env@npm:^3.8.1":
   version: 3.9.0
   resolution: "std-env@npm:3.9.0"
   checksum: 10c0/4a6f9218aef3f41046c3c7ecf1f98df00b30a07f4f35c6d47b28329bc2531eef820828951c7d7b39a1c5eb19ad8a46e3ddfc7deb28f0a2f3ceebee11bab7ba50
@@ -16901,7 +16888,7 @@ __metadata:
   languageName: node
   linkType: hard
 
-"undici@npm:>=6, undici@npm:^7.4.0":
+"undici@npm:>=6":
   version: 7.8.0
   resolution: "undici@npm:7.8.0"
   checksum: 10c0/7141f63ea405208a88120d211d83d77bf21327b16b451d3149fb266c28884fbcf78ec370ac2d3412a0e68ba6132ab85265ba85a2f4fde24cb47dc77f5c5a158c

From 2cfc943229e5b9f273bee94f653a1bd8b5875125 Mon Sep 17 00:00:00 2001
From: fullex <0xfullex@gmail.com>
Date: Thu, 15 May 2025 15:44:01 +0800
Subject: [PATCH 45/50] feat: implement global error handling for uncaught
 exceptions and unhandled rejections in production mode

---
 src/main/index.ts | 18 ++++++++++++++++--
 1 file changed, 16 insertions(+), 2 deletions(-)

diff --git a/src/main/index.ts b/src/main/index.ts
index 41c48cd977..d4cd944d8a 100644
--- a/src/main/index.ts
+++ b/src/main/index.ts
@@ -5,6 +5,7 @@ import { app, BrowserWindow, ipcMain } from 'electron'
 import installExtension, { REACT_DEVELOPER_TOOLS, REDUX_DEVTOOLS } from 'electron-devtools-installer'
 import Logger from 'electron-log'
 
+import { isDev, isMac, isWin } from './constant'
 import { registerIpc } from './ipc'
 import { configManager } from './services/ConfigManager'
 import mcpService from './services/MCPService'
@@ -21,6 +22,19 @@ import { setUserDataDir } from './utils/file'
 
 Logger.initialize()
 
+// in production mode, handle uncaught exception and unhandled rejection globally
+if (!isDev) {
+  // handle uncaught exception
+  process.on('uncaughtException', (error) => {
+    Logger.error('Uncaught Exception:', error)
+  })
+
+  // handle unhandled rejection
+  process.on('unhandledRejection', (reason, promise) => {
+    Logger.error('Unhandled Rejection at:', promise, 'reason:', reason)
+  })
+}
+
 // Check for single instance lock
 if (!app.requestSingleInstanceLock()) {
   app.quit()
@@ -63,13 +77,13 @@ if (!app.requestSingleInstanceLock()) {
     // Setup deep link for AppImage on Linux
     await setupAppImageDeepLink()
 
-    if (process.env.NODE_ENV === 'development') {
+    if (isDev) {
       installExtension([REDUX_DEVTOOLS, REACT_DEVELOPER_TOOLS])
         .then((name) => console.log(`Added Extension:  ${name}`))
         .catch((err) => console.log('An error occurred: ', err))
     }
     ipcMain.handle(IpcChannel.System_GetDeviceType, () => {
-      return process.platform === 'darwin' ? 'mac' : process.platform === 'win32' ? 'windows' : 'linux'
+      return isMac ? 'mac' : isWin ? 'windows' : 'linux'
     })
 
     ipcMain.handle(IpcChannel.System_GetHostname, () => {

From d61f1ab67dbdc097752f5e39c399a2a59a8736f7 Mon Sep 17 00:00:00 2001
From: kangfenmao <kangfenmao@qq.com>
Date: Thu, 15 May 2025 20:56:00 +0800
Subject: [PATCH 46/50] refactor: remove extended context settings and related
 logic

* Removed EXTENDED_CONTEXT_LIMIT and EXTENDED_CONTEXT_STEP constants from the configuration.
* Eliminated enableMaxContexts state and associated logic from settings components.
* Updated contextCount handling to accommodate a maximum of 100, with a special case for 100 to represent an unlimited context.
* Cleaned up related translations for max contexts in multiple languages.
---
 src/renderer/src/config/constant.ts           |  2 -
 src/renderer/src/i18n/locales/en-us.json      |  1 -
 src/renderer/src/i18n/locales/ja-jp.json      |  1 -
 src/renderer/src/i18n/locales/ru-ru.json      |  1 -
 src/renderer/src/i18n/locales/zh-cn.json      |  1 -
 src/renderer/src/i18n/locales/zh-tw.json      |  1 -
 .../src/pages/home/Inputbar/TokenCount.tsx    | 14 ++++-
 .../src/pages/home/Tabs/SettingsTab.tsx       | 60 ++-----------------
 .../AssistantModelSettings.tsx                | 58 +++---------------
 src/renderer/src/services/AssistantService.ts |  3 +-
 src/renderer/src/services/EventService.ts     |  3 +-
 src/renderer/src/services/MessagesService.ts  |  2 +-
 src/renderer/src/types/index.ts               |  1 -
 13 files changed, 29 insertions(+), 119 deletions(-)

diff --git a/src/renderer/src/config/constant.ts b/src/renderer/src/config/constant.ts
index 0240cac126..5d2376d12f 100644
--- a/src/renderer/src/config/constant.ts
+++ b/src/renderer/src/config/constant.ts
@@ -1,7 +1,5 @@
 export const DEFAULT_TEMPERATURE = 1.0
 export const DEFAULT_CONTEXTCOUNT = 5
-export const EXTENDED_CONTEXT_LIMIT = 100
-export const EXTENDED_CONTEXT_STEP = 1
 export const DEFAULT_MAX_TOKENS = 4096
 export const DEFAULT_KNOWLEDGE_DOCUMENT_COUNT = 6
 export const DEFAULT_KNOWLEDGE_THRESHOLD = 0.0
diff --git a/src/renderer/src/i18n/locales/en-us.json b/src/renderer/src/i18n/locales/en-us.json
index 4b3d496a95..a6f6e2f490 100644
--- a/src/renderer/src/i18n/locales/en-us.json
+++ b/src/renderer/src/i18n/locales/en-us.json
@@ -208,7 +208,6 @@
       "settings.context_count": "Context",
       "settings.context_count.tip": "The number of previous messages to keep in the context.",
       "settings.max": "Max",
-      "settings.max_contexts": "More Contexts Length",
       "settings.max_tokens": "Enable max tokens limit",
       "settings.max_tokens.confirm": "Enable max tokens limit",
       "settings.max_tokens.confirm_content": "Enable max tokens limit, affects the length of the result. Need to consider the context limit of the model, otherwise an error will be reported",
diff --git a/src/renderer/src/i18n/locales/ja-jp.json b/src/renderer/src/i18n/locales/ja-jp.json
index e8c2108ba7..c6d533ff7e 100644
--- a/src/renderer/src/i18n/locales/ja-jp.json
+++ b/src/renderer/src/i18n/locales/ja-jp.json
@@ -208,7 +208,6 @@
       "settings.context_count": "コンテキスト",
       "settings.context_count.tip": "コンテキストに保持する以前のメッセージの数",
       "settings.max": "最大",
-      "settings.max_contexts": "より長いコンテキスト制限",
       "settings.max_tokens": "最大トークン制限を有効にする",
       "settings.max_tokens.confirm": "最大トークン制限を有効にする",
       "settings.max_tokens.confirm_content": "最大トークン制限を有効にすると、モデルが生成できる最大トークン数が制限されます。これにより、返される結果の長さに影響が出る可能性があります。モデルのコンテキスト制限に基づいて設定する必要があります。そうしないとエラーが発生します",
diff --git a/src/renderer/src/i18n/locales/ru-ru.json b/src/renderer/src/i18n/locales/ru-ru.json
index 433c2047b5..a0499603d5 100644
--- a/src/renderer/src/i18n/locales/ru-ru.json
+++ b/src/renderer/src/i18n/locales/ru-ru.json
@@ -208,7 +208,6 @@
       "settings.context_count": "Контекст",
       "settings.context_count.tip": "Количество предыдущих сообщений, которые нужно сохранить в контексте.",
       "settings.max": "Максимум",
-      "settings.max_contexts": "Более длительные ограничения контекста",
       "settings.max_tokens": "Включить лимит максимальных токенов",
       "settings.max_tokens.confirm": "Включить лимит максимальных токенов",
       "settings.max_tokens.confirm_content": "Включить лимит максимальных токенов, влияет на длину результата. Нужно учитывать контекст модели, иначе будет ошибка",
diff --git a/src/renderer/src/i18n/locales/zh-cn.json b/src/renderer/src/i18n/locales/zh-cn.json
index 9fc89be591..9e6db07041 100644
--- a/src/renderer/src/i18n/locales/zh-cn.json
+++ b/src/renderer/src/i18n/locales/zh-cn.json
@@ -222,7 +222,6 @@
       "settings.context_count": "上下文数",
       "settings.context_count.tip": "要保留在上下文中的消息数量，数值越大，上下文越长，消耗的 token 越多。普通聊天建议 5-10",
       "settings.max": "不限",
-      "settings.max_contexts": "更多上下文长度限制",
       "settings.max_tokens": "开启消息长度限制",
       "settings.max_tokens.confirm": "开启消息长度限制",
       "settings.max_tokens.confirm_content": "开启消息长度限制后，单次交互所用的最大 Token 数, 会影响返回结果的长度。要根据模型上下文限制来设置，否则会报错",
diff --git a/src/renderer/src/i18n/locales/zh-tw.json b/src/renderer/src/i18n/locales/zh-tw.json
index fbfebd7266..16facb9ae0 100644
--- a/src/renderer/src/i18n/locales/zh-tw.json
+++ b/src/renderer/src/i18n/locales/zh-tw.json
@@ -208,7 +208,6 @@
       "settings.context_count": "上下文",
       "settings.context_count.tip": "在上下文中保留的前幾則訊息。",
       "settings.max": "最大",
-      "settings.max_contexts": "更多上下文長度限制",
       "settings.max_tokens": "啟用最大 Token 限制",
       "settings.max_tokens.confirm": "啟用訊息長度限制",
       "settings.max_tokens.confirm_content": "啟用訊息長度限制後，單次互動所用的最大 Token 數，會影響返回結果的長度。要根據模型上下文限制來設定，否則會發生錯誤。",
diff --git a/src/renderer/src/pages/home/Inputbar/TokenCount.tsx b/src/renderer/src/pages/home/Inputbar/TokenCount.tsx
index b7ca3b351b..c2a0ee5068 100644
--- a/src/renderer/src/pages/home/Inputbar/TokenCount.tsx
+++ b/src/renderer/src/pages/home/Inputbar/TokenCount.tsx
@@ -22,6 +22,18 @@ const TokenCount: FC<Props> = ({ estimateTokenCount, inputTokenCount, contextCou
   }
 
   const formatMaxCount = (max: number) => {
+    if (max == 100) {
+      return (
+        <span
+          style={{
+            fontSize: '16px',
+            position: 'relative',
+            top: '1px'
+          }}>
+          ∞
+        </span>
+      )
+    }
     return max.toString()
   }
 
@@ -31,7 +43,7 @@ const TokenCount: FC<Props> = ({ estimateTokenCount, inputTokenCount, contextCou
         <HStack justifyContent="space-between" w="100%">
           <Text>{t('chat.input.context_count.tip')}</Text>
           <Text>
-            {contextCount.current} / {contextCount.max}
+            {contextCount.current} / {contextCount.max == 20 ? '∞' : contextCount.max}
           </Text>
         </HStack>
         <Divider style={{ margin: '5px 0' }} />
diff --git a/src/renderer/src/pages/home/Tabs/SettingsTab.tsx b/src/renderer/src/pages/home/Tabs/SettingsTab.tsx
index 6125f93b1a..b78135cf1c 100644
--- a/src/renderer/src/pages/home/Tabs/SettingsTab.tsx
+++ b/src/renderer/src/pages/home/Tabs/SettingsTab.tsx
@@ -5,8 +5,6 @@ import {
   DEFAULT_CONTEXTCOUNT,
   DEFAULT_MAX_TOKENS,
   DEFAULT_TEMPERATURE,
-  EXTENDED_CONTEXT_LIMIT,
-  EXTENDED_CONTEXT_STEP,
   isMac,
   isWindows
 } from '@renderer/config/constant'
@@ -15,7 +13,6 @@ import { useAssistant } from '@renderer/hooks/useAssistant'
 import { useSettings } from '@renderer/hooks/useSettings'
 import { SettingDivider, SettingRow, SettingRowTitle, SettingSubtitle } from '@renderer/pages/settings'
 import AssistantSettingsPopup from '@renderer/pages/settings/AssistantSettings'
-import { EVENT_NAMES, EventEmitter } from '@renderer/services/EventService'
 import { useAppDispatch } from '@renderer/store'
 import {
   SendMessageShortcut,
@@ -54,7 +51,7 @@ import {
   TranslateLanguageVarious
 } from '@renderer/types'
 import { modalConfirm } from '@renderer/utils'
-import { Button, Col, Divider, InputNumber, Row, Select, Slider, Switch, Tooltip } from 'antd'
+import { Button, Col, InputNumber, Row, Select, Slider, Switch, Tooltip } from 'antd'
 import { CircleHelp, RotateCcw, Settings2 } from 'lucide-react'
 import { FC, useEffect, useState } from 'react'
 import { useTranslation } from 'react-i18next'
@@ -70,7 +67,6 @@ const SettingsTab: FC<Props> = (props) => {
 
   const [temperature, setTemperature] = useState(assistant?.settings?.temperature ?? DEFAULT_TEMPERATURE)
   const [contextCount, setContextCount] = useState(assistant?.settings?.contextCount ?? DEFAULT_CONTEXTCOUNT)
-  const [enableMaxContexts, setEnableMaxContexts] = useState(assistant?.settings?.enableMaxContexts ?? false)
   const [enableMaxTokens, setEnableMaxTokens] = useState(assistant?.settings?.enableMaxTokens ?? false)
   const [maxTokens, setMaxTokens] = useState(assistant?.settings?.maxTokens ?? 0)
   const [fontSizeValue, setFontSizeValue] = useState(fontSize)
@@ -157,20 +153,7 @@ const SettingsTab: FC<Props> = (props) => {
     setStreamOutput(assistant?.settings?.streamOutput ?? true)
   }, [assistant])
 
-  const formatSliderTooltip = (value?: number) => {
-    if (value === undefined) return ''
-    return value.toString()
-  }
-
-  const validAndChangeContextCount = (contextCount, enableMaxContexts, EXTENDED_CONTEXT_LIMIT) => {
-    if ((typeof contextCount === 'number' ? contextCount : 0) > (enableMaxContexts ? EXTENDED_CONTEXT_LIMIT : 10)) {
-      return enableMaxContexts ? EXTENDED_CONTEXT_LIMIT : 10
-    } else {
-      return typeof contextCount === 'number' ? contextCount : 0
-    }
-  }
-
-  const container = (
+  return (
     <Container className="settings-tab">
       <SettingGroup style={{ marginTop: 10 }}>
         <SettingSubtitle style={{ marginTop: 0, display: 'flex', justifyContent: 'space-between' }}>
@@ -216,31 +199,14 @@ const SettingsTab: FC<Props> = (props) => {
           <Col span={24}>
             <Slider
               min={0}
-              max={!enableMaxContexts ? 10 : EXTENDED_CONTEXT_LIMIT}
+              max={20}
               onChange={setContextCount}
               onChangeComplete={onContextCountChange}
-              value={validAndChangeContextCount(contextCount, enableMaxContexts, EXTENDED_CONTEXT_LIMIT)}
-              step={!enableMaxContexts ? 1 : EXTENDED_CONTEXT_STEP}
-              tooltip={{ formatter: formatSliderTooltip }}
+              value={typeof contextCount === 'number' ? contextCount : 0}
+              step={1}
             />
           </Col>
         </Row>
-        <SettingRow>
-          <SettingRowTitleSmall>{t('chat.settings.max_contexts')}</SettingRowTitleSmall>
-          <Switch
-            size="small"
-            checked={enableMaxContexts}
-            onChange={(checked) => {
-              setEnableMaxContexts(checked)
-              updateAssistantSettings({ enableMaxContexts: checked })
-              if (!checked && contextCount > 10) {
-                setContextCount(10)
-                onUpdateAssistantSettings({ contextCount: 10 })
-              }
-            }}
-          />
-        </SettingRow>
-        <Divider style={{ margin: '10px 0' }} />
         <SettingRow>
           <SettingRowTitleSmall>{t('models.stream_output')}</SettingRowTitleSmall>
           <Switch
@@ -655,22 +621,6 @@ const SettingsTab: FC<Props> = (props) => {
       </SettingGroup>
     </Container>
   )
-  EventEmitter.on(EVENT_NAMES.MAX_CONTEXTS_CHANGED, ({ check, context }): any => {
-    setEnableMaxContexts(check)
-    updateAssistantSettings({ enableMaxContexts: check })
-
-    // Ensure contextCount is within the new valid range
-    let newContextCount = context
-    if (!check && newContextCount > 10) {
-      newContextCount = 10
-    } else if (check && newContextCount > EXTENDED_CONTEXT_LIMIT) {
-      newContextCount = EXTENDED_CONTEXT_LIMIT
-    }
-
-    setContextCount(newContextCount)
-    onUpdateAssistantSettings({ contextCount: newContextCount })
-  })
-  return container
 }
 
 const Container = styled(Scrollbar)`
diff --git a/src/renderer/src/pages/settings/AssistantSettings/AssistantModelSettings.tsx b/src/renderer/src/pages/settings/AssistantSettings/AssistantModelSettings.tsx
index 5f33f4c164..63021e6083 100644
--- a/src/renderer/src/pages/settings/AssistantSettings/AssistantModelSettings.tsx
+++ b/src/renderer/src/pages/settings/AssistantSettings/AssistantModelSettings.tsx
@@ -2,14 +2,8 @@ import { DeleteOutlined, PlusOutlined, QuestionCircleOutlined } from '@ant-desig
 import ModelAvatar from '@renderer/components/Avatar/ModelAvatar'
 import { HStack } from '@renderer/components/Layout'
 import SelectModelPopup from '@renderer/components/Popups/SelectModelPopup'
-import {
-  DEFAULT_CONTEXTCOUNT,
-  DEFAULT_TEMPERATURE,
-  EXTENDED_CONTEXT_LIMIT,
-  EXTENDED_CONTEXT_STEP
-} from '@renderer/config/constant'
+import { DEFAULT_CONTEXTCOUNT, DEFAULT_TEMPERATURE } from '@renderer/config/constant'
 import { SettingRow } from '@renderer/pages/settings'
-import { EVENT_NAMES, EventEmitter } from '@renderer/services/EventService'
 import { Assistant, AssistantSettingCustomParameters, AssistantSettings } from '@renderer/types'
 import { modalConfirm } from '@renderer/utils'
 import { Button, Col, Divider, Input, InputNumber, Row, Select, Slider, Switch, Tooltip } from 'antd'
@@ -27,7 +21,6 @@ interface Props {
 const AssistantModelSettings: FC<Props> = ({ assistant, updateAssistant, updateAssistantSettings }) => {
   const [temperature, setTemperature] = useState(assistant?.settings?.temperature ?? DEFAULT_TEMPERATURE)
   const [contextCount, setContextCount] = useState(assistant?.settings?.contextCount ?? DEFAULT_CONTEXTCOUNT)
-  const [enableMaxContexts, setEnableMaxContexts] = useState(assistant?.settings?.enableMaxContexts ?? false)
   const [enableMaxTokens, setEnableMaxTokens] = useState(assistant?.settings?.enableMaxTokens ?? false)
   const [maxTokens, setMaxTokens] = useState(assistant?.settings?.maxTokens ?? 0)
   const [streamOutput, setStreamOutput] = useState(assistant?.settings?.streamOutput ?? true)
@@ -38,10 +31,6 @@ const AssistantModelSettings: FC<Props> = ({ assistant, updateAssistant, updateA
     assistant?.settings?.customParameters ?? []
   )
 
-  const onUpdateAssistantSettings = (settings: Partial<AssistantSettings>) => {
-    updateAssistantSettings(settings)
-  }
-
   const customParametersRef = useRef(customParameters)
 
   customParametersRef.current = customParameters
@@ -195,14 +184,6 @@ const AssistantModelSettings: FC<Props> = ({ assistant, updateAssistant, updateA
     return value.toString()
   }
 
-  const validAndChangeContextCount = (contextCount, enableMaxContexts, EXTENDED_CONTEXT_LIMIT) => {
-    if ((typeof contextCount === 'number' ? contextCount : 0) > (enableMaxContexts ? EXTENDED_CONTEXT_LIMIT : 10)) {
-      return enableMaxContexts ? EXTENDED_CONTEXT_LIMIT : 10
-    } else {
-      return typeof contextCount === 'number' ? contextCount : 0
-    }
-  }
-
   return (
     <Container>
       <Row align="middle" style={{ marginBottom: 10 }}>
@@ -311,28 +292,26 @@ const AssistantModelSettings: FC<Props> = ({ assistant, updateAssistant, updateA
         <Col span={20}>
           <Slider
             min={0}
-            max={!enableMaxContexts ? 10 : EXTENDED_CONTEXT_LIMIT}
+            max={100}
             onChange={setContextCount}
             onChangeComplete={onContextCountChange}
-            value={validAndChangeContextCount(contextCount, enableMaxContexts, EXTENDED_CONTEXT_LIMIT)}
-            step={!enableMaxContexts ? 1 : EXTENDED_CONTEXT_STEP}
+            value={typeof contextCount === 'number' ? contextCount : 0}
+            marks={{ 0: '0', 25: '25', 50: '50', 75: '75', 100: t('chat.settings.max') }}
+            step={1}
             tooltip={{ formatter: formatSliderTooltip }}
           />
         </Col>
         <Col span={4}>
           <InputNumber
             min={0}
-            max={!enableMaxContexts ? 10 : EXTENDED_CONTEXT_LIMIT}
-            step={!enableMaxContexts ? 1 : EXTENDED_CONTEXT_STEP}
+            max={20}
+            step={1}
             value={contextCount}
             changeOnBlur
             onChange={(value) => {
               if (!isNull(value)) {
                 setContextCount(value)
-                setTimeout(() => {
-                  updateAssistantSettings({ contextCount: value })
-                  onUpdateAssistantSettings({ contextCount: value })
-                }, 500)
+                setTimeout(() => updateAssistantSettings({ contextCount: value }), 500)
               }
             }}
             style={{ width: '100%' }}
@@ -340,27 +319,6 @@ const AssistantModelSettings: FC<Props> = ({ assistant, updateAssistant, updateA
         </Col>
       </Row>
       <Divider style={{ margin: '10px 0' }} />
-      <SettingRow style={{ minHeight: 30 }}>
-        <HStack alignItems="center">
-          <Label>{t('chat.settings.max_contexts')}</Label>
-        </HStack>
-        <Switch
-          checked={enableMaxContexts}
-          onChange={(checked) => {
-            setEnableMaxContexts(checked)
-            updateAssistantSettings({ enableMaxContexts: checked })
-            if (!checked && contextCount > 10) {
-              setContextCount(10)
-              onUpdateAssistantSettings({ contextCount: 10 })
-            }
-            EventEmitter.emit(EVENT_NAMES.MAX_CONTEXTS_CHANGED, {
-              check: checked,
-              context: contextCount
-            })
-          }}
-        />
-      </SettingRow>
-      <Divider style={{ margin: '10px 0' }} />
       <SettingRow style={{ minHeight: 30 }}>
         <HStack alignItems="center">
           <Label>{t('chat.settings.max_tokens')}</Label>
diff --git a/src/renderer/src/services/AssistantService.ts b/src/renderer/src/services/AssistantService.ts
index eb843ed8ff..41e899abd9 100644
--- a/src/renderer/src/services/AssistantService.ts
+++ b/src/renderer/src/services/AssistantService.ts
@@ -102,8 +102,7 @@ export const getAssistantSettings = (assistant: Assistant): AssistantSettings =>
   }
 
   return {
-    enableMaxContexts: assistant?.settings?.enableMaxContexts ?? false,
-    contextCount: contextCount,
+    contextCount: contextCount === 100 ? 100000 : contextCount,
     temperature: assistant?.settings?.temperature ?? DEFAULT_TEMPERATURE,
     topP: assistant?.settings?.topP ?? 1,
     enableMaxTokens: assistant?.settings?.enableMaxTokens ?? false,
diff --git a/src/renderer/src/services/EventService.ts b/src/renderer/src/services/EventService.ts
index 110e763177..309947c9bb 100644
--- a/src/renderer/src/services/EventService.ts
+++ b/src/renderer/src/services/EventService.ts
@@ -26,6 +26,5 @@ export const EVENT_NAMES = {
   ADD_NEW_TOPIC: 'ADD_NEW_TOPIC',
   RESEND_MESSAGE: 'RESEND_MESSAGE',
   SHOW_MODEL_SELECTOR: 'SHOW_MODEL_SELECTOR',
-  QUOTE_TEXT: 'QUOTE_TEXT',
-  MAX_CONTEXTS_CHANGED: 'MAX_CONTEXTS_CHANGED'
+  QUOTE_TEXT: 'QUOTE_TEXT'
 }
diff --git a/src/renderer/src/services/MessagesService.ts b/src/renderer/src/services/MessagesService.ts
index e8371b3108..91a676e7a1 100644
--- a/src/renderer/src/services/MessagesService.ts
+++ b/src/renderer/src/services/MessagesService.ts
@@ -41,7 +41,7 @@ export {
 
 export function getContextCount(assistant: Assistant, messages: Message[]) {
   const rawContextCount = assistant?.settings?.contextCount ?? DEFAULT_CONTEXTCOUNT
-  const maxContextCount = rawContextCount
+  const maxContextCount = rawContextCount === 100 ? 100000 : rawContextCount
 
   const _messages = takeRight(messages, maxContextCount)
 
diff --git a/src/renderer/src/types/index.ts b/src/renderer/src/types/index.ts
index 5b732847ba..e66e629043 100644
--- a/src/renderer/src/types/index.ts
+++ b/src/renderer/src/types/index.ts
@@ -51,7 +51,6 @@ export const EFFORT_RATIO: EffortRatio = {
 
 export type AssistantSettings = {
   contextCount: number
-  enableMaxContexts: boolean
   temperature: number
   topP: number
   maxTokens: number | undefined

From a074ce285b9f65afba9f183c158cb0915d6811da Mon Sep 17 00:00:00 2001
From: kangfenmao <kangfenmao@qq.com>
Date: Thu, 15 May 2025 21:09:03 +0800
Subject: [PATCH 47/50] i18n: update max tokens settings translations for
 multiple languages

* Changed the wording for max tokens settings in English, Japanese, Russian, Simplified Chinese, and Traditional Chinese to improve clarity.
* Adjusted confirmation messages to better reflect the functionality of setting maximum token limits.
---
 src/renderer/src/i18n/locales/en-us.json | 6 +++---
 src/renderer/src/i18n/locales/ja-jp.json | 6 +++---
 src/renderer/src/i18n/locales/ru-ru.json | 6 +++---
 src/renderer/src/i18n/locales/zh-cn.json | 6 +++---
 src/renderer/src/i18n/locales/zh-tw.json | 6 +++---
 5 files changed, 15 insertions(+), 15 deletions(-)

diff --git a/src/renderer/src/i18n/locales/en-us.json b/src/renderer/src/i18n/locales/en-us.json
index a6f6e2f490..5e5b8d7658 100644
--- a/src/renderer/src/i18n/locales/en-us.json
+++ b/src/renderer/src/i18n/locales/en-us.json
@@ -208,9 +208,9 @@
       "settings.context_count": "Context",
       "settings.context_count.tip": "The number of previous messages to keep in the context.",
       "settings.max": "Max",
-      "settings.max_tokens": "Enable max tokens limit",
-      "settings.max_tokens.confirm": "Enable max tokens limit",
-      "settings.max_tokens.confirm_content": "Enable max tokens limit, affects the length of the result. Need to consider the context limit of the model, otherwise an error will be reported",
+      "settings.max_tokens": "Set max tokens",
+      "settings.max_tokens.confirm": "Set max tokens",
+      "settings.max_tokens.confirm_content": "Set the maximum number of tokens the model can generate. Need to consider the context limit of the model, otherwise an error will be reported",
       "settings.max_tokens.tip": "The maximum number of tokens the model can generate. Need to consider the context limit of the model, otherwise an error will be reported",
       "settings.reset": "Reset",
       "settings.set_as_default": "Apply to default assistant",
diff --git a/src/renderer/src/i18n/locales/ja-jp.json b/src/renderer/src/i18n/locales/ja-jp.json
index c6d533ff7e..fbcfca41e7 100644
--- a/src/renderer/src/i18n/locales/ja-jp.json
+++ b/src/renderer/src/i18n/locales/ja-jp.json
@@ -208,9 +208,9 @@
       "settings.context_count": "コンテキスト",
       "settings.context_count.tip": "コンテキストに保持する以前のメッセージの数",
       "settings.max": "最大",
-      "settings.max_tokens": "最大トークン制限を有効にする",
-      "settings.max_tokens.confirm": "最大トークン制限を有効にする",
-      "settings.max_tokens.confirm_content": "最大トークン制限を有効にすると、モデルが生成できる最大トークン数が制限されます。これにより、返される結果の長さに影響が出る可能性があります。モデルのコンテキスト制限に基づいて設定する必要があります。そうしないとエラーが発生します",
+      "settings.max_tokens": "最大トークン数",
+      "settings.max_tokens.confirm": "最大トークン数",
+      "settings.max_tokens.confirm_content": "最大トークン数を設定すると、モデルが生成できる最大トークン数が制限されます。これにより、返される結果の長さに影響が出る可能性があります。モデルのコンテキスト制限に基づいて設定する必要があります。そうしないとエラーが発生します",
       "settings.max_tokens.tip": "モデルが生成できる最大トークン数。モデルのコンテキスト制限に基づいて設定する必要があります。そうしないとエラーが発生します",
       "settings.reset": "リセット",
       "settings.set_as_default": "デフォルトのアシスタントに適用",
diff --git a/src/renderer/src/i18n/locales/ru-ru.json b/src/renderer/src/i18n/locales/ru-ru.json
index a0499603d5..47306614b9 100644
--- a/src/renderer/src/i18n/locales/ru-ru.json
+++ b/src/renderer/src/i18n/locales/ru-ru.json
@@ -208,9 +208,9 @@
       "settings.context_count": "Контекст",
       "settings.context_count.tip": "Количество предыдущих сообщений, которые нужно сохранить в контексте.",
       "settings.max": "Максимум",
-      "settings.max_tokens": "Включить лимит максимальных токенов",
-      "settings.max_tokens.confirm": "Включить лимит максимальных токенов",
-      "settings.max_tokens.confirm_content": "Включить лимит максимальных токенов, влияет на длину результата. Нужно учитывать контекст модели, иначе будет ошибка",
+      "settings.max_tokens": "Максимальное количество токенов",
+      "settings.max_tokens.confirm": "Максимальное количество токенов",
+      "settings.max_tokens.confirm_content": "Установить максимальное количество токенов, влияет на длину результата. Нужно учитывать контекст модели, иначе будет ошибка",
       "settings.max_tokens.tip": "Максимальное количество токенов, которые может сгенерировать модель. Нужно учитывать контекст модели, иначе будет ошибка",
       "settings.reset": "Сбросить",
       "settings.set_as_default": "Применить к ассистенту по умолчанию",
diff --git a/src/renderer/src/i18n/locales/zh-cn.json b/src/renderer/src/i18n/locales/zh-cn.json
index 9e6db07041..39e7655523 100644
--- a/src/renderer/src/i18n/locales/zh-cn.json
+++ b/src/renderer/src/i18n/locales/zh-cn.json
@@ -222,9 +222,9 @@
       "settings.context_count": "上下文数",
       "settings.context_count.tip": "要保留在上下文中的消息数量，数值越大，上下文越长，消耗的 token 越多。普通聊天建议 5-10",
       "settings.max": "不限",
-      "settings.max_tokens": "开启消息长度限制",
-      "settings.max_tokens.confirm": "开启消息长度限制",
-      "settings.max_tokens.confirm_content": "开启消息长度限制后，单次交互所用的最大 Token 数, 会影响返回结果的长度。要根据模型上下文限制来设置，否则会报错",
+      "settings.max_tokens": "最大 Token 数",
+      "settings.max_tokens.confirm": "最大 Token 数",
+      "settings.max_tokens.confirm_content": "设置单次交互所用的最大 Token 数, 会影响返回结果的长度。要根据模型上下文限制来设置，否则会报错",
       "settings.max_tokens.tip": "单次交互所用的最大 Token 数, 会影响返回结果的长度。要根据模型上下文限制来设置，否则会报错",
       "settings.reset": "重置",
       "settings.set_as_default": "应用到默认助手",
diff --git a/src/renderer/src/i18n/locales/zh-tw.json b/src/renderer/src/i18n/locales/zh-tw.json
index 16facb9ae0..3eb7efd583 100644
--- a/src/renderer/src/i18n/locales/zh-tw.json
+++ b/src/renderer/src/i18n/locales/zh-tw.json
@@ -208,9 +208,9 @@
       "settings.context_count": "上下文",
       "settings.context_count.tip": "在上下文中保留的前幾則訊息。",
       "settings.max": "最大",
-      "settings.max_tokens": "啟用最大 Token 限制",
-      "settings.max_tokens.confirm": "啟用訊息長度限制",
-      "settings.max_tokens.confirm_content": "啟用訊息長度限制後，單次互動所用的最大 Token 數，會影響返回結果的長度。要根據模型上下文限制來設定，否則會發生錯誤。",
+      "settings.max_tokens": "最大 Token 數",
+      "settings.max_tokens.confirm": "設置最大 Token 數",
+      "settings.max_tokens.confirm_content": "設置單次交互所用的最大 Token 數，會影響返回結果的長度。要根據模型上下文限制來設定，否則會發生錯誤。",
       "settings.max_tokens.tip": "模型可以生成的最大 Token 數。要根據模型上下文限制來設定，否則會發生錯誤。",
       "settings.reset": "重設",
       "settings.set_as_default": "設為預設助手",

From dcb1d22b33ae395fdd34a2c2f75d9ca8df996004 Mon Sep 17 00:00:00 2001
From: kangfenmao <kangfenmao@qq.com>
Date: Thu, 15 May 2025 21:23:26 +0800
Subject: [PATCH 48/50] refactor: add tool use mode translations and refactor
 settings

* Introduced new translations for "Tool Use Mode" and its options ("Function" and "Prompt") in English, Japanese, Russian, Simplified Chinese, and Traditional Chinese.
* Refactored settings components to replace the deprecated `enableToolUse` with `toolUseMode`, updating related logic and UI elements accordingly.
* Adjusted migration logic to ensure backward compatibility with previous settings.
---
 src/renderer/src/i18n/locales/en-us.json      |  3 +++
 src/renderer/src/i18n/locales/ja-jp.json      |  5 +++-
 src/renderer/src/i18n/locales/ru-ru.json      |  3 +++
 src/renderer/src/i18n/locales/zh-cn.json      |  3 +++
 src/renderer/src/i18n/locales/zh-tw.json      |  5 +++-
 .../src/pages/home/Messages/MessageTools.tsx  |  3 ++-
 .../src/pages/home/Tabs/SettingsTab.tsx       | 18 +++----------
 .../AssistantModelSettings.tsx                | 25 +++++++++++--------
 .../providers/AiProvider/AnthropicProvider.ts |  5 ++--
 .../providers/AiProvider/GeminiProvider.ts    |  5 ++--
 .../providers/AiProvider/OpenAIProvider.ts    |  9 +++++--
 .../AiProvider/OpenAIResponseProvider.ts      |  5 ++--
 src/renderer/src/services/AssistantService.ts |  2 +-
 src/renderer/src/store/migrate.ts             | 11 ++++++++
 src/renderer/src/types/index.ts               |  2 +-
 src/renderer/src/utils/mcp-tools.ts           | 22 ++++++++++++++--
 16 files changed, 87 insertions(+), 39 deletions(-)

diff --git a/src/renderer/src/i18n/locales/en-us.json b/src/renderer/src/i18n/locales/en-us.json
index 5e5b8d7658..12dcef76ce 100644
--- a/src/renderer/src/i18n/locales/en-us.json
+++ b/src/renderer/src/i18n/locales/en-us.json
@@ -88,6 +88,9 @@
       "settings.knowledge_base.recognition": "Use Knowledge Base",
       "settings.knowledge_base.recognition.off": "Force Search",
       "settings.knowledge_base.recognition.on": "Intent Recognition",
+      "settings.tool_use_mode": "Tool Use Mode",
+      "settings.tool_use_mode.function": "Function",
+      "settings.tool_use_mode.prompt": "Prompt",
       "settings.regular_phrases": {
         "title": "Regular Phrase",
         "add": "Add Phrase",
diff --git a/src/renderer/src/i18n/locales/ja-jp.json b/src/renderer/src/i18n/locales/ja-jp.json
index fbcfca41e7..4c743a4e34 100644
--- a/src/renderer/src/i18n/locales/ja-jp.json
+++ b/src/renderer/src/i18n/locales/ja-jp.json
@@ -98,7 +98,10 @@
       "settings.knowledge_base.recognition.tip": "アシスタントは大規模言語モデルの意図認識能力を使用して、ナレッジベースを参照する必要があるかどうかを判断します。この機能はモデルの能力に依存します",
       "settings.knowledge_base.recognition": "ナレッジベースの呼び出し",
       "settings.knowledge_base.recognition.off": "強制検索",
-      "settings.knowledge_base.recognition.on": "意図認識"
+      "settings.knowledge_base.recognition.on": "意図認識",
+      "settings.tool_use_mode": "工具調用方式",
+      "settings.tool_use_mode.function": "関数",
+      "settings.tool_use_mode.prompt": "提示詞"
     },
     "auth": {
       "error": "APIキーの自動取得に失敗しました。手動で取得してください",
diff --git a/src/renderer/src/i18n/locales/ru-ru.json b/src/renderer/src/i18n/locales/ru-ru.json
index 47306614b9..30332b88a3 100644
--- a/src/renderer/src/i18n/locales/ru-ru.json
+++ b/src/renderer/src/i18n/locales/ru-ru.json
@@ -88,6 +88,9 @@
       "settings.knowledge_base.recognition": "Использование базы знаний",
       "settings.knowledge_base.recognition.off": "Принудительный поиск",
       "settings.knowledge_base.recognition.on": "Распознавание намерений",
+      "settings.tool_use_mode": "Режим использования инструментов",
+      "settings.tool_use_mode.function": "Функция",
+      "settings.tool_use_mode.prompt": "Подсказка",
       "settings.regular_phrases": {
         "title": "Регулярные подсказки",
         "add": "Добавить подсказку",
diff --git a/src/renderer/src/i18n/locales/zh-cn.json b/src/renderer/src/i18n/locales/zh-cn.json
index 39e7655523..df40aacdbe 100644
--- a/src/renderer/src/i18n/locales/zh-cn.json
+++ b/src/renderer/src/i18n/locales/zh-cn.json
@@ -78,6 +78,9 @@
       "settings.knowledge_base.recognition": "调用知识库",
       "settings.knowledge_base.recognition.off": "强制检索",
       "settings.knowledge_base.recognition.on": "意图识别",
+      "settings.tool_use_mode": "工具调用方式",
+      "settings.tool_use_mode.function": "函数",
+      "settings.tool_use_mode.prompt": "提示词",
       "settings.model": "模型设置",
       "settings.preset_messages": "预设消息",
       "settings.prompt": "提示词设置",
diff --git a/src/renderer/src/i18n/locales/zh-tw.json b/src/renderer/src/i18n/locales/zh-tw.json
index 3eb7efd583..de3c0a9593 100644
--- a/src/renderer/src/i18n/locales/zh-tw.json
+++ b/src/renderer/src/i18n/locales/zh-tw.json
@@ -98,7 +98,10 @@
       "settings.knowledge_base.recognition.tip": "智慧代理人將調用大語言模型的意圖識別能力，判斷是否需要調用知識庫進行回答，該功能將依賴模型的能力",
       "settings.knowledge_base.recognition": "調用知識庫",
       "settings.knowledge_base.recognition.off": "強制檢索",
-      "settings.knowledge_base.recognition.on": "意圖識別"
+      "settings.knowledge_base.recognition.on": "意圖識別",
+      "settings.tool_use_mode": "工具調用方式",
+      "settings.tool_use_mode.function": "函數",
+      "settings.tool_use_mode.prompt": "提示詞"
     },
     "auth": {
       "error": "自動取得金鑰失敗，請手動取得",
diff --git a/src/renderer/src/pages/home/Messages/MessageTools.tsx b/src/renderer/src/pages/home/Messages/MessageTools.tsx
index 433f1af051..b381fc171d 100644
--- a/src/renderer/src/pages/home/Messages/MessageTools.tsx
+++ b/src/renderer/src/pages/home/Messages/MessageTools.tsx
@@ -212,7 +212,8 @@ const MessageTools: FC<Props> = ({ blocks }) => {
 }
 
 const CollapseContainer = styled(Collapse)`
-  margin-bottom: 15px;
+  margin-top: 10px;
+  margin-bottom: 12px;
   border-radius: 8px;
   overflow: hidden;
 
diff --git a/src/renderer/src/pages/home/Tabs/SettingsTab.tsx b/src/renderer/src/pages/home/Tabs/SettingsTab.tsx
index b78135cf1c..06bd5e335b 100644
--- a/src/renderer/src/pages/home/Tabs/SettingsTab.tsx
+++ b/src/renderer/src/pages/home/Tabs/SettingsTab.tsx
@@ -71,7 +71,6 @@ const SettingsTab: FC<Props> = (props) => {
   const [maxTokens, setMaxTokens] = useState(assistant?.settings?.maxTokens ?? 0)
   const [fontSizeValue, setFontSizeValue] = useState(fontSize)
   const [streamOutput, setStreamOutput] = useState(assistant?.settings?.streamOutput ?? true)
-  const [enableToolUse, setEnableToolUse] = useState(assistant?.settings?.enableToolUse ?? false)
   const { t } = useTranslation()
 
   const dispatch = useAppDispatch()
@@ -153,6 +152,9 @@ const SettingsTab: FC<Props> = (props) => {
     setStreamOutput(assistant?.settings?.streamOutput ?? true)
   }, [assistant])
 
+  const assistantContextCount = assistant?.settings?.contextCount || 20
+  const maxContextCount = assistantContextCount > 20 ? assistantContextCount : 20
+
   return (
     <Container className="settings-tab">
       <SettingGroup style={{ marginTop: 10 }}>
@@ -199,7 +201,7 @@ const SettingsTab: FC<Props> = (props) => {
           <Col span={24}>
             <Slider
               min={0}
-              max={20}
+              max={maxContextCount}
               onChange={setContextCount}
               onChangeComplete={onContextCountChange}
               value={typeof contextCount === 'number' ? contextCount : 0}
@@ -219,18 +221,6 @@ const SettingsTab: FC<Props> = (props) => {
           />
         </SettingRow>
         <SettingDivider />
-        <SettingRow>
-          <SettingRowTitleSmall>{t('models.enable_tool_use')}</SettingRowTitleSmall>
-          <Switch
-            size="small"
-            checked={enableToolUse}
-            onChange={(checked) => {
-              setEnableToolUse(checked)
-              updateAssistantSettings({ enableToolUse: checked })
-            }}
-          />
-        </SettingRow>
-        <SettingDivider />
         <Row align="middle" justify="space-between" style={{ marginBottom: 10 }}>
           <HStack alignItems="center">
             <Label>{t('chat.settings.max_tokens')}</Label>
diff --git a/src/renderer/src/pages/settings/AssistantSettings/AssistantModelSettings.tsx b/src/renderer/src/pages/settings/AssistantSettings/AssistantModelSettings.tsx
index 63021e6083..1a22848ce5 100644
--- a/src/renderer/src/pages/settings/AssistantSettings/AssistantModelSettings.tsx
+++ b/src/renderer/src/pages/settings/AssistantSettings/AssistantModelSettings.tsx
@@ -24,7 +24,7 @@ const AssistantModelSettings: FC<Props> = ({ assistant, updateAssistant, updateA
   const [enableMaxTokens, setEnableMaxTokens] = useState(assistant?.settings?.enableMaxTokens ?? false)
   const [maxTokens, setMaxTokens] = useState(assistant?.settings?.maxTokens ?? 0)
   const [streamOutput, setStreamOutput] = useState(assistant?.settings?.streamOutput ?? true)
-  const [enableToolUse, setEnableToolUse] = useState(assistant?.settings?.enableToolUse ?? false)
+  const [toolUseMode, setToolUseMode] = useState(assistant?.settings?.toolUseMode ?? 'prompt')
   const [defaultModel, setDefaultModel] = useState(assistant?.defaultModel)
   const [topP, setTopP] = useState(assistant?.settings?.topP ?? 1)
   const [customParameters, setCustomParameters] = useState<AssistantSettingCustomParameters[]>(
@@ -150,6 +150,7 @@ const AssistantModelSettings: FC<Props> = ({ assistant, updateAssistant, updateA
     setStreamOutput(true)
     setTopP(1)
     setCustomParameters([])
+    setToolUseMode('prompt')
     updateAssistantSettings({
       temperature: DEFAULT_TEMPERATURE,
       contextCount: DEFAULT_CONTEXTCOUNT,
@@ -157,7 +158,8 @@ const AssistantModelSettings: FC<Props> = ({ assistant, updateAssistant, updateA
       maxTokens: 0,
       streamOutput: true,
       topP: 1,
-      customParameters: []
+      customParameters: [],
+      toolUseMode: 'prompt'
     })
   }
 
@@ -379,14 +381,17 @@ const AssistantModelSettings: FC<Props> = ({ assistant, updateAssistant, updateA
       </SettingRow>
       <Divider style={{ margin: '10px 0' }} />
       <SettingRow style={{ minHeight: 30 }}>
-        <Label>{t('models.enable_tool_use')}</Label>
-        <Switch
-          checked={enableToolUse}
-          onChange={(checked) => {
-            setEnableToolUse(checked)
-            updateAssistantSettings({ enableToolUse: checked })
-          }}
-        />
+        <Label>{t('assistants.settings.tool_use_mode')}</Label>
+        <Select
+          value={toolUseMode}
+          style={{ width: 110 }}
+          onChange={(value) => {
+            setToolUseMode(value)
+            updateAssistantSettings({ toolUseMode: value })
+          }}>
+          <Select.Option value="prompt">{t('assistants.settings.tool_use_mode.prompt')}</Select.Option>
+          <Select.Option value="function">{t('assistants.settings.tool_use_mode.function')}</Select.Option>
+        </Select>
       </SettingRow>
       <Divider style={{ margin: '10px 0' }} />
       <SettingRow style={{ minHeight: 30 }}>
diff --git a/src/renderer/src/providers/AiProvider/AnthropicProvider.ts b/src/renderer/src/providers/AiProvider/AnthropicProvider.ts
index 51f2eaff13..159b5f4292 100644
--- a/src/renderer/src/providers/AiProvider/AnthropicProvider.ts
+++ b/src/renderer/src/providers/AiProvider/AnthropicProvider.ts
@@ -43,6 +43,7 @@ import type { Message } from '@renderer/types/newMessage'
 import { removeSpecialCharactersForTopicName } from '@renderer/utils'
 import {
   anthropicToolUseToMcpTool,
+  isEnabledToolUse,
   mcpToolCallResponseToAnthropicMessage,
   mcpToolsToAnthropicTools,
   parseAndCallTools
@@ -207,7 +208,7 @@ export default class AnthropicProvider extends BaseProvider {
   public async completions({ messages, assistant, mcpTools, onChunk, onFilterMessages }: CompletionsParams) {
     const defaultModel = getDefaultModel()
     const model = assistant.model || defaultModel
-    const { contextCount, maxTokens, streamOutput, enableToolUse } = getAssistantSettings(assistant)
+    const { contextCount, maxTokens, streamOutput } = getAssistantSettings(assistant)
 
     const userMessagesParams: MessageParam[] = []
 
@@ -229,7 +230,7 @@ export default class AnthropicProvider extends BaseProvider {
     const { tools } = this.setupToolsConfig<ToolUnion>({
       model,
       mcpTools,
-      enableToolUse
+      enableToolUse: isEnabledToolUse(assistant)
     })
 
     if (this.useSystemPromptForTools && mcpTools && mcpTools.length) {
diff --git a/src/renderer/src/providers/AiProvider/GeminiProvider.ts b/src/renderer/src/providers/AiProvider/GeminiProvider.ts
index 900bed0e94..46ea431f6f 100644
--- a/src/renderer/src/providers/AiProvider/GeminiProvider.ts
+++ b/src/renderer/src/providers/AiProvider/GeminiProvider.ts
@@ -54,6 +54,7 @@ import type { Message, Response } from '@renderer/types/newMessage'
 import { removeSpecialCharactersForTopicName } from '@renderer/utils'
 import {
   geminiFunctionCallToMcpTool,
+  isEnabledToolUse,
   mcpToolCallResponseToGeminiMessage,
   mcpToolsToGeminiTools,
   parseAndCallTools
@@ -340,7 +341,7 @@ export default class GeminiProvider extends BaseProvider {
       await this.generateImageByChat({ messages, assistant, onChunk })
       return
     }
-    const { contextCount, maxTokens, streamOutput, enableToolUse } = getAssistantSettings(assistant)
+    const { contextCount, maxTokens, streamOutput } = getAssistantSettings(assistant)
 
     const userMessages = filterUserRoleStartMessages(
       filterEmptyMessages(filterContextMessages(takeRight(messages, contextCount + 2)))
@@ -360,7 +361,7 @@ export default class GeminiProvider extends BaseProvider {
     const { tools } = this.setupToolsConfig<Tool>({
       mcpTools,
       model,
-      enableToolUse
+      enableToolUse: isEnabledToolUse(assistant)
     })
 
     if (this.useSystemPromptForTools) {
diff --git a/src/renderer/src/providers/AiProvider/OpenAIProvider.ts b/src/renderer/src/providers/AiProvider/OpenAIProvider.ts
index 62418ccdb0..f9f78cebe4 100644
--- a/src/renderer/src/providers/AiProvider/OpenAIProvider.ts
+++ b/src/renderer/src/providers/AiProvider/OpenAIProvider.ts
@@ -53,6 +53,7 @@ import {
   convertLinksToZhipu
 } from '@renderer/utils/linkConverter'
 import {
+  isEnabledToolUse,
   mcpToolCallResponseToOpenAICompatibleMessage,
   mcpToolsToOpenAIChatTools,
   openAIToolsToMcpTool,
@@ -351,7 +352,7 @@ export default class OpenAIProvider extends BaseOpenAIProvider {
     const defaultModel = getDefaultModel()
     const model = assistant.model || defaultModel
 
-    const { contextCount, maxTokens, streamOutput, enableToolUse } = getAssistantSettings(assistant)
+    const { contextCount, maxTokens, streamOutput } = getAssistantSettings(assistant)
     const isEnabledBultinWebSearch = assistant.enableWebSearch
     messages = addImageFileToContents(messages)
     const enableReasoning =
@@ -365,7 +366,11 @@ export default class OpenAIProvider extends BaseOpenAIProvider {
         content: `Formatting re-enabled${systemMessage ? '\n' + systemMessage.content : ''}`
       }
     }
-    const { tools } = this.setupToolsConfig<ChatCompletionTool>({ mcpTools, model, enableToolUse })
+    const { tools } = this.setupToolsConfig<ChatCompletionTool>({
+      mcpTools,
+      model,
+      enableToolUse: isEnabledToolUse(assistant)
+    })
 
     if (this.useSystemPromptForTools) {
       systemMessage.content = buildSystemPrompt(systemMessage.content || '', mcpTools)
diff --git a/src/renderer/src/providers/AiProvider/OpenAIResponseProvider.ts b/src/renderer/src/providers/AiProvider/OpenAIResponseProvider.ts
index 4d9a6f57bf..baacc96c44 100644
--- a/src/renderer/src/providers/AiProvider/OpenAIResponseProvider.ts
+++ b/src/renderer/src/providers/AiProvider/OpenAIResponseProvider.ts
@@ -37,6 +37,7 @@ import { removeSpecialCharactersForTopicName } from '@renderer/utils'
 import { addImageFileToContents } from '@renderer/utils/formats'
 import { convertLinks } from '@renderer/utils/linkConverter'
 import {
+  isEnabledToolUse,
   mcpToolCallResponseToOpenAIMessage,
   mcpToolsToOpenAIResponseTools,
   openAIToolsToMcpTool,
@@ -289,7 +290,7 @@ export abstract class BaseOpenAIProvider extends BaseProvider {
     }
     const defaultModel = getDefaultModel()
     const model = assistant.model || defaultModel
-    const { contextCount, maxTokens, streamOutput, enableToolUse } = getAssistantSettings(assistant)
+    const { contextCount, maxTokens, streamOutput } = getAssistantSettings(assistant)
     const isEnabledBuiltinWebSearch = assistant.enableWebSearch
 
     let tools: OpenAI.Responses.Tool[] = []
@@ -318,7 +319,7 @@ export abstract class BaseOpenAIProvider extends BaseProvider {
     const { tools: extraTools } = this.setupToolsConfig<OpenAI.Responses.Tool>({
       mcpTools,
       model,
-      enableToolUse
+      enableToolUse: isEnabledToolUse(assistant)
     })
 
     tools = tools.concat(extraTools)
diff --git a/src/renderer/src/services/AssistantService.ts b/src/renderer/src/services/AssistantService.ts
index 41e899abd9..6ef0a4474f 100644
--- a/src/renderer/src/services/AssistantService.ts
+++ b/src/renderer/src/services/AssistantService.ts
@@ -108,7 +108,7 @@ export const getAssistantSettings = (assistant: Assistant): AssistantSettings =>
     enableMaxTokens: assistant?.settings?.enableMaxTokens ?? false,
     maxTokens: getAssistantMaxTokens(),
     streamOutput: assistant?.settings?.streamOutput ?? true,
-    enableToolUse: assistant?.settings?.enableToolUse ?? false,
+    toolUseMode: assistant?.settings?.toolUseMode ?? 'prompt',
     hideMessages: assistant?.settings?.hideMessages ?? false,
     defaultModel: assistant?.defaultModel ?? undefined,
     customParameters: assistant?.settings?.customParameters ?? []
diff --git a/src/renderer/src/store/migrate.ts b/src/renderer/src/store/migrate.ts
index 9ed708248b..029b05125c 100644
--- a/src/renderer/src/store/migrate.ts
+++ b/src/renderer/src/store/migrate.ts
@@ -1319,6 +1319,17 @@ const migrateConfig = {
   },
   '101': (state: RootState) => {
     try {
+      state.assistants.assistants.forEach((assistant) => {
+        if (assistant.settings) {
+          // @ts-ignore eslint-disable-next-line
+          if (assistant.settings.enableToolUse) {
+            // @ts-ignore eslint-disable-next-line
+            assistant.settings.toolUseMode = assistant.settings.enableToolUse ? 'function' : 'prompt'
+            // @ts-ignore eslint-disable-next-line
+            delete assistant.settings.enableToolUse
+          }
+        }
+      })
       if (state.shortcuts) {
         state.shortcuts.shortcuts.push({
           key: 'exit_fullscreen',
diff --git a/src/renderer/src/types/index.ts b/src/renderer/src/types/index.ts
index e66e629043..ac10c11b3d 100644
--- a/src/renderer/src/types/index.ts
+++ b/src/renderer/src/types/index.ts
@@ -56,12 +56,12 @@ export type AssistantSettings = {
   maxTokens: number | undefined
   enableMaxTokens: boolean
   streamOutput: boolean
-  enableToolUse: boolean
   hideMessages: boolean
   defaultModel?: Model
   customParameters?: AssistantSettingCustomParameters[]
   reasoning_effort?: ReasoningEffortOptions
   qwenThinkMode?: boolean
+  toolUseMode?: 'function' | 'prompt'
 }
 
 export type Agent = Omit<Assistant, 'model'> & {
diff --git a/src/renderer/src/utils/mcp-tools.ts b/src/renderer/src/utils/mcp-tools.ts
index e59b9ff1e5..4c446ffa78 100644
--- a/src/renderer/src/utils/mcp-tools.ts
+++ b/src/renderer/src/utils/mcp-tools.ts
@@ -7,10 +7,18 @@ import {
 } from '@anthropic-ai/sdk/resources'
 import { Content, FunctionCall, Part, Tool, Type as GeminiSchemaType } from '@google/genai'
 import Logger from '@renderer/config/logger'
-import { isVisionModel } from '@renderer/config/models'
+import { isFunctionCallingModel, isVisionModel } from '@renderer/config/models'
 import store from '@renderer/store'
 import { addMCPServer } from '@renderer/store/mcp'
-import { MCPCallToolResponse, MCPServer, MCPTool, MCPToolResponse, Model, ToolUseResponse } from '@renderer/types'
+import {
+  Assistant,
+  MCPCallToolResponse,
+  MCPServer,
+  MCPTool,
+  MCPToolResponse,
+  Model,
+  ToolUseResponse
+} from '@renderer/types'
 import type { MCPToolCompleteChunk, MCPToolInProgressChunk } from '@renderer/types/chunk'
 import { ChunkType } from '@renderer/types/chunk'
 import { isArray, isObject, pull, transform } from 'lodash'
@@ -824,3 +832,13 @@ export function mcpToolCallResponseToGeminiMessage(
 
   return message
 }
+
+export function isEnabledToolUse(assistant: Assistant) {
+  if (assistant.model) {
+    if (isFunctionCallingModel(assistant.model)) {
+      return assistant.settings?.toolUseMode === 'function'
+    }
+  }
+
+  return false
+}

From f5f932def4c4ce153af1e00fadcd2060911c5ad3 Mon Sep 17 00:00:00 2001
From: Song <1667077010@qq.com>
Date: Thu, 15 May 2025 22:07:10 +0800
Subject: [PATCH 49/50] fix: fix portable dir setup time (#6022)

---
 src/main/index.ts | 5 +++--
 1 file changed, 3 insertions(+), 2 deletions(-)

diff --git a/src/main/index.ts b/src/main/index.ts
index d4cd944d8a..fb79b1e842 100644
--- a/src/main/index.ts
+++ b/src/main/index.ts
@@ -40,6 +40,9 @@ if (!app.requestSingleInstanceLock()) {
   app.quit()
   process.exit(0)
 } else {
+  // Portable dir must be setup before app ready
+  setUserDataDir()
+  
   // This method will be called when Electron has finished
   // initialization and is ready to create browser windows.
   // Some APIs can only be used after this event occurs.
@@ -72,8 +75,6 @@ if (!app.requestSingleInstanceLock()) {
 
     replaceDevtoolsFont(mainWindow)
 
-    setUserDataDir()
-
     // Setup deep link for AppImage on Linux
     await setupAppImageDeepLink()
 

From f5f13a3eba8db2b56aa08dffb9eec85b3b28f4ea Mon Sep 17 00:00:00 2001
From: kangfenmao <kangfenmao@qq.com>
Date: Thu, 15 May 2025 22:43:51 +0800
Subject: [PATCH 50/50] style: adjust padding and layout in various components

* Updated padding in CustomCollapse for improved spacing.
* Modified Messages component to conditionally apply padding based on prompt visibility.
* Enhanced ModelListSearchBar by adding a flex display style for better alignment.
* Increased gap in ProviderSetting's HStack for improved layout consistency.
---
 src/renderer/src/components/CustomCollapse.tsx       |  2 +-
 src/renderer/src/pages/home/Messages/Messages.tsx    |  4 ++--
 .../settings/DisplaySettings/DisplaySettings.tsx     | 12 +++++-------
 .../settings/ProviderSettings/ModelListSearchBar.tsx |  2 +-
 .../settings/ProviderSettings/ProviderSetting.tsx    |  2 +-
 5 files changed, 10 insertions(+), 12 deletions(-)

diff --git a/src/renderer/src/components/CustomCollapse.tsx b/src/renderer/src/components/CustomCollapse.tsx
index c02f45c60c..2828379399 100644
--- a/src/renderer/src/components/CustomCollapse.tsx
+++ b/src/renderer/src/components/CustomCollapse.tsx
@@ -36,7 +36,7 @@ const CustomCollapse: FC<CustomCollapseProps> = ({
 
   const defaultCollapseItemStyles = {
     header: {
-      padding: '8px 16px',
+      padding: '3px 16px',
       alignItems: 'center',
       justifyContent: 'space-between',
       background: 'var(--color-background-soft)',
diff --git a/src/renderer/src/pages/home/Messages/Messages.tsx b/src/renderer/src/pages/home/Messages/Messages.tsx
index 6da7985fd4..f69dc678aa 100644
--- a/src/renderer/src/pages/home/Messages/Messages.tsx
+++ b/src/renderer/src/pages/home/Messages/Messages.tsx
@@ -225,7 +225,7 @@ const Messages: React.FC<MessagesProps> = ({ assistant, topic, setActiveTopic })
   return (
     <Container
       id="messages"
-      style={{ maxWidth }}
+      style={{ maxWidth, paddingTop: showPrompt ? 10 : 0 }}
       key={assistant.id}
       ref={containerRef}
       $right={topicPosition === 'left'}>
@@ -319,7 +319,7 @@ interface ContainerProps {
 const Container = styled(Scrollbar)<ContainerProps>`
   display: flex;
   flex-direction: column-reverse;
-  padding: 10px 0 10px;
+  padding: 10px 0 20px;
   overflow-x: hidden;
   background-color: var(--color-background);
   z-index: 1;
diff --git a/src/renderer/src/pages/settings/DisplaySettings/DisplaySettings.tsx b/src/renderer/src/pages/settings/DisplaySettings/DisplaySettings.tsx
index 335f8ecbf4..ad93b8fa38 100644
--- a/src/renderer/src/pages/settings/DisplaySettings/DisplaySettings.tsx
+++ b/src/renderer/src/pages/settings/DisplaySettings/DisplaySettings.tsx
@@ -14,7 +14,7 @@ import {
 } from '@renderer/store/settings'
 import { ThemeMode } from '@renderer/types'
 import { Button, Input, Segmented, Switch } from 'antd'
-import { Minus, Plus } from 'lucide-react'
+import { Minus, Plus, RotateCcw } from 'lucide-react'
 import { FC, useCallback, useEffect, useMemo, useState } from 'react'
 import { useTranslation } from 'react-i18next'
 import styled from 'styled-components'
@@ -141,12 +141,10 @@ const DisplaySettings: FC = () => {
             <ZoomValue>{Math.round(currentZoom * 100)}%</ZoomValue>
             <Button onClick={() => handleZoomFactor(0.1)} icon={<Plus size="14" />} />
             <Button
-              onClick={() => {
-                handleZoomFactor(0, true)
-              }}
-              style={{ marginLeft: 8 }}>
-              {t('settings.zoom.reset')}
-            </Button>
+              onClick={() => handleZoomFactor(0, true)}
+              style={{ marginLeft: 8 }}
+              icon={<RotateCcw size="14" />}
+            />
           </ZoomButtonGroup>
         </SettingRow>
         {isMac && (
diff --git a/src/renderer/src/pages/settings/ProviderSettings/ModelListSearchBar.tsx b/src/renderer/src/pages/settings/ProviderSettings/ModelListSearchBar.tsx
index bf59cf2e50..8a9e7cd68d 100644
--- a/src/renderer/src/pages/settings/ProviderSettings/ModelListSearchBar.tsx
+++ b/src/renderer/src/pages/settings/ProviderSettings/ModelListSearchBar.tsx
@@ -78,7 +78,7 @@ const ModelListSearchBar: React.FC<ModelListSearchBarProps> = ({ onSearch }) =>
           visible: { opacity: 1, transition: { duration: 0.1, delay: 0.3, ease: 'easeInOut' } },
           hidden: { opacity: 0, transition: { duration: 0.1, ease: 'easeInOut' } }
         }}
-        style={{ cursor: 'pointer' }}
+        style={{ cursor: 'pointer', display: 'flex' }}
         onClick={() => setSearchVisible(true)}>
         <Tooltip title={t('models.search')} mouseEnterDelay={0.5}>
           <Search size={14} color="var(--color-icon)" />
diff --git a/src/renderer/src/pages/settings/ProviderSettings/ProviderSetting.tsx b/src/renderer/src/pages/settings/ProviderSettings/ProviderSetting.tsx
index 2f58a924dd..31ea151cbb 100644
--- a/src/renderer/src/pages/settings/ProviderSettings/ProviderSetting.tsx
+++ b/src/renderer/src/pages/settings/ProviderSettings/ProviderSetting.tsx
@@ -404,7 +404,7 @@ const ProviderSetting: FC<Props> = ({ provider: _provider }) => {
       {provider.id === 'copilot' && <GithubCopilotSettings provider={provider} setApiKey={setApiKey} />}
       <SettingSubtitle style={{ marginBottom: 5 }}>
         <Space align="center" style={{ width: '100%', justifyContent: 'space-between' }}>
-          <HStack alignItems="center" gap={5}>
+          <HStack alignItems="center" gap={8} mb={5}>
             <SettingSubtitle style={{ marginTop: 0 }}>{t('common.models')}</SettingSubtitle>
             {!isEmpty(models) && <ModelListSearchBar onSearch={setModelSearchText} />}
           </HStack>