Bitget App
交易「智」變
阿里巴巴發布 Qwen-Image-Edit:20B 高級圖像和文字編輯開源模型

阿里巴巴發布 Qwen-Image-Edit:20B 高級圖像和文字編輯開源模型

MpostMpost2025/08/20 01:40
作者:Mpost

簡單來說 阿里雲 Qwen 團隊推出了 Qwen-Image-Edit,這是一種最先進的圖像編輯模型,它將語義和外觀編輯與精確的雙語文字修改相結合,為創意和實際應用提供了先進的功能。

阿里雲的 奎文 團隊推出了 Qwen-Image-Edit,這是一款基於 20B Qwen-Image 框架的高級影像編輯模型。新系統將 Qwen-Image 獨特的文字渲染功能應用於影像編輯,並特別注重文字修改的精確度。 Qwen-Image-Edit 透過兩個平行組件處理輸入影像:Qwen2.5-VL(管理視覺語意控制)和 VAE 編碼器(控制視覺外觀)。這種雙重方法使模型能夠有效地處理語義級和外觀級的編輯任務。該工具可透過 Qwen Chat 的「影像編輯」功能存取。

Qwen-Image-Edit 旨在實現跨多個編輯維度的效能。它支援外觀層級的調整,例如在保持圖像其他區域不變的情況下添加、移除或修改視覺元素;也支援語義層級的編輯,例如智慧財產權創建、物件旋轉或樣式轉換,允許進行更廣泛的像素更改,同時保持語義完整性。它還提供中英文文字編輯功能,允許使用者在圖像中添加、移除或調整文本,同時保持字體、大小和樣式的一致性。在多個廣受認可的數據集上進行的基準測試表明,Qwen-Image-Edit 在圖像編輯方面達到了頂尖水平,這使其成為未來該領域應用的堅實基礎模型。

🚀 很高興介紹 Qwen-Image-Edit!
它基於 20B Qwen-Image 構建,在保留風格的同時提供精確的雙語文本編輯(中文和英文),並支援語義和外觀級別的編輯。

✨ 主要特點
✅ 準確的文本編輯和雙語支持
✅… pic.twitter.com/p21KUXoC50

— Qwen (@Alibaba_Qwen) 2025 年 8 月 18 日

Qwen-Image-Edit 的語意和外觀編輯,適用於創意和實際應用

其中一個 defiQwen-Image-Edit 的亮點在於其在語意和外觀編輯方面的高級功能。語意編輯是指在更改影像內容的同時,確保底層視覺意義保持不變。為了直觀地說明此功能,開發團隊重點介紹了其用法: 奎文 的官方吉祥物水豚就是一個實際的例子。

觀察顯示,雖然修改後的影像中大部分像素與左側原始輸入影像的像素有所不同,但水豚角色的整體一致性仍然保持良好。這體現了 Qwen-Image-Edit 強大的語意編輯能力,支持靈活多樣的原創智慧財產權內容開發。此外,在 Qwen Chat 中,我們圍繞 16 種 MBTI 性格類型創建了一套專屬的編輯提示。基於這些提示,我們成功製作了一套完整的 MBTI 主題水豚表情包,有效提升了角色的形象和可見度。

此外,新穎的視圖合成是語義編輯的另一個重要用例。 Qwen-Image-Edit 能夠將物體旋轉 90 度或執行 180 度旋轉,從而能夠直接可視化物體的背面。語義編輯的另一個例子是風格轉換,例如,一幅標準肖像可以被重新詮釋成多種藝術美學,包括類似吉卜力工作室的風格。

除了語意編輯之外,外觀編輯也是影像修改中經常需要的功能。這種方法著重於在新增、移除或修改指定元素的同時,保持影像特定區域的完全不變。正如一個將招牌無縫融入場景的範例所示,外觀編輯適用於各種應用,例如調整人物的背景或修改服裝。另一個 defiQwen-Image-Edit 的強大功能在於其文字編輯的精確性,這項特性源自於 Qwen-Image 在文字渲染技術方面的先進專業知識。

0

免責聲明:文章中的所有內容僅代表作者的觀點,與本平台無關。用戶不應以本文作為投資決策的參考。

PoolX: 鎖倉獲得新代幣空投
不要錯過熱門新幣,且APR 高達 10%+
立即參與

您也可能喜歡