Bitget App
Trading lebih cerdas
Beli KriptoPasarTradingFuturesEarnWeb3WawasanSelengkapnya
Trading
Spot
Beli dan jual kripto dengan mudah
Margin
Perkuat modalmu dan maksimalkan efisiensi dana
Onchain
Trading Onchain, tanpa on-chain
Konversi
Tanpa biaya, tanpa slippage
Jelajah
Launchhub
Dapatkan keunggulan lebih awal dan mulailah menang
Copy
Salin elite trader dengan satu klik
Bot
Bot trading AI yang mudah, cepat, dan andal
Trading
Futures USDT-M
Futures diselesaikan dalam USDT
Futures USDC-M
Futures diselesaikan dalam USDC
Futures Koin-M
Futures diselesaikan dalam mata uang kripto
Jelajah
Panduan fitur
Dari pemula hingga mahir di perdagangan futures
Promosi Futures
Hadiah berlimpah menantimu
Ringkasan
Beragam produk untuk mengembangkan aset Anda
Earn Sederhana
Deposit dan tarik kapan saja untuk mendapatkan imbal hasil fleksibel tanpa risiko
Earn On-chain
Dapatkan profit setiap hari tanpa mempertaruhkan modal pokok
Earn Terstruktur
Inovasi keuangan yang tangguh untuk menghadapi perubahan pasar
VIP dan Manajemen Kekayaan
Layanan premium untuk manajemen kekayaan cerdas
Pinjaman
Pinjaman fleksibel dengan keamanan dana tinggi
Alibaba Merilis Qwen-Image-Edit: Model Open-Source 20B untuk Pengeditan Gambar dan Teks Tingkat Lanjut

Alibaba Merilis Qwen-Image-Edit: Model Open-Source 20B untuk Pengeditan Gambar dan Teks Tingkat Lanjut

MPOSTMPOST2025/08/20 01:35
Oleh:MPOST

Singkatnya Tim Qwen Alibaba Cloud telah meluncurkan Qwen-Image-Edit, model penyuntingan gambar canggih yang menggabungkan penyuntingan semantik dan tampilan dengan modifikasi teks dwibahasa yang tepat, menghadirkan kemampuan canggih untuk aplikasi kreatif dan praktis.

Alibaba Cloud Qwen Tim Qwen-Image-Edit telah memperkenalkan Qwen-Image-Edit, sebuah model penyuntingan gambar canggih yang berasal dari kerangka kerja Qwen-Image 20B. Sistem baru ini memperluas kemampuan rendering teks Qwen-Image yang unik dengan menerapkannya pada penyuntingan gambar, dengan fokus khusus pada presisi dalam modifikasi teks. Qwen-Image-Edit memproses gambar masukan melalui dua komponen paralel: Qwen2.5-VL, yang mengelola kontrol semantik visual, dan VAE Encoder, yang mengatur tampilan visual. Pendekatan ganda ini memungkinkan model untuk menangani tugas penyuntingan tingkat semantik dan tampilan secara efektif. Alat ini dapat diakses melalui Qwen Chat di bawah fitur "Penyuntingan Gambar".

Qwen-Image-Edit dirancang untuk bekerja di berbagai dimensi pengeditan. Mendukung penyesuaian tingkat tampilan, seperti penambahan, penghapusan, atau modifikasi elemen visual dengan tetap menjaga keutuhan seluruh area gambar, dan pengeditan tingkat semantik, seperti pembuatan hak kekayaan intelektual, rotasi objek, atau transfer gaya, di mana perubahan piksel yang lebih luas diperbolehkan tetapi integritas semantik tetap terjaga. Qwen-Image-Edit juga menyediakan kemampuan pengeditan teks yang disempurnakan dalam bahasa Mandarin dan Inggris, yang memungkinkan pengguna untuk menambahkan, menghapus, atau menyesuaikan teks di dalam gambar sambil mempertahankan konsistensi font, ukuran, dan gaya. Pengujian tolok ukur di beberapa set data yang diakui secara luas menunjukkan bahwa Qwen-Image-Edit mencapai performa terbaik dalam pengeditan gambar, memposisikannya sebagai model fondasi yang kuat untuk aplikasi masa depan di bidang ini.

Senang memperkenalkan Qwen-Image-Edit!
Dibangun di atas Qwen-Image 20B, ia menghadirkan pengeditan teks dwibahasa yang tepat (Bahasa Mandarin & Inggris) dengan tetap mempertahankan gaya, dan mendukung pengeditan tingkat semantik dan tampilan.

✨ Fitur Utama
✅ Pengeditan teks yang akurat dengan dukungan bilingual
… foto.twitter.com/p21KUXoC50

— Qwen (@Alibaba_Qwen) 18 Agustus 2025

Pengeditan Semantik dan Tampilan Qwen-Image-Edit untuk Aplikasi Kreatif dan Praktis

Salah satu defiAspek menarik dari Qwen-Image-Edit adalah fungsionalitasnya yang canggih dalam pengeditan semantik dan tampilan. Pengeditan semantik melibatkan pengubahan konten gambar sambil memastikan makna visual yang mendasarinya tetap utuh. Untuk mengilustrasikan fungsi ini secara lugas, tim pengembang menyoroti penggunaannya dengan Qwen Maskot resminya, Kapibara, sebagai contoh praktis.

Hasil observasi menunjukkan bahwa meskipun sebagian besar piksel pada gambar hasil modifikasi berbeda dari gambar masukan asli di sebelah kiri, konsistensi keseluruhan karakter Kapibara tetap terjaga sepenuhnya. Hal ini menunjukkan kemampuan penyuntingan semantik yang kuat dari Qwen-Image-Edit, yang mendukung pengembangan konten kekayaan intelektual asli yang fleksibel dan beragam. Selain itu, di dalam Qwen Chat, serangkaian perintah penyuntingan khusus telah dibuat berdasarkan 16 tipe kepribadian MBTI. Dengan menggunakan perintah-perintah ini, koleksi lengkap paket emoji bertema MBTI yang menampilkan maskot Kapibara berhasil dihasilkan, yang secara efektif memperluas representasi dan visibilitas karakter.

Lebih lanjut, sintesis tampilan baru merupakan contoh penggunaan penting lainnya dalam penyuntingan semantik. Qwen-Image-Edit mampu memutar objek hingga 90 derajat atau melakukan rotasi penuh 180 derajat, memungkinkan visualisasi langsung sisi belakang objek. Contoh penyuntingan semantik lainnya terletak pada transfer gaya, di mana, misalnya, potret standar dapat diinterpretasikan ulang ke dalam berbagai estetika artistik, termasuk gaya yang mengingatkan pada Studio Ghibli.

Selain penyuntingan semantik, penyuntingan tampilan merupakan fungsi yang sering dibutuhkan dalam modifikasi gambar. Pendekatan ini berfokus pada mempertahankan area tertentu dari suatu gambar agar tidak berubah sama sekali, sambil menambahkan, menghapus, atau mengubah elemen-elemen yang ditentukan. Seperti yang ditunjukkan dalam contoh di mana papan nama terintegrasi dengan mulus ke dalam sebuah adegan, penyuntingan tampilan dapat digunakan untuk berbagai macam aplikasi seperti penyesuaian latar belakang untuk individu atau modifikasi pakaian. defiKemampuan pengeditan Qwen-Image-Edit adalah ketepatannya dalam pengeditan teks, sebuah fitur yang berasal dari keahlian canggih Qwen-Image dalam teknologi rendering teks.

0

Disclaimer: Konten pada artikel ini hanya merefleksikan opini penulis dan tidak mewakili platform ini dengan kapasitas apa pun. Artikel ini tidak dimaksudkan sebagai referensi untuk membuat keputusan investasi.

PoolX: Raih Token Baru
APR hingga 12%. Selalu aktif, selalu dapat airdrop.
Kunci sekarang!