綜合中媒報導,阿里巴巴旗下阿里雲通義千問 19 日宣布推出 Qwen-Image-Edit 圖像編輯版本。Qwen-Image-Edit 基於 20B 的 Qwen-Image 模型進一步訓練,成功將 Qwen-Image 的獨特的文本渲染能力延展至圖像編輯領域,實現了對圖片中文字的精準編輯。
Qwen-Image-Edit將輸入圖像同時輸入到Qwen2.5-VL(實現視覺語義控制)和VAE Encoder(實現視覺外觀控制),進而兼具語義與外觀的雙重編輯能力;用戶可訪問Qwen Chat並選擇「圖像編輯」功能進行體驗。
Qwen-Image-Edit的主要特性包括:
一、語義與外觀雙重編輯:Qwen-Image-Edit不僅支援low-level的視覺外觀編輯(如元素的添加、刪除、修改等,要求圖片其他區域完全不變),並支援high-level的視覺語義編輯(如IP創作、物體旋轉、風格遷移等,允許整體畫素變化但保持語義一致)。
二、精準文字編輯:Qwen-Image-Edit支持中英文雙語文字編輯,可在保留原有字體、字型大小、風格的前提下,直接對圖片中的文字進行增、刪、改等操作。
三、強大的基準性能:在多個公開基準測試中的評估表明,Qwen-Image-Edit在圖像編輯任務上具備SOTA性能,是一個強大的圖像編輯基礎模型。
Qwen-Image-Edit的一大亮點在於其語義與外觀雙重編輯能力。所謂語義編輯,是指在保持原始圖像視覺語義不變的前提下,對圖像內容進行修改。


(本文由 MoneyDJ新聞 授權轉載;首圖來源:Qwen)
文章看完覺得有幫助,何不給我們一個鼓勵
請我們喝杯咖啡您的咖啡贊助將是讓我們持續走下去的動力
總金額共新臺幣 0 元 《關於請喝咖啡的 Q & A》 取消 確認(责任编辑:林二汶)
“大家可能不知道厦门是个经济特区,本身比其他地方开放得早。...[详细]
这笔投资,可能跟吴奇隆小时候的生活环境有关。...[详细]
而其之所以能够得到资本的青睐,核心还是在于在知识经济爆发的当下,知乎在过去五年里所积累的内容价值和平台效应凸显下对于具备优质知识、经验、知识产出能力的人士吸引、涌入,使得知乎平台聚合、提供了当下互联网...[详细]
相比之下,国内的A、B站在会员付费的问题上显得十分小心翼翼——B站去年宣告推出的付费会员“大会员制度”目前也名存实亡。...[详细]4月财新中国制造业采购经理人指数(PMI)录得49.5 焦点热议
他认为,“可教”是领导力的关键要素,伟大的领导者不仅有观点,不仅知道自己想的是什么,而且还要能够清楚地表达出来。...[详细]蘋果控告前員工與 Oppo,涉竊取 Apple Watch 技術機密
在确定了三条路和有一个人游走的前提下,无论是3V3还是4V4,都会显得人数过少而缺少变化,因为在一条对线路上,如果是1V2,那么这个人完全不能够发育,而如果是2V3,那么这两个人是能够比较好的存活...[详细]
在上升更大格局后,蔡文胜将目标定位在做世界的美图。...[详细]
群雄并起 受RIO成功的刺激,一众白酒、啤酒、食品企业高调进入预调鸡尾酒行业,其中最疯狂的是黑牛食品。...[详细]「OpenAI 幫」創業潮來襲,AI 材料新創 Periodic Labs 成立三個月變獨角獸