AI畫圖太方便 OpenAI GPU快爆掉,ChatGPT 推出圖像修圖功能,讓 GPU 幾乎癱瘓。這項功能結合多模態理解與生成,不只讀圖,還能修改風格、轉換臉型、加字改圖。短短幾天就出現限流,顯示 AI 算力需求遠超預期,這波 AI 的需求呈現指數爆發。

AI畫圖太方便 OpenAI GPU快爆掉 影片
ChatGPT 推出圖像修圖功能
讓 GPU 幾乎癱瘓了
這功能結合多模態的生成
可以讀圖、改圖、轉臉型、加字
全部流程都有 AI 處理
所以 AI 畫圖太方便
GPU 快要燒掉了
我是亞瑟我有三高
每個一到每個禮拜五
我都會分享學到的點點滴滴
今天我們來談一談
OpenAI 最新的 AI 畫圖功能吧
GPU快燒掉

- 算力爆炸成因
- 圖片功能太熱賣
- Sam承認伺服器撐不住
- 10%使用者拖垮整體
- 修圖功能吃光資源
最近 Sam Altman 發了一則貼文,他說 GPU 快要「融化」了。為什麼會這樣?就是因為這一波 ChatGPT 推出了 AI 修圖的功能。
這其實只是一個小小的增強功能,說實話在其他平台,也早就有類似的東西,但偏偏放到 ChatGPT 上面,就直接把 OpenAI 的伺服器搞到快癱瘓了。
現在免費用戶一天只能用三次,付費用戶也有被限制的情況。更扯的是,全世界真正有在用 ChatGPT 的人,大概連 10% 都不到,而這些人裡面會去用圖片修圖功能的,可能也才 10%。
但就光是這樣的用量,就已經把 GPU 撐爆了,伺服器生成圖片常常卡住之外,甚至還影響基本的文字回應,有時候還會整個當掉。
這整件事告訴我們:AI 的資源需求不是線性的,是爆炸性的。AI 還沒普及,用戶也還沒全面開火,OpenAI 的算力就已經撐不住了。
請問那些之前說, AI 用不到那麼多伺服器的人,是不是該重新想一想自己到底在講什麼?
AI修圖怎麼修

- 圖片上傳即可辨識
- 文字指令就能變圖
- 免寫Prompt也免PS
- 整合多模態處理邏輯
- 圖像助理自動幫你動手
這個 ChatGPT 的修圖功能,原則上非常簡單。你只要上傳一張自己想修改的圖片,比如我自己上傳一張在咖啡店拍的照片,ChatGPT 就會自動幫你讀圖、分析畫面裡的元素。
接著你只要打一點點說明,例如「把我變成卡通角色」,它就會幫你直接處理,不用寫 prompt、也不用選工具,更不用開 Photoshop。
它背後做的事情其實很複雜,包含了圖像辨識、多模態理解、文字分析、再加上它自己的圖像生成模型,然後整合成一個你看不到的流程,最後幫你改好圖,像魔法一樣送上來。
整個流程完全打破了傳統的修圖邏輯,等於是你在說話,它就直接動手幫你做。當然啦,如果你想知道他做什麼事,也可以問ChatGPT,他會老實地告訴你。
我自己用了 Photoshop 那麼多年,老實說還真的做不出 ChatGPT 這次修出來的效果,這不是模擬照片風格,而是把一整套 AI 助理嵌進圖片裡,自動幫你動手的概念,這是修圖功能的一次轉捩點。
圖片風格即時換

- AI修圖變成變身
- 吉卜力風格暴紅
- 各種風格可堆疊混搭
- 還能問AI是怎麼做的
- 圖片風格即時變換
這次 AI 修圖功能更誇張的地方是,它不只是幫你修圖而已喔,還可以直接改變整體風格,像最近最熱門的,就是吉卜力風格,每個人都可以把自己,變成宮崎駿動畫裡的角色。
你只要上傳照片,然後告訴它「我要吉卜力風格」,它馬上就會幫你生出一張動畫感十足的版本。而且不只這樣,還可以自由疊加不同風格,甚至換成其他樣子。
像我自己就試過,除了吉卜力風格之外,我還跟它要了一張水彩畫的版本,看起來有種把自己,變成繪本角色的感覺。
更厲害的是,還可以把這些風格混搭、堆疊,甚至還能改裡面的小細節,比如顏色、線條、人物表情,全部都可以微調。
而且你也可以直接問 ChatGPT:「你剛剛是怎麼做到的?」它會很大方地告訴你,它下了哪一些 prompt,甚至可以複製下來,當成之後創作的參考。
過去只有專業設計師,才懂的風格調整技巧,現在已經變成語言模型的基本功能,圖像處理的門檻真的徹底被打破了。
真人變卡通

- 真實人臉可轉卡通
- 保留五官與特色
- 整合人臉辨識技術
- 可製作個人IP角色
- 人人都能生成動畫
還有一點真的讓人很驚訝的,就是這個功能竟然可以,把一張真實人物的照片,直接變成高品質的卡通人物。而且更厲害的是,它不是隨便亂變的,而是會保留你的臉型、五官、表情,甚至連髮型、神情都對得上。
也就是說,你一看就會覺得:「欸,這不就是我嗎?但變成卡通了!」那個辨識度真的非常的高。
這背後其實整合了,非常多的人臉辨識技術,它不只套個濾鏡或是變個顏色而已,AI 真的會先判斷你是誰,再畫出一張像你,但卻有卡通風格的圖片。
這讓很多人開始做自己的卡通IP,像網紅、VTuber,甚至個人品牌,都有人拿這個當作頭像角色使用。就像 Sam Altman,他的帳號現在也是卡通版的頭像。
我自己也試了一下,我和我老婆在新加坡機場拍的照片,上傳之後立刻變成卡通版,而且真的很像、很可愛,五官跟笑容都還在,辨識度超高。
我自己是超級喜歡的,這功能真的會讓人忍不住一直玩下去。
AI怎麼看懂你

- 圖像先轉語意資料
- 可判讀情緒與互動
- 視覺編碼再交語言模型
- 圖片從模糊漸進細節
- 畫圖流程類似人腦
很多人以為 AI 修圖,就是拿一張圖重新畫一次。但實際上,它做的事情比這複雜太多。
現在的 AI 有一整套圖像理解系統,它會先看懂你的照片,不是只有辨識幾個人、誰站哪邊而已,而是能夠真正判讀出人物的狀態、情緒、互動關係,甚至連整張圖的風格跟氛圍,它都能理解。
舉例來說,像我前面那一張在咖啡廳拍的照片,它不只是知道我站在中間而已,它能看出我拿著咖啡,表情很誇張,看起來非常快樂。它會抓住這整體的語意,再進行後續的處理。
整個流程會先透過「視覺編碼器」,把圖像轉換成語意資料,再丟給語言模型去理解語意內容,接著才交給圖像生成模型,創造出一張全新的圖片。
而且這張圖片不是一次生成出來的,它是先產出一張模糊的草圖,然後從上到下、從左到右,一層一層地補上細節,加入背景、光影、人物動作與神情這些資訊。
簡單來說,現在 AI 畫圖的邏輯,其實已經越來越像人類了。它會先了解「要畫什麼」,再畫草稿,最後再把細節補上去。
GPU為何會爆

- 修圖是整套推論流程
- 每張圖都要讀物件座標
- 每一次生成都消耗巨大
- 同時開放造成系統爆量
- 未來影片與3D更撐不住
為什麼 ChatGPT 修個圖,就會把 GPU 炸掉熔掉呢?因為它不是單純在「讀一張圖片」而已,它背後其實是一整個完整的推論流程。
舉例來說,我之前在度假的時候,遇到蜥蜴大鬧午餐的狀況,那張照片我上傳之後,AI 就會先用圖像模型去讀取裡面的資訊。
先去理解裡面有哪些東西:有誰、在哪裡、什麼姿勢、什麼表情、物體的邊界在哪、畫面風格是什麼、每個區塊的座標在哪。據說一次可以辨識處理,二十幾個不同的物體,再重新計算、重新組合、再生成圖像。
光是辨識階段,就已經是高強度的推論了,接下來進入圖片生成的階段,又是另一波算力的消耗。是從零開始,還要補細節、加風格,計算每一個物件的狀況。
而且這還只是圖片喔,如果未來 AI 要開始跑影片、生成動畫、做 3D 建模,這個伺服器是完全撐不住的。
現在已經有 AI 可以把圖片變成動畫,一段大概 40 秒的動畫,差不多花了我一百塊台幣。這種等級的算力消耗,完全不是開玩笑的。
ASIC也不夠用

- ASIC只能做單一任務
- AI需求變化太快
- 通用GPU更具彈性
- CUDA 為多任務而生
- 世界模型根本撐不住
前陣子很多人說,未來 AI 要靠 ASIC 晶片,來解決所有算力問題。
不過 ASIC 是「特殊應用晶片」,可以針對某個任務做極致優化,比如語音辨識、分類演算法、文字生成這些單一用途。
但問題來了,像 ChatGPT 這種什麼都做的系統,今天要圖像修圖,明天要做動畫配音,後天可能還要幫你剪片做腳本,這種功能根本不是固定流程。
如果每個任務都要設計 ASIC ,光開發一顆可能就要一年以上。可是 AI 可能每三個月,就冒出一個新模型、一個新功能,ASIC 晶片根本來不及支援,這麼多樣化又一直在變化的需求。
這也就是為什麼在 GTC 2025 上,黃仁勳還是強調:通用型 GPU 才是王道, CUDA 架構就是為了現在這種情況準備的。彈性而且能快速切換的硬體平台,才能撐住多任務、多模態、多功能發展的基礎。
如果楊立坤的世界模型真的上線,那可不是一個單一任務,而是一整個宇宙等級的計算需求,那時候靠 ASIC 是根本撐不住的喔。
AI需求沒有盡頭

- GPT功能引爆算力
- 修圖都能拖垮GPU
- 世界模型還沒上線
- 台積電訂單已爆滿
- 自動駕駛需求更旺
最近很多人看到 AI 相關股票下跌,就開始說「AI過熱了」,甚至有分析師出來講說,伺服器供過於求,產能過剩、訂單萎縮,但我的看法完全相反。
現在這波 ChatGPT 推出的AI修圖,只是一個小小的功能,甚至還沒有推到普通消費者手上,就已經讓 OpenAI 的 GPU 快融掉了。這還只是「圖片處理」而已,還不是影片、更不是 3D。
而未來楊立坤要推的「世界模型」,那可不是只有修圖而已,是要理解影片、空間、語音、環境、3D空間、甚至重力與物理規則的多模態模型,等於修圖、動畫、語音、文字轉換、自動駕駛、物理模擬,全部同時一起運作,運算需求會多幾百倍。
台積電早就說了,先進製程產能已經全部被 AI 定光了,明年、後年都滿載。更不要忘記,Tesla 還沒推真正的全自動駕駛,可是它早就買了一堆伺服器用來訓練模型了。
所以不管是資料中心、消費性 AI、還是邊緣 AI,未來的需求根本沒有盡頭,這只是一個開始而已。
今天就到這邊
歡迎各位回去試試看
ChatGPT 的繪圖功能
如果你有更多的心得
也歡迎留言告訴我~掰
這一次我在飛機上面
一邊剪片一邊錄影
當然是假的啦~怎麼可能
想要展示一下最近ChatGPT 的新功能
就是可以把圖片變成吉卜力的畫風
再者更進一步
我把這個圖片
拿去給一個軟體叫做Hedra
它就可以幫你生成出影片來
這真的很厲害
各位可以試看看