AI畫圖太方便 OpenAI GPU快爆掉

AI畫圖太方便 OpenAI GPU快爆掉，ChatGPT 推出圖像修圖功能，讓 GPU 幾乎癱瘓。這項功能結合多模態理解與生成，不只讀圖，還能修改風格、轉換臉型、加字改圖。短短幾天就出現限流，顯示 AI 算力需求遠超預期，這波 AI 的需求呈現指數爆發。

Table of Contents

AI畫圖太方便 OpenAI GPU快爆掉影片

ChatGPT 推出圖像修圖功能
讓 GPU 幾乎癱瘓了
這功能結合多模態的生成
可以讀圖、改圖、轉臉型、加字
全部流程都有 AI 處理
所以 AI 畫圖太方便
GPU 快要燒掉了

我是亞瑟我有三高
每個一到每個禮拜五
我都會分享學到的點點滴滴
今天我們來談一談
OpenAI 最新的 AI 畫圖功能吧

GPU快燒掉

算力爆炸成因
圖片功能太熱賣
Sam承認伺服器撐不住
10%使用者拖垮整體
修圖功能吃光資源

https://www.theverge.com/news/637542/chatgpt-says-our-gpus-are-melting-as-it-puts-limit-on-image-generation-requests

最近 Sam Altman 發了一則貼文，他說 GPU 快要「融化」了。為什麼會這樣？就是因為這一波 ChatGPT 推出了 AI 修圖的功能。

這其實只是一個小小的增強功能，說實話在其他平台，也早就有類似的東西，但偏偏放到 ChatGPT 上面，就直接把 OpenAI 的伺服器搞到快癱瘓了。

現在免費用戶一天只能用三次，付費用戶也有被限制的情況。更扯的是，全世界真正有在用 ChatGPT 的人，大概連 10% 都不到，而這些人裡面會去用圖片修圖功能的，可能也才 10%。

但就光是這樣的用量，就已經把 GPU 撐爆了，伺服器生成圖片常常卡住之外，甚至還影響基本的文字回應，有時候還會整個當掉。

這整件事告訴我們：AI 的資源需求不是線性的，是爆炸性的。AI 還沒普及，用戶也還沒全面開火，OpenAI 的算力就已經撐不住了。

請問那些之前說， AI 用不到那麼多伺服器的人，是不是該重新想一想自己到底在講什麼？

AI修圖怎麼修

圖片上傳即可辨識
文字指令就能變圖
免寫Prompt也免PS
整合多模態處理邏輯
圖像助理自動幫你動手

這個 ChatGPT 的修圖功能，原則上非常簡單。你只要上傳一張自己想修改的圖片，比如我自己上傳一張在咖啡店拍的照片，ChatGPT 就會自動幫你讀圖、分析畫面裡的元素。

接著你只要打一點點說明，例如「把我變成卡通角色」，它就會幫你直接處理，不用寫 prompt、也不用選工具，更不用開 Photoshop。

它背後做的事情其實很複雜，包含了圖像辨識、多模態理解、文字分析、再加上它自己的圖像生成模型，然後整合成一個你看不到的流程，最後幫你改好圖，像魔法一樣送上來。

整個流程完全打破了傳統的修圖邏輯，等於是你在說話，它就直接動手幫你做。當然啦，如果你想知道他做什麼事，也可以問ChatGPT，他會老實地告訴你。

我自己用了 Photoshop 那麼多年，老實說還真的做不出 ChatGPT 這次修出來的效果，這不是模擬照片風格，而是把一整套 AI 助理嵌進圖片裡，自動幫你動手的概念，這是修圖功能的一次轉捩點。

圖片風格即時換

AI修圖變成變身
吉卜力風格暴紅
各種風格可堆疊混搭
還能問AI是怎麼做的
圖片風格即時變換

這次 AI 修圖功能更誇張的地方是，它不只是幫你修圖而已喔，還可以直接改變整體風格，像最近最熱門的，就是吉卜力風格，每個人都可以把自己，變成宮崎駿動畫裡的角色。

你只要上傳照片，然後告訴它「我要吉卜力風格」，它馬上就會幫你生出一張動畫感十足的版本。而且不只這樣，還可以自由疊加不同風格，甚至換成其他樣子。

像我自己就試過，除了吉卜力風格之外，我還跟它要了一張水彩畫的版本，看起來有種把自己，變成繪本角色的感覺。

更厲害的是，還可以把這些風格混搭、堆疊，甚至還能改裡面的小細節，比如顏色、線條、人物表情，全部都可以微調。

而且你也可以直接問 ChatGPT：「你剛剛是怎麼做到的？」它會很大方地告訴你，它下了哪一些 prompt，甚至可以複製下來，當成之後創作的參考。

過去只有專業設計師，才懂的風格調整技巧，現在已經變成語言模型的基本功能，圖像處理的門檻真的徹底被打破了。

真人變卡通

真實人臉可轉卡通
保留五官與特色
整合人臉辨識技術
可製作個人IP角色
人人都能生成動畫

還有一點真的讓人很驚訝的，就是這個功能竟然可以，把一張真實人物的照片，直接變成高品質的卡通人物。而且更厲害的是，它不是隨便亂變的，而是會保留你的臉型、五官、表情，甚至連髮型、神情都對得上。

也就是說，你一看就會覺得：「欸，這不就是我嗎？但變成卡通了！」那個辨識度真的非常的高。

這背後其實整合了，非常多的人臉辨識技術，它不只套個濾鏡或是變個顏色而已，AI 真的會先判斷你是誰，再畫出一張像你，但卻有卡通風格的圖片。

這讓很多人開始做自己的卡通IP，像網紅、VTuber，甚至個人品牌，都有人拿這個當作頭像角色使用。就像 Sam Altman，他的帳號現在也是卡通版的頭像。

我自己也試了一下，我和我老婆在新加坡機場拍的照片，上傳之後立刻變成卡通版，而且真的很像、很可愛，五官跟笑容都還在，辨識度超高。

我自己是超級喜歡的，這功能真的會讓人忍不住一直玩下去。

AI怎麼看懂你

圖像先轉語意資料
可判讀情緒與互動
視覺編碼再交語言模型
圖片從模糊漸進細節
畫圖流程類似人腦

很多人以為 AI 修圖，就是拿一張圖重新畫一次。但實際上，它做的事情比這複雜太多。

現在的 AI 有一整套圖像理解系統，它會先看懂你的照片，不是只有辨識幾個人、誰站哪邊而已，而是能夠真正判讀出人物的狀態、情緒、互動關係，甚至連整張圖的風格跟氛圍，它都能理解。

舉例來說，像我前面那一張在咖啡廳拍的照片，它不只是知道我站在中間而已，它能看出我拿著咖啡，表情很誇張，看起來非常快樂。它會抓住這整體的語意，再進行後續的處理。

整個流程會先透過「視覺編碼器」，把圖像轉換成語意資料，再丟給語言模型去理解語意內容，接著才交給圖像生成模型，創造出一張全新的圖片。

而且這張圖片不是一次生成出來的，它是先產出一張模糊的草圖，然後從上到下、從左到右，一層一層地補上細節，加入背景、光影、人物動作與神情這些資訊。

簡單來說，現在 AI 畫圖的邏輯，其實已經越來越像人類了。它會先了解「要畫什麼」，再畫草稿，最後再把細節補上去。

GPU為何會爆

修圖是整套推論流程
每張圖都要讀物件座標
每一次生成都消耗巨大
同時開放造成系統爆量
未來影片與3D更撐不住

為什麼 ChatGPT 修個圖，就會把 GPU 炸掉熔掉呢？因為它不是單純在「讀一張圖片」而已，它背後其實是一整個完整的推論流程。

舉例來說，我之前在度假的時候，遇到蜥蜴大鬧午餐的狀況，那張照片我上傳之後，AI 就會先用圖像模型去讀取裡面的資訊。

先去理解裡面有哪些東西：有誰、在哪裡、什麼姿勢、什麼表情、物體的邊界在哪、畫面風格是什麼、每個區塊的座標在哪。據說一次可以辨識處理，二十幾個不同的物體，再重新計算、重新組合、再生成圖像。

光是辨識階段，就已經是高強度的推論了，接下來進入圖片生成的階段，又是另一波算力的消耗。是從零開始，還要補細節、加風格，計算每一個物件的狀況。

而且這還只是圖片喔，如果未來 AI 要開始跑影片、生成動畫、做 3D 建模，這個伺服器是完全撐不住的。

現在已經有 AI 可以把圖片變成動畫，一段大概 40 秒的動畫，差不多花了我一百塊台幣。這種等級的算力消耗，完全不是開玩笑的。

ASIC也不夠用

ASIC只能做單一任務
AI需求變化太快
通用GPU更具彈性
CUDA 為多任務而生
世界模型根本撐不住

前陣子很多人說，未來 AI 要靠 ASIC 晶片，來解決所有算力問題。

不過 ASIC 是「特殊應用晶片」，可以針對某個任務做極致優化，比如語音辨識、分類演算法、文字生成這些單一用途。

但問題來了，像 ChatGPT 這種什麼都做的系統，今天要圖像修圖，明天要做動畫配音，後天可能還要幫你剪片做腳本，這種功能根本不是固定流程。

如果每個任務都要設計 ASIC ，光開發一顆可能就要一年以上。可是 AI 可能每三個月，就冒出一個新模型、一個新功能，ASIC 晶片根本來不及支援，這麼多樣化又一直在變化的需求。

這也就是為什麼在 GTC 2025 上，黃仁勳還是強調：通用型 GPU 才是王道， CUDA 架構就是為了現在這種情況準備的。彈性而且能快速切換的硬體平台，才能撐住多任務、多模態、多功能發展的基礎。

如果楊立坤的世界模型真的上線，那可不是一個單一任務，而是一整個宇宙等級的計算需求，那時候靠 ASIC 是根本撐不住的喔。

AI需求沒有盡頭

GPT功能引爆算力
修圖都能拖垮GPU
世界模型還沒上線
台積電訂單已爆滿
自動駕駛需求更旺

https://www.linkedin.com/pulse/ai-gpu-market-size-share-growth-drivers-trends-overall-shital-kokate-d7jkf

最近很多人看到 AI 相關股票下跌，就開始說「AI過熱了」，甚至有分析師出來講說，伺服器供過於求，產能過剩、訂單萎縮，但我的看法完全相反。

現在這波 ChatGPT 推出的AI修圖，只是一個小小的功能，甚至還沒有推到普通消費者手上，就已經讓 OpenAI 的 GPU 快融掉了。這還只是「圖片處理」而已，還不是影片、更不是 3D。

而未來楊立坤要推的「世界模型」，那可不是只有修圖而已，是要理解影片、空間、語音、環境、3D空間、甚至重力與物理規則的多模態模型，等於修圖、動畫、語音、文字轉換、自動駕駛、物理模擬，全部同時一起運作，運算需求會多幾百倍。

台積電早就說了，先進製程產能已經全部被 AI 定光了，明年、後年都滿載。更不要忘記，Tesla 還沒推真正的全自動駕駛，可是它早就買了一堆伺服器用來訓練模型了。

所以不管是資料中心、消費性 AI、還是邊緣 AI，未來的需求根本沒有盡頭，這只是一個開始而已。

今天就到這邊
歡迎各位回去試試看
ChatGPT 的繪圖功能
如果你有更多的心得
也歡迎留言告訴我～掰

這一次我在飛機上面
一邊剪片一邊錄影
當然是假的啦～怎麼可能
想要展示一下最近ChatGPT 的新功能
就是可以把圖片變成吉卜力的畫風
再者更進一步
我把這個圖片
拿去給一個軟體叫做Hedra
它就可以幫你生成出影片來
這真的很厲害
各位可以試看看

AI畫圖太方便 OpenAI GPU快爆掉 影片