近幾天的海外社媒被「吉卜力風格」的藝術圖像席捲,用戶在社群媒體上分享吉卜力藝術風的照片,被業內人士看作是一股吉卜力風的meme潮流。
有人生成並發布吉卜力畫風的馬斯克(Elon Musk)、川普(Donald Trump)、「魔戒」(The Lord of the Rings)等的圖像和影片。 OpenAI CEO阿爾特曼(Sam Altman)也把吉卜力畫風的個人圖像設為自己社群平台X的頭像。
吉卜力風格是指由日本吉卜力工作室所代表的一種美學風格,具有溫暖、奇幻和細膩的手繪質感,知名作品《千與千尋》、《龍貓》等電影都是吉卜力工作室的代表作品。
過去幾天裡,用戶在社群媒體上瘋狂分享這些細膩、柔和色調的圖像。這都得益於3月25日OpenAI推出的ChatGPT-4o影像產生功能。
搜尋數據顯示,新模型上線後,「ChatGPT」這個關鍵字在Google Trends 上短暫超過了「Google」本身。並在周一(3月30日)僅一小時內為ChatGPT帶來了超過100 萬人註冊。 OpenAI的CEO阿爾特曼稱GPT-4o為「有史以來最好的模型」、「這是有史以來,我們發表過最有趣、最酷的東西。」
不過新模型的推出和海量用戶的湧入造成了ChatGPT的算力資源的緊張。
阿爾特曼在社群媒體中表示GPU正在融化。
這是因為GPT-4o 的圖像生成方式與以往的AI 藝術工具截然不同,它使用了更強的運算能力。大多數影像產生器採用擴散模型(Diffusion Models),即從一團隨機像素開始,不斷調整直至形成清晰的影像。
但GPT-4o 採用的是自回歸方法(Autoregressive Approach),它按像素順序逐一預測,就像處理文本推理一樣。而GPT-4o 不再調用獨立的DALL-E 文生圖模型,而是利用GPT-4o的多模態能力在圖像生成時更加精確地遵循指示、更精確地渲染圖像上的文字,同時支援在多輪迭代優化圖像時並保持角色形像一致。
這種方法可以帶來更精準的細節和更好的文字渲染,但對OpenAI 的GPU 而言卻正在「融化」。
簡單來說,ChatGPT的圖像生成和其它AI模型的生成是「畫一幅油畫」和「拼一幅馬賽克」的區別。當使用者每個要求一張圖片,都會觸發多個GPU 核心並行執行複雜的數學計算,消耗大量電力,並產生高溫。如果長時間滿載運行,硬體可能會遭到損害。
要解決GPU算力資源消耗過大的問題,背靠微軟、軟銀強大的OpenAI無需擔心算力資源不足的問題。但如何將強大的GPU算力動態均衡供給OpenAI大模型,基於AI技術、區塊鏈和隱私技術的去中心化算力雲服務或是一種解決方案。
對Google、微軟、AWS、英偉達等中心化算力巨頭來說,算力資源的供給不是擔憂。但如何動態均衡供給-例如24小時動態均衡供給大模型,會是目前需要考慮的問題。先前在ChatGPT推出市場不久,大多數AI大模型給出了用戶在夜間可以不受限制的使用AI,或也是基於算力資源和性能的考慮。
去中心化算力雲端服務(如PowerVerse)能夠解決不均衡供給、提供高效能算力、降低算力使用門檻和費用的問題,相信這會是不遠的未來前沿科技所需的DePIN基礎設施。