Gemma 3 手機電腦實測 1B 4B 12B 27B 表現揭密 20250317

Gemma 3 手機電腦實測 1B 4B 12B 27B 表現揭密 20250317

Gemma 3 終端測試 1B 4B 12B 27B 表現揭密 20250317,Gemma 3 實測結果驚豔,27B 版展現 GPT-4 級別理解力,12B 表現穩定。更驚喜的是,4B、1B 版在手機上運行流暢,打破小模型表現不佳的刻板印象,顯示 Google 模型的成功。

Gemma 3 終端測試 1B 4B 12B 27B 表現揭密 20250317

Gemma 3 手機電腦實測 影片

今天我們來談Google的
最新語言模型Gemma 3
而且我還用手機跟電腦來做實測
測一下1B、4B、12B跟27B
它真正的表現如何
是不是和Google說的那樣那麼厲害

我是亞瑟我有三高
每個禮拜一到每個禮拜五
我都會分享學到的點點滴滴
那今天我們來看
人工智能語言模型最新的進展

Gemma 3 簡介

Gemma 3 終端測試 1B 4B 12B 27B 表現揭密 20250317
  • 模型設計突破
  • 智力高資料少
  • 27B近似GPT-4
  • 小模型效能強
  • 專注理解與推理

https://ai.google.dev/gemma/docs/core

這次 Google 推出的 Gemma 3,帶來了語言模型的大突破,是真的進步,不是耍嘴皮子的炒作。

傳統上,語言模型的發展趨勢,就是「模型越大,效果越好」。從早期的 13B、70B 到後來的 405B、671B,這些模型不斷膨脹,試圖把所有資料都硬塞進去,讓模型表現的更聰明,但對硬體資源的需求,後來也變得極度誇張。

但 Google 這次帶來的 Gemma 3,完全反其道而行。Gemma 3 並沒有選擇,以超級大量的資料來堆積模型,而是回到了「基礎智力」上,專注提升模型的理解力和邏輯推理能力。

這樣的設計,讓 Gemma 3 即便在 1B、4B 等小型版本中,依然具備出色的表現。特別是 27B 版本,已經展現出接近 GPT-4 等級的理解力,處理複雜語言、邏輯推理、圖像辨識,甚至情境判斷都非常穩定。

這次 Google 把「小模型」變得「更聰明」,而不是單純追求「更大更強」,確實是一個非常有意義的方向。

終端設備設計

Gemma 3 終端測試 1B 4B 12B 27B 表現揭密 20250317
  • 單GPU穩定運行
  • 手機筆電均支持
  • 優化計算降低負擔
  • 1B 4B表現良好
  • 擺脫昂貴GPU依賴

https://www.theverge.com/ai-artificial-intelligence/627968/google-gemma-3-open-ai-model

Gemma 3 的主要目標,是要讓 AI 模型,能夠在終端設備上順暢運行,這也是 Google 模型的一大突破。Gemma 3 經過優化後,能夠在一個 GPU 或 TPU 上執行,甚至在資源有限的筆電與手機上,也能穩定運行。

Gemma 3 中採用新的模型結構,更優化的計算方式,大幅降低對硬體的依賴,在記憶體與運算受限的終端設備上,依然能流暢運行,發揮穩定的效能。

實際測試中,1B 與 4B 版本在 MacBook Pro M4、iPhone 15 等設備上均可穩定運行,且運行速度良好。

Gemma 3 的這種終端優化設計,讓 AI 應用更貼近日常使用場景,擺脫了對昂貴 GPU 與雲端算力的依賴。這對於行動裝置、筆電等設備的 AI 應用,應該是一項重大進步,讓高效 AI 模型的使用門檻大幅降低。

模型的技術介紹

Gemma 3 終端測試 1B 4B 12B 27B 表現揭密 20250317
  • 稀疏注意力機制
  • 局部全局層交錯
  • 支援多模態處理
  • 上下文擴展至128k
  • 專注理解減少資料

https://wallstreetcn.com/articles/3742906

根據 Google 的官方資料,Gemma 3 並未採用傳統的,大量堆疊參數模式,而是專注於模型結構的優化。Google 在 Gemma 3 中引入了更先進的「稀疏注意力機制」,結合了局部注意力層與全局注意力層,有效降低記憶體需求。

Gemma 3 還支援多模態處理,能同時分析文字、圖像及短影片等多元資料。

Gemma 3 也支援最高 128k 的上下文,這對於書籍摘要、大型報告等任務,表現會進步很多。

整體來說,Gemma 3 用「更少的資料、更高的智力」展開,減少不必要的資訊,透過架構強化來增強推理能力,不僅大幅縮小了模型體積,更提升運行速度,讓這次的AI模型真的「又小又強」。

電腦端語言測試

Gemma 3 終端測試 1B 4B 12B 27B 表現揭密 20250317
  • 27B接近GPT-4
  • 12B理解力穩定
  • 4B摘要表現不錯
  • 1B基礎摘要穩定
  • 筆電運行意外順暢

https://zhuanlan.zhihu.com/p/29912479086

這次的文字測試,選用上一篇影片的逐字稿,講『基督教戰略與川普判策略』,大約四千個字,內容跨哲學宗教、國際政治與談判賽局,分別請模型用 400個字摘要內容。

測試的模型分別是27B、12B、4B、1B,Q4精度,軟體是 Ollama 配合 Open WebUI ,硬體是MacBook Pro M4 24G版。

Gemma 3 終端測試 1B 4B 12B 27B 表現揭密 20250317

在電腦端的測試中,27B 版本展現出極其優秀的表現。無論是語言理解、邏輯推理,還是長文摘要的整合度,都已經接近 GPT-4 的水準,尤其是竟然看得懂隱含意圖、語境變化,還能給出更後續的建議。

Gemma 3 終端測試 1B 4B 12B 27B 表現揭密 20250317

接著測試了 12B 版本。雖然比 27B 稍弱,但 12B 版本依然展現出非常優異的理解力。邏輯結構與細節補充方面明顯優於過去同類模型。雖不及 27B 那樣強大,但 12B 已具備足夠的處理能力。

Gemma 3 終端測試 1B 4B 12B 27B 表現揭密 20250317

再來是 4B 版本。它能完成基本的文字摘要,但細節的捕捉明顯不足。

Gemma 3 終端測試 1B 4B 12B 27B 表現揭密 20250317

至於 1B 版本,雖然只能做到較為簡單的摘要,但考慮到其僅有 1B 的規模,表現仍相當不錯。

手機端語言測試

Gemma 3 終端測試 1B 4B 12B 27B 表現揭密 20250317
  • Gemma 3穩定領先
  • 4B穩定表現佳
  • 1B摘要超出預期
  • LLaMA 1B內容混亂
  • DeepSeek 1.5B當機

https://ynews.page.link/6cmMi

手機我使用自己的iPhone 15 pro,使用PocketPal AI這個App。

Gemma 3 終端測試 1B 4B 12B 27B 表現揭密 20250317

在手機端的測試中,首先測試了 Gemma 3 的 4B 版本。結果顯示,4B 版本在手機上表現相當穩定流暢,不僅摘要結果完整,細節與邏輯也維持了一定水準。

Gemma 3 終端測試 1B 4B 12B 27B 表現揭密 20250317

接著測試了 1B 版本。雖然模型更小,但 1B 版本的表現依然讓人驚訝。它雖無法像 4B 那樣完整地分析細節,但表現出乎意料的優秀。

Gemma 3 終端測試 1B 4B 12B 27B 表現揭密 20250317

不要小看Gemma3 1B這樣的能力。這次也測試了其他競爭對手。LLaMA 1B 在同樣測試中出現大量重複內容,摘要邏輯混亂。DeepSeek 1.5B 更是直接當機,無法完成任務。

Gemma 3 終端測試 1B 4B 12B 27B 表現揭密 20250317

相比之下,Gemma 3 的 1B 與 4B 版本在手機端的穩定性和準確度,非常明顯的領先同類小型模型,Google 這次在優化終端模型上,的確非常的有突破性。

圖像識別測試

Gemma 3 終端測試 1B 4B 12B 27B 表現揭密 20250317
  • 27B理解最深入
  • 12B辨識完整穩定
  • 4B僅辨識基礎物件
  • 未辨識Sony A7R IV
  • ChatGPT資料較廣

https://vocus.cc/article/67d30467fd8978000104382a

在圖像識別的測試中,在電腦上提供一張照片,分別提問:『請分析圖片裡面有哪一些拍照的設備?』、『請問圖中總共有哪些設備?』

Gemma 3 終端測試 1B 4B 12B 27B 表現揭密 20250317

測試的模型分別是27B、12B,Q4精度,軟體是 Ollama 配合 Open WebUI ,硬體是MacBook Pro M4 24G版。

Gemma 3 終端測試 1B 4B 12B 27B 表現揭密 20250317

首先測試 Gemma 3 的 27B 版本。不僅能準確辨識出圖中的 Sony 相機與兩顆鏡頭,甚至還能推測設備的用途與使用場景,這種分析,已經超越單純的物件識別,展現出更深層次的理解力。

Gemma 3 終端測試 1B 4B 12B 27B 表現揭密 20250317

12B 版本的表現也相當不錯。它同樣能辨識出相機與鏡頭,並提供部分環境的細節。雖然沒有 27B 那樣深入的分析,但在一般情境下已經相當實用。

Gemma 3 終端測試 1B 4B 12B 27B 表現揭密 20250317

4B 版本的表現則較為基礎,只能辨識出相機與鏡頭。雖然細節不足,但以 4B 的規模來看,這樣的表現已經足以令人滿意。

另外,Gemma 三個版本都未能準確辨識出,「Sony A7R IV」這款相機型號。相較之下,ChatGPT 則能準確辨識出該型號,推測應該是Gemma資料庫比較小的原因。

整體而言,27B 版本的理解與推理最為優秀,12B 則平衡了精準度與效能,4B 則有基礎辨識能力。這也再次證明,Gemma 3 的確實是將「智力」放在核心,讓模型以較少的資料量,完成更複雜的任務。

聯網功能整合

Gemma 3 終端測試 1B 4B 12B 27B 表現揭密 20250317
  • 擺脫儲存大量知識
  • 12B理解能力優異
  • 資料缺口可上網查
  • 減少模型體積負擔
  • 提升模型反應速度

https://www.53ai.com/news/OpenSourceLLM/2025031391367.html

過去的語言模型之所以越做越大,原因就是因為無法上網查資料。為了解決這個問題,傳統模型只能把大量知識塞進去,導致模型越來越龐大。

但 Gemma 3 採取了完全不同的策略。它不再依賴龐大的知識庫,而是專注於「理解力」本身。簡單來說,Gemma 3 更像是一個「懂得怎麼找資料」的學生,而不是一個「背誦整本百科全書」的死背書呆子。

12B 以上的 Gemma 3 模型已經擁有非常強的理解力,當遇到資料不夠時,讓軟體上網搜尋就能補足。這樣的設計讓模型維持小規模,還能快速獲取最新資訊。

新一代的模型不需要死記硬背大量資料,而是只要具備邏輯、理解力,剩下的細節透過搜尋就能補齊。Gemma 3 正是這樣的設計,讓模型不再因為「裝太多東西」而變得又慢又笨,反而因為更專注於「理解力」而變得更快、更靈活。

新時代終端模型

Gemma 3 終端測試 1B 4B 12B 27B 表現揭密 20250317
  • 顛覆傳統資料堆積
  • 專注理解更小更聰明
  • AI普及化基礎確立
  • 27B筆電穩定運行
  • NVIDIA市場壓力提升

https://news.futunn.com/hk/post/54244230/what-does-it-mean-for-nvidia-when-google-s-new

Gemma 3 的誕生,應該是近期 AI 模型發展中,最重要的技術突破,Deepseek還要重要很多。它徹底顛覆了傳統語言模型「越大越強」的概念,證明了模型不需要依賴大量資料,而是可以透過更有效的架構,專注於提升「智力」本身。

這樣的策略,讓 Gemma 3 成為真正的「終端模型」。1B 和 4B 版本在手機上就能順暢運行,若再搭配500MB的語音轉文字模型,以及文字轉語音模型,手機已經擁有完整的 AI Agent 基礎。

這次的突破,甚至可能對硬體市場帶來真正的衝擊,由於語言模型與軟體的進步,很有可能AI落地會比預期中早很多,對於硬體的重度依賴也會減輕一些。

這也是為什麼 NVIDIA 後續會推動 GB10 晶片,以應對這種「輕量化模型」的威脅。因為當普通筆電都能執行優秀的 AI 模型時,高價 GPU 的需求勢必會下降。Google 的 Gemma 3,不僅改變了語言模型的發展方向,更可能重新塑造整個 AI 應用市場。

那Google的Gemma 3
它不僅改變了語言模型的方向
更可能重塑整個AI的應用市場
我覺得這個才是
最近最應該關注的重點
很可惜好像關注度低了一點

但是沒關係
我們做投資、做股票
就是要去關注
別人沒有關注到的細微末節

之後我們再找機會
為各位測試Gemma 3
短影片或是書籍它的摘要能力
到底有沒有它說的這麼強

如果各位有需要我測的東西
也可以留言告訴我
我們下次一併做檢測
今天到這邊感謝各位~掰

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

返回頂端