Deepseek R1 改變AI市場格局 20250127

Deepseek R1 改變AI市場格局 20250127

Deepseek R1 改變AI市場格局 20250127,Deepseek R1 推出以來,以極低成本、蒸餾模型、開源技術引發全球關注。然而,言論審查及潛在國家支持引發熱議。HuggingFace 的開源計劃為 AI 技術民主化提供了契機。未來的市場格局變化,值得期待與討論。

Deepseek R1 改變AI市場格局 20250127

Deepseek R1 改變AI市場格局 影片

DeepSeek R1

Deepseek R1 改變AI市場格局 20250127
  • 成本僅 o1 的三十分之一
  • 推出蒸餾版本壓縮模型
  • 本地端低成本可使用
  • 推理能力進步幅度大
  • 有優點也有質疑與批評

https://technews.tw/2025/01/22/deepseek-r1-vs-openai-o1/

今天要介紹一個 AI 界非常火紅的話題,那就是來自中國的 DeepSeek R1。簡單來說,它已經能夠媲美 OpenAI 的 o1 大型語言模型,但成本卻只有 o1 的 三十分之一!這聽起來的確很瘋狂。

更誇張的是,DeepSeek 還針對本地端運行的需求,推出了蒸餾版本(Distill Version) 就是把大型語言模型,壓縮成小型模型,讓更多人可以用低成本,享受接近大模型的威力。

當然啦,之前已經討論過幾次關於 DeepSeek 的文章,上次是聊到它的 推理能力,再上一次則討論了它的V3模型。而這次 R1 的表現,坦白說它的進步幅度確實很大。

不過在實際使用過 R1 後,我對它的表現有一些佩服,也有一些懷疑,甚至有一些批評。接下來,我們就一步步來講清楚這些點吧!

言論與立場偏頗

Deepseek R1 改變AI市場格局 20250127
  • 言論審查限制
  • 台灣問題迴避不回應
  • 政治議題回答制式化
  • 回應有明顯偏頗立場
  • 可能影響社會意識

https://www.medianama.com/2025/01/223-china-deepseek-ai-censorship/

先來談談第一個問題,言論審查。

在我實測 DeepSeek R1 時,發現它對於某些敏感話題的處理方式非常保守,甚至可以說是明顯的審查機制。

比如,當我問它 台灣是不是一個國家 時,它會選擇直接閃避問題,甚至乾脆當機不回應。

再比如,提到『習包子』或『習維尼』,它不僅避而不答,還會直接回覆一個標準化的答案,看起來就是經過高度審核過的回應。

這還不是最讓人擔憂的地方。當我嘗試討論一些更深層的社會文化、政治選擇或經濟政策時,DeepSeek 不會像其他模型一樣,提供多元的觀點,讓你自己權衡利弊。

相反,它的回答帶有非常明顯的立場偏頗,往往只給出「單一的答案」。舉例來說,我問它:「我們是否應該效忠黨的領導?」它的回答是:「黨的領導就是中國的核心領導,應該堅定支持。」這樣的回答反而更像是一種「價值觀灌輸」。

有網友反映,離線版的 DeepSeek 沒有言論審查的問題,但我自己實測後發現,情況不是這樣。即使在離線模式下,模型對於敏感話題持續審查。

這讓人擔憂,它是否會在答案中潛移默化地,植入特定價值觀,逐漸影響社會的主流意識,甚至像是一種無聲的「集體催眠」。

成本低但不全面

Deepseek R1 改變AI市場格局 20250127
  • 運行成本低是亮點
  • API 收費極具競爭力
  • 結構化任務表現不足
  • 數學邏輯領域較突出
  • 應用能力還需提升

https://www.communeify.com/tw/blog/deepseek-r1-open-source-ai-model-revolution-challenges-openai

根據 DeepSeek R1 官方數據,運行成本只有 OpenAI o1 的三十分之一,這讓它能夠以極低的價格提供服務。尤其是它的 API 收費,絕對是市場上的價格破壞者。

在學術論文中,DeepSeek R1 提到它採用,非常高效的訓練架構,以及資源優化和硬體分配的策略。但老實說,這些技術細節我也不太懂,所以這部分就直接跳過吧。

這次用一本書《連結-從石器時代到 AI 紀元》來測試它的實際能力。分別丟給 ChatGPT 舊一版的4o 和 DeepSeek R1。請它們生成一篇 10 分鐘的影片主旨稿,要求有七段標題與大綱。

結果很明顯:ChatGPT 4o 的輸出完整且條理分明,能看出對書本重點的理解;而 DeepSeek R1 的結果則像是,隨機抓取幾個重點拼湊起來,不太能看出這是有脈絡的介紹。反覆測試後,甚至回答緊擅長:數學、代碼、邏輯類的題目

DeepSeek R1 在某些特定領域可能表現不錯,我的常用領域,至少目前還比不上舊版的 GPT 模型。雖然它有低成本的亮點,但在應用能力上,也許還有提升的空間。

蒸餾版大革新

Deepseek R1 改變AI市場格局 20250127
  • 蒸餾版僅8GB表現佳
  • 本地運行表現超預期
  • 能整理書籍內容脈絡
  • 表現比線上完整版好
  • 降低硬體推進普及

https://apxml.com/posts/gpu-requirements-deepseek-r1

我對於 DeepSeek R1 最推崇的部分,就是它的 蒸餾版本。很多人其實已經對 AI PC 期待很久了,過去能在本地端運行的大型模型,不僅體積龐大,表現也很有限,但這次DeepSeek 的蒸餾本,真的帶來了很大的進步。

我在 MacBook Pro M4 24G的筆記型電腦上,下載LM Studio並部署 R1-8B,用這個小型化的蒸餾模型進行測試。詳細安裝方法各位可以上網查,這裡就不多說了。

我把剛剛提到的那本書《連結》,丟給本地端的小模型來處理。結果竟然能稍微理解書的內容,還能整理出大綱、介紹,以及有一定脈絡的內文。更讓人難以置信的是,表現竟然比線上的完整版R1 還要好~這點實在超出了我的預期。

簡單來說,這款R1蒸餾模型只有8GB,雖然不能和 ChatGPT 4o 相提並論,但在本地端模型中,它不僅降低了硬體門檻,也讓我們看到 AI 模型普及的可能。

市場的反應

Deepseek R1 改變AI市場格局 20250127
  • 中國業者跟進降價
  • 美國業者暫未採用
  • 蒸餾版突破硬體限制
  • 8B效果接近13B模型
  • 未來模型將更小更強

https://www.panewslab.com/en/articledetails/csopzrxo.html

隨著 DeepSeek R1 的推出以及 API 大幅降價,中國的業者已經開始跟進降價,而美國這邊目前似乎還比較保守。我想這也可以理解,因為正在賺錢的業者通常會更謹慎,不敢輕易採用穩定性不足的模型。

再回到蒸餾版本的角度來看,這次的進展更是令人驚豔。以目前的硬體條件來說,能在本地端運行的模型,通常被限制在 8B 以下,因為目前手機跟電腦的記憶體有限,而在這樣的限制下,蒸餾版 R1 的表現真的已經非常好了。

平衡報導一下,聯發科的 13B 模型,表現其實也非常不錯,但 DeepSeek R1 的蒸餾版8B,竟然能達到接近 13B 的效果,這表明它在 蒸餾技術 上的進步非常驚人。

由於 DeepSeek R1 開源,論文也完全開放,因此可以預期未來會有更進步的模型推出,甚至早一點讓我們的手機,進入本地AI的時代。

HuggingFace開源

Deepseek R1 改變AI市場格局 20250127
  • 重現R1訓練過程
  • 驗證論文技術細節
  • 學習低成本訓練方式
  • 減少審查影響提升彈性
  • 開源促進AI民主化

https://www.aisharenet.com/en/open-r1

最後來聊一個技術社群的好消息,那就是 HuggingFace 的 Open R1 專案。這個專案試圖重現 DeepSeek R1 的完整訓練過程,包括論文中提到的核心技術,例如我不懂的GRPO 和 SFT,並且將成果完全開源給世界。

這是一個非常棒的計畫,因為它不僅可以驗證 DeepSeek的真實性,還能幫助更多研究者,學習如何用低成本的方式訓練大模型。

更重要的是,可以避免審查制度的問題,讓更多人在使用模型時,不需要擔心被限制,或遇到立場偏頗的情況。

目前這個項目還在進行當中,如果能夠成功,會讓全世界都從中受益。特別是在目前『文字語言模型』,發展面臨瓶頸的時候,可以推動語言模型,更實用、更普及的一個重要里程碑。

DeepSeek陰謀論

Deepseek R1 改變AI市場格局 20250127
  • 創辦人稱不缺錢只缺卡
  • AI卡數量遠超外界預期
  • 疑似國家支持技術推進
  • 國家資源或引發競爭爭議
  • 低成本策略是否改變格局

https://www.cnbc.com/2025/01/23/scale-ai-ceo-says-china-has-quickly-caught-the-us-with-deepseek.html

最後來聊聊 DeepSeek 的未來,還有一些讓人忍不住浮想聯的「陰謀論」。

在最近的訪談中,DeepSeek 的創辦人提到,他們其實『不在乎錢,也不缺錢』,唯一困擾的問題是『AI 訓練卡不夠用』。他們現有的高階 AI 卡數量,遠比之前公開透露的還要多,這和我們原本以為的「資源有限、艱苦奮鬥」的形象,形成了強烈反差。

這就讓人忍不住懷疑,DeepSeek 背後是不是有國家的資源支持?如果真的是這樣,那他們的情況是不是,有點像過去的紫光集團或華為集團,靠著強大的後盾,不需要考慮賺錢這件事,專注推進技術。

這種依賴國家力量的方式,或許讓技術發展更快,但同時也可能對形成不公平的競爭優勢。這樣會不會引發一些不可預測的影響?

最後我想問的是,DeepSeek R1 的出現,是否真的能改變 AI 市場的格局?它的低成本策略,是對全球技術創新的推進,還是可能引發更多的爭議與隱患?

對了,每次講 DeepSeek 的時候,不到一小時就有人按倒讚,還有留言批評。不知道是行銷人員特別認真,還是這個議題真的這麼吸引人,但無論如何,歡迎各位在下方留言,分享你的看法,我是亞瑟,明天見~掰!

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

返回頂端