【2025年02月01日訊】(記者宋唐、易如採訪報導)最近,中國人工智能公司DeepSeek推出一款新的AI推理模型,衝擊了美國科技、金融及政策等多個領域,成為推動美中AI大戰的一個導火索。
中共官方炒作DeepSeek
1月20日,就在川普總統上任首日,中國人工智能公司DeepSeek發布了一款AI推理模型DeepSeek-R1,稱其功能媲美OpenAI,還使用更少算力更低成本。
同日,DeepSeek創始人梁文鋒成為唯一一位與李強會面的AI界領袖,中共央視《新聞聯播》給了他清晰的近景畫面。
去年在接受媒體的訪問時,梁文鋒稱他的核心團隊「沒有海歸人士,都是本地人才」,他還強調,中國的AI產業「不能永遠做跟隨者」。這種說法類似於官方宣傳的獨立自主敘事。
讓人們意想不到的是,在中國黃曆新年期間,兩年前還默默無聞的DeepSeek,突然成為一股攪動世界的力量,並登上了海內外的新聞頭條。
1月26日,該模型已經超越ChatGPT,成為蘋果應用商店排名第一的應用。同日,億萬富翁投資者馬克·安德森(Marc Andreessen)稱,R1模型為「人工智能的斯普特尼克時刻」。
圖為美國芯片公司英偉達(Nvidia)的產品示意圖。(Sam Yeh/AFP)
1月27日週一開盤,美國人工智能領軍企業遭遇慘重損失,微軟下跌4%,特斯拉下跌2%,英偉達跌近17%,市值蒸發近6000億美元,成為歷史上市值最大的單日跌幅。
目前,對於DeepSeek聲稱的一些說法,有不同的觀點。但DeepSeek不同之處在於,其背後有中共國家力量的推動。
台灣人工智慧實驗室(Taiwan AI Labs)創辦人杜奕瑾對表示,在AI領域不管是開源或閉源,過去這幾年來,每幾個月都有很大的更新。但DeepSeek特別之處在於,它不單單推出DeepSeek開源模型訊息。
杜奕瑾指出,DeepSeek很多訊息操作,(中共)官媒主導的成分非常高,在微博和臉書上,可以看到很多不是真正使用者的帳號非常活躍,內容主要是:DeepSeek模型推出後美國科技股大跌,美國AI的優勢沒有了。
「這種訊息非常多,而且是在美國股市盤前交易(Pre-Market)時操作的,造成盤前交易市場下跌,實際真的造成正常交易股票的下跌。」
Taiwan AI Labs創辦人杜奕瑾。資料照。(宋碧龍/)
杜奕瑾認為,如果說DeepSeek推出造成美國股票大跌,有點倒果為因。因為是大量訊息操作造成盤前交易下跌後,大家才去注意到DeepSeek,而不是相反。
杜奕瑾表示,這些虛假訊息,在油管或臉書上大量的短影音在講, DeepSeek模型的橫空出世,造成中美科技競爭。
他說,DeepSeek模型的確有獨到之處,但也不至於需要如此大肆渲染,這些短影音渲染帳號,很多都是用AI生成的農場帳號,平常也沒什麼訂戶。現在不斷放大美股下跌的信息。
「從我的角度,有點像把一個很簡單的開源成果,變成國家層級的科技競爭的訊息操作。」他說,這類似以前中國(中共)在國家主導的俄羅斯議題上面的炒作方式。網軍帳號配合官媒帳號,不斷地去做宣傳。很難讓人認為這不是一次有組織的宣傳,這背後有國家力量在推動。
杜奕瑾表示,它藉由的操作,展現的就是中國(中共)並不需要靠最高算力的晶片,也可以把模型做得很好。
DeepSeek低成本之謎
DeepSeek最讓外界關注的一點,是其所聲稱的低成本和低算力。
DeepSeek的原始報告顯示,DeepSeek-R1在預訓練階段,每兆個token上訓練DeepSeek-V3僅需要180K H800 GPU小時。假設H800 GPU的租賃價格為每GPU小時2美元,我們的總訓練成本僅為557.6萬美元。
業界人士認為,DeepSeek使用一種名為「專家混合」(mixture of experts)的技術,類似於將問題交給特定領域的專家,從而減輕了芯片同時處理所有任務的壓力。但這種技術本身並不新鮮。
杜奕瑾指出,傳統商業公司也採用「多專家模式」以降低大模型的成本,這非常普遍,也不算什麼創新,因為大部分AI新創公司比較沒有GPU資源。DeepSeek v3創新之處在於多頭、多精度的混合訓練,可以把模型訓練成本有效降低。
「但是DeepSeek並沒有說,原本的訓練資料是從哪裡來的,以及原本訓練的資料是用什麼樣方法去做訓練,這部分其實不是非常清楚。」
杜奕瑾說,如果下載DeepSeek的原始碼就可以看到,DeepSeek模型其實是利用OpenAI的all one模型的蒸餾技術,把大模型的知識提取出來之後,再交給小模型去做訓練。
「早期DeepSeek在剛發布的時候,你問DeepSeek是一個什麼樣的模型,它會回答說ChatGPT,就可以知道,它原始資料跟蒸餾對象應該就是ChatGPT。」
OpenAI在29日的一份聲明表示,正在審查有關DeepSeek可能「不當」使用其模型的輸出數據來開發其AI模型的報告。(Lionel Bonaventure/AFP via Getty Images)
OpenAI在29日的一份聲明表示,正在審查有關DeepSeek可能「不當」使用其模型的輸出數據來開發其AI模型的報告,這種方法被稱為「蒸餾」。「我們採取積極主動的對策來保護我們的技術,並將繼續與美國政府密切合作,以保護在這裡建造的最強大的模型。」OpenAI發言人說。
杜奕瑾表示,DeepSeek在使用OpenAI模型蒸餾方式的時候,提取很多相關資料做訓練。OpenAI的授權原本是不允許的,就把它的帳號關閉了。
杜奕瑾表示, OpenAI提供的模型蒸餾技術,也不是一個新的技術,大概是2015年就提出來了。OpenAI原本用意是all one模型跑起來成本非常高,提供模型蒸餾是為了讓小的模型跟大的模型去學習,跑起來成本會有效降低,而且近似於大模型某個特殊領域的跑分結果。
他舉例說,這有點類似以前要請一個非常有經驗、非常昂貴的作業員,現在作業員只要把標準的工作經驗寫下來,就可以找一個比較廉價的工讀生來取代。
杜奕瑾指出,是不是未來就不需要比較有經驗、比較高階的作業員,其實不盡然。實際上透過蒸餾的方式,去做到近似複雜模型的結果,並不代表這種訓練出來的模型,會比原本複雜的模型做得好。
「因為它的模型參數沒有那麼多,沒有那麼聰明、那麼有經驗,成果就會下降很多,這也非常常見。」
台灣工研院政策與區域研究組組長李冠樺(李冠樺)
台灣工研院政策與區域研究組組長李冠樺對表示,DeepSeek的低成本模式,事實上是因為利用了別人已經訓練好的模型,進行進一步的優化。這種低成本嚴格來說,其實是別人幫它分攤的。
「它事實上是站在別人的肩膀上再往上走,不應該把它跟OpenAI等同看待。它更像是在OpenAI基礎模型上面,做了一些更有針對性的優化。」
川普政府反應 美中AI大戰升溫
DeepSeek不斷激起了華爾街及科技界的震盪,也延及了新上任的川普政府。白宮是否會因此加碼,制定更嚴格的對華科技限制政策,成為一個焦點。
1月27日,川普總統表示,「中國公司發布DeepSeek人工智能, 應該給我們的行業敲響警鐘,我們需要集中精力進行競爭。」
川普表示,他認為低成本模式對人工智能整體而言是「非常積極的發展」,因為「你不必花費數十億美元,而是花費更少,但希望能找到相同的解決方案。」
1月27日,川普總統表示,「中國公司發布DeepSeek人工智能, 應該給我們的行業敲響警鐘,我們需要集中精力進行競爭。」 (Joe Raedle/Getty Images)
同日,眾議院中共特別委員會呼籲加強對DeepSeek人工智能基礎設施所依賴技術的出口管制。
1月28日,白宮新聞祕書卡羅琳·萊維特表示,美國官員正在調查中國人工智能應用程序DeepSeek對國家安全的影響。
1月29日,兩名美國國會議員呼籲川普政府考慮限制英偉達生產的H20人工智能芯片出口,因為中國人工智能公司DeepSeek依賴這些芯片。
同日,川普提名的商務部長盧特尼克(Howard Lutnick)在確認聽證會上對DeepSeek進行了猛烈抨擊,他說:「他們購買了大量Nvidia的芯片,並找到了繞過這些芯片的方法,從而推動了他們的DeepSeek模型。這種做法必須結束。」
據彭博社援引匿名消息人士稱,川普正考慮對英偉達向中國銷售半導體芯片,施加比拜登政府更嚴格的限制,以限制中國在人工智能方面的發展。
李冠樺表示,2023年華為釋放了7奈米的手機晶片,反而讓美國更了解原先的圍堵網中的一些漏洞,進一步把它圍堵起來。從這個角度來看,其實對他們一點好處都沒有。
「DeepSeek展現以後,美國也開始對它進行更進一步的檢視,對一家公司來講,都不是一個好事情。事情走到這一步,可能已經不是他們能夠控制的了。」
李冠樺表示,從硬體或算力的角度來看,美國絕對還是會持續地卡住中國獲得算力,包含調查DeepSeek是不是從非法管道獲得Nvidia晶片,國家力量是不是在後面幫助獲得一些算力。
「從另外一個角度來看,川普的警鐘,也包含對美國AI發展的警告,是不是太著重硬體或資本的投入,而忽略了應用商業應用的實現。」
有種說法認為,DeepSeek帶來的衝擊證明美國芯片管制的失敗。
但李冠樺認為,這不代表晶片禁令失效 ,而代表晶片禁令的確有它的效果。導致中共在AI的模型的訓練上面,必須要找很多的方法,去達到一樣的效果。
杜奕瑾表示,晶片禁令的確在AI訓練上面,會造成一些不方便。今天的禁令是有效的,但並不能完全阻止AI的發展。
「我感覺很多反應有點過頭了,造成很多不是資訊專業的評語參與其中,讓原本簡單的科技就變得很複雜。」他說。
「DeepSeek發布的技術,包含怎麼用強化學習去把模型做好,怎麼減少對晶片的依賴,同樣的方式美國公司實際上也可以利用。並不是說,因為有了比較不依賴晶片的DeepSeek模型,美國公司就沒有競爭力,也不會(造成)哪個美國公司成果受到威脅。」
美中AI大戰的未來
李冠樺表示,在最領先的一些AI技術的發展上,甚至軍事的AI,美中差距會拉大。但涉及到怎麼運用到商業,中方可能會有一些成果。
杜奕瑾表示,現在人工智能已經慢慢變成各個國家的國家級戰略,誰掌握到超強的人工智能,對一個國家跟整個產業,都是會有革命性的影響。
「美國過去在科技發展勝出,並不是純粹因為掌握晶片或掌握算力,主要還是掌握創新環境、人才環境、資本環境及軟體生態,讓好的人才願意加入,做出貢獻有該有的回報,才會讓美國人工智慧不斷在成長。」
他指出,現在的關稅壁壘、晶片壁壘、算力壁壘,未來如果競爭越高的話,就很有可能各國會趨於脫鉤。
「從2019年開始,就慢慢開始有分隊狀態,走美國供應鏈就不好走中國(中共)的,走中國(中共)就不好走美國的。往下來看的話,未來大國因為爭奪AI科技而造成的脫鉤,也是顯而易見的。在這種潮流之下,相關的立法會出台,造成彼此之間的壓力,慢慢形成分隊的狀況。」
責任編輯:林妍#
Subscribe to Updates
Get the latest creative news from FooBar about art, design and business.
What's Hot

HONG KONG, CHINA - JANUARY 28: In this photo illustration, the DeepSeek logo is seen next to the Chat GPT logo on a phone on January 28, 2025 in Hong Kong, China. Global tech stocks have plummeted following the emergence of DeepSeek, a Chinese AI startup that has developed a competitive AI model at a fraction of the cost of its US rivals, sparking concerns about the high valuations of tech giants like Nvidia. This development has led to significant declines in tech shares across Asia and Europe, with markets in both regions experiencing notable losses as investors reassess the AI landscape and its potential impact on the industry's future. (Photo illustration by Anthony Kwan/Getty Images)
2025年1月28日,在中國香港,一部手機屏幕上顯示DeepSeek標誌與ChatGPT標誌並列的圖像。中國人工智能初創公司「深度探索」(DeepSeek)推出低成本競爭性模型,一度引發全球科技股大幅下跌,但在美國持續實施芯片(晶片)技術出口限制之際,DeepSeek並沒有從根本上解決中共人工智能發展困境。(Anthony Kwan/Getty Images)