馬斯克吹牛,從來都是先打草稿。
2月18日,xAI重磅發佈號稱“地表最強”的Grok 3 系列模型。
從官方丟出的數據來看,Grok 3基礎模型超過DeepSeek V3、GPT-4o等SOTA模型;Grok 3推理模型同樣超過o3-mini high、DeepSeek R1、Gemini 2 Flash Thinking等模型。
除此之外,在人工盲評的Chatbot Arena上,Grok 3全類型都排行第一。
雖然評分只比第二高十幾分……但高就是高。
“地表最強”,確實沒什麼爭議。
牛皮再一次成真,馬斯克壕氣地宣佈:開放Grok 3供用戶免費使用,直至服務器崩潰。
最強、不要錢,這兩個標籤擺在一起,結果顯而易見。
2月20日,Grok應用超越ChatGPT APP,迅速升至美國區App Store免費APP榜首。
不過有一說一,這個“地表最強”,其實並沒有給人多少震撼。
最近的輿論,也明顯反映了這一點,遠沒有想象中的爆炸性效果。
畢竟,這可是拿20萬張GPU,歷時214天硬生生堆出來的首個Elo評分破1400的模型,消耗的能源足以維持一箇中型城市運轉。
結果是,除了基座測試分數亮眼外,比如推理效率之類,並沒有實質性的突破。
一定程度上,只是個單純的數值怪。正確的叫法,是“全球最大的H100連集羣”。
換句話說,只要肯燒錢,這個“地表最強”的稱號,對手隨時可以拿走。
表面上看,這性價比,實在是有點低。
尤其是最近被DeepSeek極端的低成本震驚後,吃瓜羣衆不免發出疑問:Gork 3耗費了這麼多資源,性能僅比當前的SOTA提升了一點而已,意義很大嗎?
值不值得,取決於你怎麼看待這個事。
至少馬斯克本人,並不認爲不值。
甚至,後續計劃還要擴大規模,功率至少是目前的5倍,一心在堆卡這條道上走到黑……
簡直就是無腦燒錢的舉動,已經不能完全用商業邏輯來解釋了。
馬斯克至少向世界證明瞭一件事:更強大的算力,確實能訓練出更強大的模型。
問題在於,目前大家能想到的測試方式,基本都是對標人類的各種考試之類的,最前沿的幾個大模型都已經取得很高分了。
換句話說,最優秀的幾個大模型,其能力都已經接近人類能理解的上限。
Grok 3的尷尬之處在於,在目前的認知框架中,它沒辦法證明自己的優勢究竟在哪。
這就好比,一門考試,學霸們都能考90分以上。
學渣不覺得有什麼,只有他們自己知道,90分和95分區別有多大。
60分到90分,你要付出1的努力;90到95分,雖然看起來區別不大,但所需付出的精力卻是成倍的提升。
對絕大多數人而言,兩者其實沒什麼區別,只有頭部幾個爭排名的人會爲了1分的差距而努力。
這種橋段,也可以套入我們看的修真小說情節當中。
人間界的天花板之所以是化神期,一方面是天地規則的壓制,另一方面,是這個世界的資源等級只夠修士練到這個境界。
想要繼續升級,最直接的辦法就是飛昇靈界獲取高級資源;但正常的化神期修士根本抗不過天劫,壓根去不了靈界。
想升級就要飛昇,但不升級又沒能力飛昇……這就是矛盾的,所以亙古以來,登頂者如過江之鯽,飛昇者卻寥寥無幾。
再回到現實。
現在所有的AI,包括Gork 3,不管看起來多強,其實仍然處於最初級的階段。
爲什麼初級?因爲沒有人知道下一步究竟該怎麼去突破,突破後究竟是什麼?是不是就是AGI?
大模型的根本是連接主義,模仿的是人腦。
人爲什麼擁有智慧?並不是因爲腦子“大”。
論大腦重量,人類不如大象;論腦重佔比,不如黑猩猩;論神經元規模,不如藍鯨;論視覺信息規模,不如大部分鳥類……
在算力這方面,人腦並不比其他動物更有優勢。真讓讓人脫穎而出的,可能是“算法”。
模仿人腦的大模型,往上堆算力可以提高運轉效率,但並不一定能量變產生質變。
前者還能靠錢堆,後者就很難說了。
所謂的技術奇點大概就是這樣,你不僅不知道它什麼時候來,更不知道它究竟是什麼。
如果以這種角度看,Gork 3與DeepSeek V3和GPT-4o的區別,可能並不是95分和90分,而是0.95和0.9分,實際上都沒有完成1的突破。
滿分100分。
不是說這沒有意義,越接近1突破的概率自然越大。
但在實際的使用場景中,對大多數人而言,不管你是0.95還是0.9,甚至更弱一點的0.8,其實區別都不大。
更關鍵的是,0.95所需的成本更高,收費理所當然更貴,大多數用戶用不起、也壓根用不到。
所以從商業化的角度來看,馬斯克燒了這麼多錢訓練出暫時領先的大模型,雖然確實是地表最強,但邊際收益屬實是有點低。
馬斯克是個商人,做任何項目都要考慮回報率。
但這次,可能不太一樣。
就算短期虧錢,也一定要做;因爲長期的回報,可能遠遠超出想象。
這份回報,甚至不能僅僅用金錢去衡量。
對馬斯克本人而言,急需一個掌控在自己手中的、足夠強力的AI大模型。
不論花多少錢,不論它是不是劃時代的,總之是必須要有一個。
否則他現在要做的事,沒辦法展開。
他現在的第一目標是什麼?
最近,乃至未來4年,全球輿論的核心,毫無疑問是馬斯克主導的“政府效率部”,簡稱DOGE。
DOGE部門滿打滿算不過20餘人,核心成員更是僅有6人,全都是真正的天才,年紀最大的25歲,最小的才19歲。
有一說一,這6人雖然是天才,但除了最年長者,其餘有3人還是學生、1人輟學,甚至還有黑歷史。
這種背景別說進入機密機構,不論在哪個國家,都是過不了政審的。
但他們確實成了世界上權力最大的幾個青年之一,擁有美國最高級別的安全許可,不受任何人監督:
Gavin Kliger,25歲,加州伯克利計算機專業,前推特數據工程師,清掃對象是美國開發署,並向五角大樓植入去中心化審計程序。
Gautier Cole Killian,24歲,來自加拿大麥吉爾大學,是6人中最神祕的一位,負責通過AI分析、確保政府資金被最高效使用。
Luke Farritor,23歲,內部拉斯加大學輟學,任務是監督醫保系統和能源部,後者包括監督核武器的使用。
Ethan Shaotran,22歲,職業黑客,哈佛大學在讀生,xAI黑馬馬拉鬆比賽亞軍,致力於用算法取代政府的傳統人力模式。
簡單來說,預算評估、行政審批乃至國會報告,全部交給AI去做。
bobba,21歲,印度裔,加州伯克利大學在讀生,主導財政支出實事監管系統,有權直接凍結聯邦支出。
Edward Coristine,19歲,職業黑客,美國東北大學在讀生,曾爲俄羅斯提供AI服務,現爲美國國土安全部高級顧問,負責國家邊境安全。
6位年輕人,每一位都有潛力成爲未來科技行業的引領者,現在卻甘願不拿工資,每週工作時間長達120個小時,不顧安危捲進政治鬥爭中。
馬斯克稱他們是地球上最優秀的6位軟件工程師,外界人稱“DOGE六君子”。(暗示他們的下場可能如戊戌六君子,不太好。)
馬斯克和DOGE六君子
按照計劃,他們將在美國建國250週年、即2026年7月4日前,徹底推翻美國運轉了兩個多世紀的體制。
第一個挨刀的,是擁有1.2萬名員工的美國國際開發署,被裁得只剩294人。
目前爲止,這個小團隊日均砍掉美國政府1.26億美元的預算。
看起來誇張,但按這個速度,預計到明年7月,只能砍掉670億美元,遠遠低於特朗普最終削減2萬億美元預算的目標。
所以還得加大馬力,真正的大動作,或許還沒有來。
後續,甚至還要動奧巴馬醫改下的Medicaid和Medicare等項目。
這個可以說是衆望所謂,奧巴馬醫改的年度預算高達26%,甚至比美國國防開支的13.3%還要高一倍……
粗略計算,至少200萬美國公務員將被要求主動辭職。你要是不自己走,到時候一毛錢補償都不給。
再加上那兩千多萬還在領社保的“幽靈”,影響的人難以測算。
總而言之,裁人這塊,目前的DOGE完全可以做到。
但有一件事更危險的事,僅憑幾個人和現有的AI技術可能無法做到:查賬。
美國政府過去這麼多年的賬,絕對波及到全世界。就這麼幾個人,無論怎麼天才,就算各部門把賬本送到案前讓你查……
查到特朗普下臺,這賬都不可能理得清。
別說6個人,就是6萬人,三五年之內也很難查閱完。
就算真請這麼多會計來查,人多魚龍混雜,根本就沒辦法保證公正性。
人不可能辦到,只有更強大AI可以。它將光速整合所有單位的所有數據,錢去哪了、經誰的手、效果如何,全都給你安排得明明白白。
具體怎麼做?至少有4個方向。
第一,鎖定資金流向。
AI通過分析資金的流通路徑,追溯到資金末段,判斷這筆錢的合理性。
第二,掃描財務數據。
通過自然語言處理,對比數據和政策,快速發現資金是否存在利用法律漏洞套利的可能性。
第三,自動處理。
AI不間斷分析海量的政府文件,自動篩選可疑的數據,極大縮短效率部發現問題的時間成本。
第四,自我升級。
AI也會犯錯,但“對抗訓練”機制可以將AI錯判的數據重新編碼爲新的訓練數據,不斷提高準確率。
……
Gork 3之前的AI,也可以做到這些事。
尤其是憑藉第四點,自我升級的能力,效率會越來越高。
但是,能不能在2026年7月4日前完成目標?
Gork 3之前,毫無疑問不能,否則馬斯克沒必要燒錢做吃力不討好的事。
Gork 3可以嗎?毫無疑問也不能,否則同樣沒必要以公認收益低的方法,繼續燒錢。
馬斯克現在最缺的,不是錢,是時間。
當然,若能實現突破、真的大力出奇跡了,那更好。
但這不是第一優先級。
不論能不能實現技術上的突破,只要能縮短達成目標的時間,至少對馬斯克本人和效率部的幾人而言,就是賺的。
很明顯可以看到,馬斯克的改革並不是循序漸進的。
而是直接利用科技,試圖用一年時間就完成對沿用兩百年的體系進行降維打擊。
這與歷史上任何國家的改革,底層邏輯和外在表現是類似的。
總體上都是直接用暴力手段,打破舊的體制。
不一樣的地方在於四個新的變量。
第一個是體量。
綜合所有層面,美國是人類歷史上體量最大的國家。
船大難掉頭,過去體量不足其百分之一的國家想要變革都無比艱難,何況是這尊巨無霸。
第二個是時間節點。
當下毫無疑問正處於新一輪科技革命的前夕。同前三次科技革命一樣,生產力的飛躍將帶來巨大的財富增量,這些新的財富可以一定程度上彌補利益受損的羣體。
打不過你,但只要還有好處,也不是不能跟你混。
這實際上減少了很多矛盾,還是那句經典臺詞:誰贏,他們跟誰。
第三個變量,是馬斯克本人。
馬斯克被稱爲美國版張居正,和DOGE六君子一樣,這個稱呼同樣暗示了不好的結局。
他動的不僅僅是美國官僚體系的蛋糕,屆時這場改革很可能將擴散至全球每一個角落,人類社會所有的政治遊戲規則都將被改寫。
這不是選擇題,AI技術對治理邏輯的重構,正如工業時代的到來推翻了君主制,沒有任何人可以阻擋大趨勢。(比如最近深圳引入AI公務員,或許就是一次很好的嘗試。)
如此大的漩渦中,改革能成功就罷了,馬斯克的地位沒有人可以動搖;若半路折戟,舊體系的反撲也不是他可以承受的。
只有前一種情況,第四個變量纔有意義。
最後一個變量是速度。
這次雖然算得上是不流血的革命,但僅僅想用一年多就完成變革,這是前無僅有的瘋狂,也有可能對社會造成難以預料的破壞。
數以億計的普通人,能否跟得上?有沒有必要這麼急?
樂觀點看,馬斯克不是政客,他的DOGE並不是正規部門、權力的保質期只有4年。
他改革的目的並不是成爲新的掌權者,而是爲自己移民火星的終極理想服務。
所以這種急迫,同樣表現在太空事業上。
大多數人都很費解,爲啥馬斯克那麼頻繁發射火箭,好像非得趕着這幾年上太空。
商業因素固然有,更多則是人生苦短的無奈。
馬斯克1971年生,今年已經54歲。而美國的平均壽命是76.6歲,就算他能蹦躂到100歲,也還就剩40多年。
即便飛船沒問題了,還得驗證宇航員培訓、前哨基地建設和補給等一系列問題。
按正常發展速度,他到死都不可能看到登陸火星。
他沒有時間等技術逐步完善,必須儘快推動技術迭代。達成這一目標的唯一辦法,只有讓全世界、至少是美國快速完成升級,爲自己的終極理想服務。
全人類都還沒反應過來,就已經被請上了通往星辰大海的方舟,真的太倉促了。
而我們除了點贊轉發,又能做些什麼?(全文完)