當前位置:思兔TXT免費看>都市言情>重生之AI教父> 436. 新的衝擊 DeepSeek
閱讀設定(推薦配合 快捷鍵[F11] 進入全屏沉浸式閱讀)

設定X

436. 新的衝擊 DeepSeek (1 / 2)

不知不覺,又過去了兩年時間。

對於孟繁岐個人來說,這段時間他的進展並不順利。

AI技術速度放緩的原因是多方面的。

首先,孟繁岐必須承認,在將前世的技術優勢全部消耗殆盡之後,他已經再也無法繼續維持持續了近十年的,那獨一檔的技術視野。

“雖然早就做好了心理準備,卻還是感覺有些失落和無奈啊...”深夜裡,孟繁岐在辦公室的躺椅上揉著自己緊鎖的眉頭。

自重生以來,孟繁岐一直剋制著自己,在諸多學者身邊維持謙遜好學的姿態,萬不敢忘自己短處所在。

不過在GPT系列推動至極限之後,所面對的就不僅僅是演算法和技術的問題了。

“要說起來,老黃對公司的限制,比我水平下降對公司的限制還大!”孟繁岐為此感到焦躁。

他雖然無法像此前一樣做到步步不錯,直指要害,卻畢竟也與世界上最頂尖的群體常年接觸學習。

此外,還手握最為龐大的資金與計算裝置資源。

在此情況之下,想要做不出成績,其實也是非常困難的。

因為普通人要執行一年的實驗,你使用千倍的算力,也就是半天的時間就可以計算完成了。

早上吃著早飯實驗跑起來,中午午休回來便已經可以看到結果。

在這樣的效率加持之下,即便孟繁岐如今判斷錯誤的次數變多,也並不是什麼要緊事。

無非就是多做些實驗,多消耗幾倍的算力罷了。

折算成金額,一年十來億頂了天。

對於早已財富自由的孟繁岐來說,只要錢能解決的事情都不是事。

可問題就在於,老黃的計算裝置研發,終究還是要時間的。

不像孟繁岐,可以提前三五年往外發新的演算法技術,黃仁勳的硬體技術那是真的催不來,只能一點點緩步推進。

這番發展速度上的錯位,導致孟繁岐如今有力無處施展。

“如果能有後來的H100叢集,我所需要的顯示卡數量可以減少至少8到10倍。”孟繁岐如今受到的一大限制,就是繼續拓展演算法邊界所需要的顯示卡數量實在太多了。

卡一多,它就容易出問題,和人一樣。

假設說一張卡訓練三個月,百分之99.99的機率都是正常的。

當這個數字來到2000,乃至10000的時候,這個機率則會驚人地降低為82%和百分之37%。

也就是說,當你使用萬卡叢集的時候,想讓每一張卡都能順順利利地把工作給完成了,這個可能性只有可憐的三分之一。

而只要一張卡出現了問題,就勢必會對整個叢集產生影響,中止訓練。

為了避免這種一卡罷工,萬卡圍觀的情況發生,孟繁岐投入了大量的資源和時間。

可GPT4o,以及具有推理功能的o1之上,使用舊有辦法繼續提升效能的空間並不太大了。

孟繁岐這邊收效甚微,便給了追趕者們極大的機會。

原本效能差了closeai許多的諸多大廠們,都在過去的這段時間裡大大縮短了大模型效能之間的差距。

上一章 目錄 +書籤 下一頁