436. 新的衝擊 DeepSeek （1 / 2）

不知不覺，又過去了兩年時間。

對於孟繁岐個人來說，這段時間他的進展並不順利。

AI技術速度放緩的原因是多方面的。

首先，孟繁岐必須承認，在將前世的技術優勢全部消耗殆盡之後，他已經再也無法繼續維持持續了近十年的，那獨一檔的技術視野。

“雖然早就做好了心理準備，卻還是感覺有些失落和無奈啊...”深夜裡，孟繁岐在辦公室的躺椅上揉著自己緊鎖的眉頭。

自重生以來，孟繁岐一直剋制著自己，在諸多學者身邊維持謙遜好學的姿態，萬不敢忘自己短處所在。

不過在GPT系列推動至極限之後，所面對的就不僅僅是演算法和技術的問題了。

“要說起來，老黃對公司的限制，比我水平下降對公司的限制還大！”孟繁岐為此感到焦躁。

他雖然無法像此前一樣做到步步不錯，直指要害，卻畢竟也與世界上最頂尖的群體常年接觸學習。

此外，還手握最為龐大的資金與計算裝置資源。

在此情況之下，想要做不出成績，其實也是非常困難的。

因為普通人要執行一年的實驗，你使用千倍的算力，也就是半天的時間就可以計算完成了。

早上吃著早飯實驗跑起來，中午午休回來便已經可以看到結果。

在這樣的效率加持之下，即便孟繁岐如今判斷錯誤的次數變多，也並不是什麼要緊事。

無非就是多做些實驗，多消耗幾倍的算力罷了。

折算成金額，一年十來億頂了天。

對於早已財富自由的孟繁岐來說，只要錢能解決的事情都不是事。

可問題就在於，老黃的計算裝置研發，終究還是要時間的。

不像孟繁岐，可以提前三五年往外發新的演算法技術，黃仁勳的硬體技術那是真的催不來，只能一點點緩步推進。

這番發展速度上的錯位，導致孟繁岐如今有力無處施展。

“如果能有後來的H100叢集，我所需要的顯示卡數量可以減少至少8到10倍。”孟繁岐如今受到的一大限制，就是繼續拓展演算法邊界所需要的顯示卡數量實在太多了。

卡一多，它就容易出問題，和人一樣。

假設說一張卡訓練三個月，百分之99.99的機率都是正常的。

當這個數字來到2000，乃至10000的時候，這個機率則會驚人地降低為82%和百分之37%。

也就是說，當你使用萬卡叢集的時候，想讓每一張卡都能順順利利地把工作給完成了，這個可能性只有可憐的三分之一。

而只要一張卡出現了問題，就勢必會對整個叢集產生影響，中止訓練。

為了避免這種一卡罷工，萬卡圍觀的情況發生，孟繁岐投入了大量的資源和時間。

可GPT4o，以及具有推理功能的o1之上，使用舊有辦法繼續提升效能的空間並不太大了。

孟繁岐這邊收效甚微，便給了追趕者們極大的機會。

原本效能差了closeai許多的諸多大廠們，都在過去的這段時間裡大大縮短了大模型效能之間的差距。