這種與人高強度互動的AI智慧,只要它的能力提升了一點,人們就很難繼續回去接受效能更差的版本了。
就如同解析度一般,大家看慣了高畫質之後,是沒法接受模糊的480p的。
一旦輸掉了大模型的軍備競賽,絕大部分使用者都會被頂部的巨頭虹吸走。
而想要取得ChatGPT這樣的成功,其實技術層面的佔比就不是特別大了。
GPT和GPT2都是論文程式碼都開源的技術,只不過當時BERT類的,將語言任務具體分為幾個分支的技術方式更加的火爆。
因而GPT系列這樣專注語言生成的技術,則一直被忽視。
GPT3, GPT3.5,在默默無聞的情況下持續迭代新的技術,這在華國的網際網路氛圍內是非常困難的事情。
曾經輾轉過燕京尚海23個大廠的孟繁岐,深知這些網際網路大廠的尿性。
只要稍稍看到一些技術的突破和成果,所有的人都在問一個問題,“到底怎麼才能把它變成錢?”
過分無意義的內卷和競爭,導致996的大廠們很難去接受一個需要迭代幾年以求一鳴驚人的大突破。
而這個方向的技術,又恰恰是高校基本上無法負擔得起的。
孟繁岐從來不是崇洋媚外,厲外垃同的人。但他縱觀AI的發展史,也不得不承認,圍棋的Alppd,乃至突破性的大模型,ChatGPT。
卻始終沒有一個是華國出品。
難道是華國人不夠聰明嗎?當然不是。
去翻閱一篇篇頂尖的AI論文,很容易就可以發現很多明顯一眼就是華國人的名字。
可越到開創性,突破性的工作,這些華國人的機構就總是國外的院校和研究院。
這才是孟繁岐即便藉助重生的優勢,也不得不選擇去矽谷發展的原因。
想要在國內的大廠,打好堅實的研究基礎,所要付出的努力,需要承擔的壓力都實在太大了。
模型的設計,理念的提出,只在早期可以起到如此顯著的效果。
越到後面,其實高質量的資料會起到更加關鍵的作用。
“所以你基本上完全否定了小模型的價值?”李彥弘對這個觀點,不敢苟同。“在我看來,小模型和移動端模型與智慧,是有非常廣大的市場和前景的。”
“這取決於具體的應用場景,終端的智慧究竟做什麼用途,是否可以穩定聯網。如果只是最簡單的影象分類和檢測,又在無法穩定聯網的情況下,當然還是具有一定的價值。”
“比如自動駕駛場景。”孟繁岐補充道,“我怎麼會否定小模型的價值呢,作為研究演算法的程式設計師,我相當關注具體模型和技術的精確度和執行時間。”
孟繁岐從包中掏出了幾張檢測演算法的實驗記錄表格,“李總,你可以看看我過去幾個月的實驗結果。我是在十分了解小模型加速最佳化的情況下做出的判斷,而跟您談合作,我也不是隻靠著一個競賽的冠軍。”
IMAGENET競賽才剛剛結束沒多久,生成式對抗網路這麼爆炸的創意,論文也剛剛釋出出來,這小子竟然還有時間和精力去搞其他的研究?影象的檢測演算法?
不得不承認,李彥弘被震驚了,但很快他就發現自己還震驚早了。
這特麼是什麼恐怖的結果?在檢測準確度有質的飛躍的同時,模型的執行推理速度竟然是現在頂尖演算法的一百多倍??