因為其他語言的資料量太小了,訓練出的模型就不夠智慧。
只有英文版最智慧。
文心一言想要表達得智慧一些,就不能對接中文的語料,要去對接英文的訓練資料才行,然後背後再增加一套翻譯演算法和內容審查演算法。
所以,想做出一款偉大的AI產品,除了在人工智慧領域的頂尖演算法之外,還有很重要的一個因素,就是訓練AI模型的資料。
這些資料裡,有些是開源的公共資料,全世界都可以用。有一些是私有資料,只有自己可以用。
像微軟、谷歌、Facebook這種矽谷的巨頭公司,除了可以使用龐大的公有資料外,還有龐大的有價值的英文私有資料可以使用,他們做出來的AI模型就會比只根據公有資料訓練的AI模型要更加強大。
所以,周不器對內容很重要,尤其是海外的英文內容。
這些都是私有資料,都有可能成為紫微星在未來世界競爭中最寶貴的資產。
如果拉里·佩奇說的這款Knol真的是對標維基百科的產品,那就太有意義了。維基百科是公有資料,Knol就是私有資料。
“維基百科更像是一個詞典,內容都比較基礎,是偏大眾的產品。Knol是由一部分有能力的權威使用者來共同協作,用來解釋一件事物的是什麼、怎麼做、起因經過結果及其周邊事物,並且註明作者的真實資料,從而讓內容更加地精準、權威。”
拉里·佩奇做了一個簡單的比較。
周不器一下就聽明白了Knol這款產品失敗的原因。
資訊的準確性、真實性,其實一點都不重要,大眾根本不在乎真相,只在乎表象。這就會形成一種“越大眾,越普及”、“越權威,越小眾”的現象。
谷歌想把Knol打造成一款有權威級的內容產品,立意很高、志向很大,但想要收穫足夠多的使用者,那還是難了點。
就像紫微星在國內的兩款產品,微知和今日頭條。
微知上的內容比今日頭條優秀多了。
可是,微知的日流量只有6500多萬,今日頭條卻高達2.8億。就是因為微知的內容太好了,頭條的內容很能譁眾取寵博大眾的眼球。
兩人又經過了簡單的交流,周不器對Knol這款產品興趣越來越濃,打算回頭先去研究一下。如果合適,不妨就買過來,加以改造。
會談的最後,兩人談到了長生不老的話題。
拉里·佩奇對此很感興趣,“等敲定了推特的案子,接下來一個方向就是要讓董事會批准,去嘗試在這個領域做一下。”
周不器似笑非笑,“要投資多少錢?”
拉里·佩奇口氣很大,“20億美元吧,資金太少也沒必要讓董事會批准。我打算成立一家專門從事生物研究領域的子公司,用於抗衰老的相關研究,目標是實現人類長壽甚至永生。”
周不器問:“跟IT相結合?”
拉里·佩奇坦言道:“當然,要跟人工智慧關聯起來。現在人類每研究出一款蛋白質的功效,可能都要由幾十位醫學專家花上千萬美元才能研究出來。如果AI發展起來了,完全可以一次性地把全人類所有已知蛋白質的功效都給破譯出來。”
周不器豎起一根大拇指,“有追求。”
“你也會參與吧?AI在改變世界。”
“當然。”