【377是當選的內容肯定是出不來了,378前半部分和諧了,不能寫,我把後半部分放免費章節在這裡吧。】
不論大家的觀點如何離譜,對於AI領域的關注隨著大選節節攀升也是不爭的事實。
這種熱度在孟繁岐宣佈即將釋出真正的,能夠根據文字繪圖的人工智慧後,來到了一個新的巔峰。
因為接近半年之前,孟繁岐放出的試用版本Clip就已經展現了相當出色的繪圖能力和多模態理解能力。
好到大家都以為這東西是專門為了AI繪圖而研發的。
結果沒想到,僅僅只是加入了影象和文字之間的對應關係,模型就很快自發的擁有了如此之強的影象生成能力。
而且半年前就已經那麼驚人了,現在那還得了?
對於萬眾期待的AI繪圖,內部的研發其實並不順利,這點從釋出時間上就能夠看出。
孟繁岐也猶豫了相當一段時間,應該具體選擇怎樣的路線。
前世最為著名的AI影象生成器,主要是StableDiffusion,Midjourney和DALLE三個。
其中SD擴散模型是基於Clip的文字生成影象模型,它的方式是從有噪聲的情況開始,逐漸改善影象,直到完全沒有噪聲,逐步接近所提供的文字描述。
它的訓練方式也已經經過了多次的研究打磨,先取樣一張圖片,並隨著時間的推移逐漸增加噪聲,直到資料無法被識別。隨後讓模型嘗試將影象回退到原始形式,在此過程中學習如何生成圖片或其他資料。
這種路線如其名字stable一樣,非常穩定,不過倘若想要生成非常高質量的影象,計算消耗非常之大。
技術上已經達成,但在成本上,似乎目前不是很適合投入市場。
前世的Midjourney則比較擅長各種藝術化的風格,生成的影象常有非常精美的結果。
隱姓埋名,一舉奪得繪畫大賽金獎的那副【太空歌劇院】便是Midjourney的作品。
按理來說,這個路線更具美感,既能夠起到震撼宣傳的效果,又能吸引大量使用者,應該是上上之選。
不過對比開源的擴散模型辦法,Midjourney使用的是公共平臺機器人來處理使用者的請求。
由於其封閉盈利的模式,孟繁岐對這款AI的具體技術細節知之甚少,也不清楚它最為核心的技術關鍵是什麼,因而只得放棄這條線路。
“如果從前世的知名度和受歡迎情況來看,擴散模型和Midjourney會更加穩定,不過DALLE在我重生前已經和ChatGPT進行了組合,有非常大的潛力,考慮到以後的發展情況的話我需要對兩者路線進行融合。”
正是因為需要集兩家之長處,孟繁岐的擴散繪圖AI才會比預期要晚了幾個月。