378. 繪圖AI的三種形式（1 / 2）

【377是當選的內容肯定是出不來了，378前半部分和諧了，不能寫，我把後半部分放免費章節在這裡吧。】

不論大家的觀點如何離譜，對於AI領域的關注隨著大選節節攀升也是不爭的事實。

這種熱度在孟繁岐宣佈即將釋出真正的，能夠根據文字繪圖的人工智慧後，來到了一個新的巔峰。

因為接近半年之前，孟繁岐放出的試用版本Clip就已經展現了相當出色的繪圖能力和多模態理解能力。

好到大家都以為這東西是專門為了AI繪圖而研發的。

結果沒想到，僅僅只是加入了影象和文字之間的對應關係，模型就很快自發的擁有了如此之強的影象生成能力。

而且半年前就已經那麼驚人了，現在那還得了？

對於萬眾期待的AI繪圖，內部的研發其實並不順利，這點從釋出時間上就能夠看出。

孟繁岐也猶豫了相當一段時間，應該具體選擇怎樣的路線。

前世最為著名的AI影象生成器，主要是StableDiffusion，Midjourney和DALLE三個。

其中SD擴散模型是基於Clip的文字生成影象模型，它的方式是從有噪聲的情況開始，逐漸改善影象，直到完全沒有噪聲，逐步接近所提供的文字描述。

它的訓練方式也已經經過了多次的研究打磨，先取樣一張圖片，並隨著時間的推移逐漸增加噪聲，直到資料無法被識別。隨後讓模型嘗試將影象回退到原始形式，在此過程中學習如何生成圖片或其他資料。

這種路線如其名字stable一樣，非常穩定，不過倘若想要生成非常高質量的影象，計算消耗非常之大。

技術上已經達成，但在成本上，似乎目前不是很適合投入市場。

前世的Midjourney則比較擅長各種藝術化的風格，生成的影象常有非常精美的結果。

隱姓埋名，一舉奪得繪畫大賽金獎的那副【太空歌劇院】便是Midjourney的作品。

按理來說，這個路線更具美感，既能夠起到震撼宣傳的效果，又能吸引大量使用者，應該是上上之選。

不過對比開源的擴散模型辦法，Midjourney使用的是公共平臺機器人來處理使用者的請求。

由於其封閉盈利的模式，孟繁岐對這款AI的具體技術細節知之甚少，也不清楚它最為核心的技術關鍵是什麼，因而只得放棄這條線路。

“如果從前世的知名度和受歡迎情況來看，擴散模型和Midjourney會更加穩定，不過DALLE在我重生前已經和ChatGPT進行了組合，有非常大的潛力，考慮到以後的發展情況的話我需要對兩者路線進行融合。”

正是因為需要集兩家之長處，孟繁岐的擴散繪圖AI才會比預期要晚了幾個月。

378. 繪圖AI的三種形式 （1 / 2）