其實都是要把資料庫先建立起來,然後不斷地讓人工智慧來進行學習,知道哪些字究竟都對應的是什麼,即使字型再潦草,或者再具有個人特徵,只要採取的樣本足夠多,資料庫足夠龐大,那麼也一定可以讓人工智慧進行識別。
聽完劉光然的解釋,眾人心裡一片瞭然。
“所以呢?”曹陽問到。
“那麼就是說,我們得找一些單位進行合作,”劉強認真地託著下巴思考著,“比如說讓帝都的學校都配合我們,每次閱卷的時候,把學生的答案給拍攝下來,然後放到資料庫裡面讓AI來進行學習。
雖然說每個人的字型都有一定的差異,可很多時候都是在條條框框裡面的,一些有差異的字型也有很多的相似之處,是能夠被識別出來的。”
“嗯,這種情況,就要跟圖片識別的演算法做一些區分,不要讓機器做得那麼精細。”劉光然說,“識別個體筆跡的話,就要求找差異點,對個人特徵進行提取。
識別總的筆跡,並且轉錄為標準字型的話,就得減少這個精細度。”
“實際上,我覺得不用那麼麻煩,”劉光然想了想又繼續說到,“因為我們可以設定一些標準的字型,只要學生們把對應的字給寫下來,就能進行分析和生成對應的個人資料。
之後再進行一些矯正就可以了。”
這種感覺,其實就相當於提取個人的書寫特徵,在行為學上面個人是有一定的習慣性的,比如說你喜歡寫字的時候帶個勾兒,那麼很多字你都會帶這個勾兒。
相機對人臉解鎖,或者說銀行使用人臉密碼的時候,都是會先讓你拍一個正臉,然後轉一個側臉,眨眼……這些都是為了提取特徵,然後方便在計算機當中建立關於你的這個人的模型。
並不需要把你的每個部位都精細化。
只不過建立這一套演算法模型確實得先摸索一下,花費一定的時間。
字型識別,其實有的時候跟手寫輸入法的功能上有一點點接近,只不過輸入法是透過你的筆跡來找近似的字型,而現在博米要做的是建立一個龐大的資料庫,透過人工智慧來識別。
這個技術難度其實並不算什麼,現在劉光然這邊完全能做到,關鍵在於資料庫的建立需要花費一定的時間。
而且在這之後還要不斷的測試和校準,就跟之前做人工智慧識別圖片差不多。
“懂了。”曹陽開心地笑起來,“那麼我們就找找看,能不能跟一些學校合作,把這件事情推行下去吧。”
他掃了一圈,然後把目光看向劉光然,“這件事情就交給伱去做了,光然,之後有成果的話,你就跟李暢這邊進行對接。”
“哦,好的。”劉光然在心底發出一聲嘆息。
可不就是最後給我了嗎?
畢竟這玩意兒落到最後就是人工智慧。
今天這個會議開完,曹陽其實是非常欣慰的,這說明我們距離人工智慧時代又進了一步。
人工智慧可以說是第5次產業革命了。
第一次是蒸汽機。
第二次是電。
第三次是計算機。
第四次是5G。
現在5G還沒有出來,不過按照華為這一世的開發速度來看的話,應該快了吧,按照曹陽的估算,現在4G已經比前世提前了差不多有3年左右的樣子,那麼5G很有可能在未來5年以內就會被推出來。