卻突然發現他還沒微博號,好在申請挺方便,然後實名註冊。
成功後,看著話題的內容他一時間也不知道該說些什麼好,雖然滿懷感激,但這一刻思路卻卡殼了。
空有學霸的大腦此時竟然想不出應景的文字,苦惱。
此時電話突然亮起,跟著響了起來。
來自京城的號碼,寧為想了想,接了起來。
“喂,請問您是江大數學與統計學院的寧為同學嗎?”
“哦,我是,請問您是哪位?”
“哦,寧為大神您好,我姓潘,是新浪微博的工作人員,我們在後臺看到您剛剛申請了微博,請問需要我們幫您做一個官方的實名認證嗎?經過認證之後,就能在您的微博上顯示出您官方認證的身份,也能避免有人冒充您的身份混淆視聽。”
“麻煩嗎?”
“不麻煩的,最多耽誤五分鐘,我引導您提交一些資料就行。”
“那行吧。”
……
十分鐘後,寧為看著認證過後的微博,終於想好了措辭。
“我是寧為,剛看到整件事情,感謝大家的信任與支援。想說點什麼,又不知道說什麼好!那就給大家拜個早年吧!祝大家新的一年快樂能單調遞增,煩惱是高階無窮,好運連續且可導,理想一定洛必達!”
沒去試圖解釋什麼。
因為寧為發現根本沒有必要,所有基於邏輯跟理性的判斷,大家已經都幫他說了,再去解釋自己沒說那些話,有些畫蛇添足了。
而且紀子珩那條最新宣告已經論述了事情的前因後果,他在說一遍也沒了什麼意義。
就這樣,挺好的!
做完這些,他便關了微博,長出了口氣,開始下載今天實驗室最新上傳的實驗資料,繼續做各種記錄跟比對,心情放鬆之下突然來了靈感,開始將所有異常資料歸類,然後按照今天靈感爆棚時想到的一種數學方法進行堆疊。
很快,寧為似乎從這些紛雜的資料中找到了規律。
終於他在無數紛雜的資料中找到了一個個異常值,再次歸類,寧為發現所有這些找出的異常資料在一定情況下,滿足正態分佈特點。
這次終於有眉目了。
對比資料的特點,寧為終於發現所有發生錯誤的資料同時指向演算法迴歸部分的一個問題。
湍流演算法在讀取異常資料流的時候需要經過多層判定,並對初篩出的疑似爬蟲或惡意連線訊號做出一個預標記,並匯入自己的資料庫,進行下階段的資料比對。
比如最淺層的對不合規瀏覽器頭,或者包含了爬蟲資訊的瀏覽器頭的判定,以及對某類ip一定時間內訪問次數的判定等……
而在數以億次的處理正常連線請求之後,記錄下當資料對流時產生的資料特徵,再跟資料庫內異常資料進行比對,嘗試放入,再比對,發出驗證碼,再比對,這一過程中,最後反饋給演算法的是資料流的異常特徵碼,對符合異常特徵碼的訊號進行標記,而不是標記具體的ip。
問題就出在這裡,在某次次遞迴過程中,極少數正常的請求在比對並自動記錄特徵碼的過程中,反饋時出了異常,這就導致同一類特性的資料全部被系統錯誤判定。
這個時候就體現出文件做得足夠細緻帶來的好處了。
找到了實驗室測試誤判率無法降低的原因所在,修改了思路,然後只需要查閱文件,很快便精準的找到了需要修改的部分。