第268章 最終版本

所謂集成學習,就是訓練多個機器學習模型,然後組合在一起,讓它們協調工作。

俗話說,人多力量大,機器學習算法也是一樣。

江寒經過一番認真的設計,確定了一個新的網絡拓撲結構。

他從排名4~15的模型裡,精心選擇了7種,再加上“唯一優勝者”、“黑馬中等生”、“書呆子”,一共10個神經網絡。

將它們放在一起,簡單地並聯起來,組成了一個整體,然後設計了一個投票程序。

一張手寫數字的圖片輸入網絡後,會同時傳遞給10個神經網絡模型,讓它們各自進行計算,輸出自己的預測結果。

如果大家的判斷完全一致,那自然沒什麼問題。

但如果大家意見相左,就會啓動投票程序,根據票數來決定最終的輸出。

票數並不是平均分配的,在驗證集上表現更好的模型,手裡的選票也應該更多。

所以,理所當然的,“唯一優勝者”擁有最多的票數。

如果他全票投給自己,那麼一般來說,他的意見就基本上接近正解,理應得到採納。

這種情況下,其他模型就算有不同意見,而且全都統一口徑,也不應該推翻優勝者的判斷。

這就好比領導班子開會,不能光講民主,還得適當集中……

但很多時候,優勝者對自己的判斷,也並不是十分有把握,這個時候,其他“學生”給出的答案,就很有參考意義了。

如果其他人中,有人認爲答案是另一個,並得到了多數人的支持,那麼就會對優勝者的答案進行“彈劾”。

如果優勝者投給自己的票數,並不足以駁回大家的“彈劾”,那麼就會少數服從多數,將最後輸出修改爲受到更多人認同的。

舉例來說,剛纔的那個數字5。

優勝者判斷有60%的概率是6,37%的概率是5,2%的可能性是其他數字,這個時候,它就會輸出錯誤的答案:6。

但如果在其他“學生”中,有人經過計算,認爲答案應該是5,與優勝者判斷不一致,就會啓動投票程序。

由於優勝者判斷只有60%的概率是數字6,折算後,等於它只肯爲自己的答案投6票。

這個時候,只要其他9個模型的票數,加一起超過6票,即可彈劾成功。

如果優勝者對自己的判斷,有90%以上的把握,那麼其他9個人加起來,也不足以推翻他的結論。

意思就是這麼個意思,具體的折算比例,當然不會這麼簡單。

還需要十分細緻、耐心地進行調整,以使整個模型的輸出,更加接近最優解。

當然,這種投票式的做法,無疑也有極小極小的可能性,產生不那麼美好的結果。

比如,優勝者本來的判斷明明是正確的,只是對自己信心不夠充足,也有可能被其他模型給“糾正”成錯誤的。

但這種情況發生的機率,遠遠小於優勝者誤判的機率。

所以,集成學習的總體性能,仍然領先於每一個單獨的神經網絡。

這種集成學習的思想,無疑是比較先進的,但實現起來難度也相當大。

尤其是那個投票程序,相當耗費腦細胞。

江寒全力開動腦力,也足足用了四個多小時,纔將集成學習網絡打造成功。

時間主要浪費在編寫投票程序,以及調整折算比例上了。

至於10個子模塊,已經全部訓練完畢,得到了權重數據,就無需再耗費時間,重新進行訓練了。

也幸虧如此,否則就沒辦法及時把最終程序,提交到KAGGLE 官網上去了。

隨後,江寒在最終版本的集成網絡上,重新跑了一遍驗證集。

結果十分喜人,識別準確率達到了驚人的99.62%。

這個成績已經十分令人滿意。

接下來,江寒就按照官網發佈的說明,對自己的代碼進行了一點處理。

主要是去掉一些調試語句,再將數據文件的接口,改成主辦方要求的方式。

這樣,官方在測試時,只需將測試用的數據文件,放入指定的文件夾裡,而無需修改任何代碼。

也許是對業餘愛好者們的表現,並沒有特別大的期待?

反正在這次比賽中,官方並沒有要求公開源代碼。

所以江寒也就沒準備提供源代碼。

他將自己的程序,用pyinstall編譯成了可執行文件。

並使用了一點小技巧,將訓練好的10個子網絡的權重數據,也一起打包進了exe文件裡。

最後,再用“初級數字混淆技術”加一道堅固的鎖,這樣就不怕被人逆向拆解了。

當然,江寒的這個集成學習方案,如果在比賽中一鳴驚人,等到比賽結束之後,說不定就會有大佬來聯繫他,詢問設計思路之類的。

到時候,是否公開代碼,用什麼方式公開,公開到什麼程度,江寒完全可以看情況決定。

也就是說,主動權完全掌握在自己手裡。

晚上10多鍾,搶在時間截止之前,江寒將加密後的EXE文件,連同相關的說明文檔,一起上傳到了KAGGLE官方的比賽服務器上。

好在今天晚上網絡還算給力,沒出什麼幺蛾子,否則……

萬一來個“非戰之罪”,可就讓人慾哭無淚了。

這件事到這裡就暫告一段落,接下來,只需要安靜地等着成績發佈。

第二天,江寒將夏雨菲送到學校後,自己也跟着下了車。

和老師和同學們闊別了差不多一個月,江寒終於決定回去上課了。

雖然可以拜託夏如虹再開一張診斷書,多續幾天假,但他仔細考慮了一下之後,並沒有那麼做。

所有想要做的事情,都解決得差不多了,想寫的論文也基本上寫完了,沒必要總是宅在家裡。

江寒走進班級時,不少同學看到他,都感到很新奇,跑過來問東問西。

江寒看人下菜碟,時而正經,時而皮幾句,總之應對自如。

李東、雷蕾等更加熟悉的人,反而沒有第一時間圍過來。

很簡單,這一段時間裡,大家時不時通個電話,該交流的早就交流過了。

江寒回到座位後,拿出了隨身攜帶的《網絡安全機密與解決方案》,埋頭看了起來。

這本書被譽爲“黑客聖經”,內容也的確很不錯,但如果說只要學透了,就能成爲十分強大的黑客,那無疑是有點想多了。

理論上來說,並沒有任何一本書,能讓人看完就成爲優秀的黑客。

那些手段高明的黑客,往往都要掌握許多計算機軟硬件知識,以及操作系統細節,誰瞭解得更多,理解得更深刻,誰的功力就更深一些。

黑客技術領域,能力的高低,往往體現在基本功上。

硬要說有什麼秘籍的話,一些未公開的漏洞,以及個人發明的獨特算法,勉強可以算得上吧。

但有法固有破,再神奇的技巧,只要當着其他高手的面兒,用上那麼一次兩次,基本上很快就會被破掉。

這個世界上,在加密技術領域,無法破解的技術並非沒有,但絕對屈指可數。

要說其中最近最火的一個,那無疑非“壞蘋果”莫屬……

第一節下課,江寒上了趟洗手間。

回來之後,他就按照課表,拿出了語文書。

其實也未必有時間看,但不管怎麼說,至少裝裝樣子吧。

上課鈴響後,一個最多也就24、5歲,氣質相當優雅的女生,夾着教材、教案走了進來。

江寒一看不是易中海,就問李東:“她誰啊?”

“實習老師,姓郭,合師大中文系的。”

李東說着嘿嘿一笑,問:“好看吧?”

江寒:“……”

長得倒也不能說醜,但在他看來,只能算湊合。

長相能有7分,身材勉強5分,優點是夠瘦,缺點是實在太瘦……

“實習老師……”江寒沉吟了一下,“所以,有了小助手,易老師就偷懶不來上課了?”

李東搖了搖頭:“郭老師是前天才來的,易老師已經有半個月沒上班了。”

“半個月?”江寒皺了皺眉。

自己一直沒來上學,居然都不知道這件事。

第101章 偷換概念第421章 身世大白第101章 偷換概念第263章 一切都在算計中第181章 無監督學習和SOM第166章 意外的變化第188章 金風玉露一相逢第372章 卷積神經網絡第136章 打造算術邏輯單元第363章 終於對《我的世界》下手了……第262章 貴有貴的道理第222章 《Adaline網絡》和《最小均方濾波器(LMS)》第269章 易中海的困境第291章 驚動了各路神仙第399章 此一時,彼一時第247章 對拍、Day1第三題第213章 橫生枝節第231章 水漫金山第204章 是男人就餵飽她第331章 揹着媽媽偷吃第160章 只能看到文章本身第315章 故伎重施第89章 進入狀態這麼快?第62章 校長的鼓勵第112章 圖紙和垃圾桶第174章 良心工作室第274章 申請PCT國際專利第129章 兩道試題第124章 招兵買馬第332章 大功告成,樂不思蜀第375章 沒有操作系統怎麼辦?第266章 篩選模型,以及最後的優勝者第162章 奇怪的U盤第293章 精誠所致,金石爲開?第2章 基本操作第123章 BT小鳥第234章 恐高症第215章 儀表堂堂,器宇軒昂第222章 《Adaline網絡》和《最小均方濾波器(LMS)》第320章 法無禁止即可爲第60章 費曼學習法第181章 無監督學習和SOM第389章 誠信友善,和諧友愛第256章 擴展歐幾里得算法,以及增強線段樹第209章 校服就是最正式的裝扮第11章 像我這麼專一第420章 強化學習的威力第316章 順藤摸瓜第263章 一切都在算計中第82章 渣男反編譯第288章 合理避稅第369章 點八個,贈十個……第423章 超算和MPP架構第71章 憑什麼是江寒?第236章 意志堅強,沒有毛病第311章 系統安全特聘測試員第45章 火了第378章 用詞精準第29章 王璐有點自閉第251章 特效藥第239章 沒有對比就沒有傷害第33章 蘋果開發者賬號第238章 競爭對手?第312章 阱中有坑,坑裡有釘第372章 卷積神經網絡第359章 大佬,怪蜀黍?第32章 借MacBook一用第182章 罪證都沒銷燬乾淨第188章 金風玉露一相逢第81章 不是好人第52章 “感知機”的初次實戰第43章 寫字機器人第429章 阿法狗的三板斧第397章 作曲大師,自帶乾糧第4章 萬界爬蟲系統第417章 江寒的圍棋水平第71章 憑什麼是江寒?第18章 就是普通同學第211章 就當幫他們改進一下服務質量了第325章 說好的理想男神呢?第196章 背黑鍋我來第17章 男朋友挺好第6章 三個系統倒有四種資源?第317章 爲什麼偏偏是那串數字?第264章 不知人間疾苦第57章 非常巨大第253章 不幸猜中了第418章 阿法狗不出,誰與爭鋒?第420章 強化學習的威力第40章 好朋友來了第39章 這可能是個誤會第342章 蛇皮走位,初現鋒芒第28章 老宋的算盤第49章 高老師的難題第31章 《水果忍者》和《2048》第377章 打造自己的科技品牌第100章 談判第76章 還有什麼是他不會的?第63章 巧嗎?第278章 Root Me,Hack Me
第101章 偷換概念第421章 身世大白第101章 偷換概念第263章 一切都在算計中第181章 無監督學習和SOM第166章 意外的變化第188章 金風玉露一相逢第372章 卷積神經網絡第136章 打造算術邏輯單元第363章 終於對《我的世界》下手了……第262章 貴有貴的道理第222章 《Adaline網絡》和《最小均方濾波器(LMS)》第269章 易中海的困境第291章 驚動了各路神仙第399章 此一時,彼一時第247章 對拍、Day1第三題第213章 橫生枝節第231章 水漫金山第204章 是男人就餵飽她第331章 揹着媽媽偷吃第160章 只能看到文章本身第315章 故伎重施第89章 進入狀態這麼快?第62章 校長的鼓勵第112章 圖紙和垃圾桶第174章 良心工作室第274章 申請PCT國際專利第129章 兩道試題第124章 招兵買馬第332章 大功告成,樂不思蜀第375章 沒有操作系統怎麼辦?第266章 篩選模型,以及最後的優勝者第162章 奇怪的U盤第293章 精誠所致,金石爲開?第2章 基本操作第123章 BT小鳥第234章 恐高症第215章 儀表堂堂,器宇軒昂第222章 《Adaline網絡》和《最小均方濾波器(LMS)》第320章 法無禁止即可爲第60章 費曼學習法第181章 無監督學習和SOM第389章 誠信友善,和諧友愛第256章 擴展歐幾里得算法,以及增強線段樹第209章 校服就是最正式的裝扮第11章 像我這麼專一第420章 強化學習的威力第316章 順藤摸瓜第263章 一切都在算計中第82章 渣男反編譯第288章 合理避稅第369章 點八個,贈十個……第423章 超算和MPP架構第71章 憑什麼是江寒?第236章 意志堅強,沒有毛病第311章 系統安全特聘測試員第45章 火了第378章 用詞精準第29章 王璐有點自閉第251章 特效藥第239章 沒有對比就沒有傷害第33章 蘋果開發者賬號第238章 競爭對手?第312章 阱中有坑,坑裡有釘第372章 卷積神經網絡第359章 大佬,怪蜀黍?第32章 借MacBook一用第182章 罪證都沒銷燬乾淨第188章 金風玉露一相逢第81章 不是好人第52章 “感知機”的初次實戰第43章 寫字機器人第429章 阿法狗的三板斧第397章 作曲大師,自帶乾糧第4章 萬界爬蟲系統第417章 江寒的圍棋水平第71章 憑什麼是江寒?第18章 就是普通同學第211章 就當幫他們改進一下服務質量了第325章 說好的理想男神呢?第196章 背黑鍋我來第17章 男朋友挺好第6章 三個系統倒有四種資源?第317章 爲什麼偏偏是那串數字?第264章 不知人間疾苦第57章 非常巨大第253章 不幸猜中了第418章 阿法狗不出,誰與爭鋒?第420章 強化學習的威力第40章 好朋友來了第39章 這可能是個誤會第342章 蛇皮走位,初現鋒芒第28章 老宋的算盤第49章 高老師的難題第31章 《水果忍者》和《2048》第377章 打造自己的科技品牌第100章 談判第76章 還有什麼是他不會的?第63章 巧嗎?第278章 Root Me,Hack Me