第398章 商用級手寫識別算法

有圖科技是一家股份制公司,專業生產各種掃描儀。

該公司出品的“宏圖”系列光學掃描儀,在國內市場的佔有率,一向超過60%。

之所以賣得這麼好,跟他們自主研發的“宏圖OCR”軟件,關係不可謂不大。

軟件研發部中,一場工作會議正在進行。

“王工,咱們的新版OCR,還得多久能投入市場?”

說話的是藍戰新,他今年不過40歲左右,卻已在部長的位置上,穩坐了10餘年。

王仁見部長點到自己,連忙回答說:“最多一個星期。”

藍戰新點了點頭,看起來對這個答案比較滿意。

他想了想,又問:“和上一版相比,性能提升的幅度多大?”

“3%以上。”王仁回答。

“這麼高?”藍部長有些意外。

王仁露出自信地微笑:“對比較乾淨的中文版面,理想情況下,識別正確率可超過92.8%,達到了國際先進水準。”

藍戰新眼神一亮:“太好了!這樣一來,咱們的掃描儀產品,在國內的市場佔有率,一定能進一步擴大。”

王工“謙遜”地一笑,搖了搖頭:“不是我們厲害,是對手不夠能打。”

藍戰新笑了起來:“這話有點道理。有句話怎麼說來着,全靠同行襯托?”

其餘人也陪着他一起笑了起來。

沒錯,一直以來,市場上的其他中文OCR產品,識別正確率基本在85%到90%之間波動。

宏圖OCR已經是其中的佼佼者。

然而,他們萬萬料想不到,一個打破行業規則的強大OCR軟件,即將出世……

※※※

虛擬空間裡。

江寒花費了上百個小時,一共學完了三本書:《電動力學》、《量子力學I》、《熱力學和統計物理》。

他的身邊,也積攢了厚厚一摞空白圖紙。

當然,現在這些圖紙已經不空了,寫滿了各種算式和習題解答。

以江寒現在的學習速度,20~30小時一本書,一點壓力也沒有。

關鍵是,即使連續用腦上百小時,他仍然沒有感到一絲倦意。

換成剛得到系統的時候,高強度學習、工作4~5個小時,也就差不多到極限了。

而自從學力等級提升到“學者9星”之後,他就沒發現自己精力不夠用過……

雖然消耗的冰島紅極參更多了,可是和帶來的好處相比,那點金錢上的支出,完全是微不足道的。

江寒非常好奇,不知道自己現在,到底能連續學習多長時間?

於是接下來,他就毫不停頓地繼續啃書、做習題。

又是上百個小時過去,《粒子物理與核物理導論》、《量子物理II》、《等離子體物理》也全學完了。

而他身邊的空白圖紙,也從10CM左右的高度,增長到了18CM以上。

江寒終於有了一絲倦意,但感覺還能撐住,於是毫不停留地繼續學習。

《固體物理》、《高等光學》、《生物物理》、《流體力學》……

一個個txt文件學完,然後連同配套的小圖片集,一起挪到了“已學”文件夾中。

不知過了多久。

江寒學完了最後一個txt文件後,愕然發現,“物理學”文件夾已經空了。

這意味着,他一晚之間,學完了大學物理學專業,本科階段的大半專業課。

當然,只是理論方面,至於實驗,還一個也沒有做……

直到這時,江寒才感覺到了深深地疲倦,連忙退出了虛擬空間。

看了眼學科經驗值面板。

物理學的進度條,只差不到1/5,就能升到高級了。

江寒忍不住咧嘴一笑。

這還不到三個小時,自己就搞定了十來本物理專業本科教材。

沒啥意外的話,再有個把星期,物理、化學、生物三科,都能達到高級水準。

這種學習效率……

“嗯……搞不好,這纔是虛擬空間的正確打開方式?”

江寒在心裡嘟囔了一句,隨後就昏睡了過去。

第二天醒來,他仍感覺精神不夠飽滿,注意力有點無法集中。

於是思考了一下後,起身、穿衣、下樓。

廚房裡,夏如虹正忙着做早餐。

江寒笑着問候了一聲“早安”,隨後說:“阿姨,給我多加幾個紅極參吧。”

“沒問題!”

夏如虹笑呵呵地答應了,一副心情不錯的樣子。

шшш⊙ тт kǎn⊙ C〇

吃完飯,夏如虹出門上班,夏雨菲繼續作曲。

江寒出門溜達了一圈,散心爲主,順便思考一下接下來的計劃。

半小時後,他回到了別墅中,就打開筆記本電腦,開始開發新軟件。

中文OCR都已經弄出來了,不妨稍微改進一下,再做一款性能過得去的“商用型中文手寫識別”。

這個世界上以前並沒有神經網絡,但這並不意味着,就沒有手寫識別和語音識別了。

條條大路通羅馬。

在機器學習領域,實現同樣的功能,有許多方案可以選擇。

只是這些替代方案,要麼正確率不夠高,要麼需要強大的算力支持……

目前爲止,在商業領域還沒有足夠高明的手寫識別算法。

而這,正是江寒的機會。

老實講,再過半個月,等他那兩篇關於CNN的論文傳播開來……

人工神經網絡在圖像識別領域的性能優勢,一定會被有識之士注意到。

到時候,幾乎可以肯定,會掀起一場技術更新的盛宴。

不出意外的話,各種各樣使用了CNN的應用,會如雨後春筍般出現。

其中絕對少不了各種手寫識別軟件。

這樣一來,要想在中文手寫識別項目上賺到錢,就必須抓緊時間了……

用於中文手寫識別的CNN網絡,和OCR神經網絡相比,在架構上極其相似。

江寒很快就把核心代碼弄了出來,只在一些細節上,進行了微不足道的調整。

然而,最大的問題是缺少訓練數據。

中文手寫識別的素材庫,基本上都攥在各大手機廠商,以及一些軟件公司、研究所手裡。

免費使用是根本不可能的,就算肯花錢,只怕那些廠商和行業大佬,也不會很容易鬆口。

江寒想了想,決定聯繫一下自己未來的導師。

張德昭人在科大,說不定能聯絡上訊飛公司。

手機裡常見的訊飛輸入法,就是訊飛公司研發的。

江寒手機裡就有訊飛輸入法,他重生之後,也試用過幾次。

可惜的是,這時候的訊飛輸入法,性能着實有點普通,語音輸入還算可以,手寫技術遠遠算不上成熟。

就算這樣,訊飛輸入法在國內外,已經算得上頂尖水準了。

事實上,在這個世界,大多數手寫識別輸入法,表現都很難讓人滿意。

不難猜想,很可能是缺少了人工神經網絡技術,才導致了這種情況發生……

手寫中文素材庫這種東西,別的地方不好找,訊飛公司一定有。

而且這個時候的訊飛,還不是一家股份制公司。

這樣更好,談起交易來更加方便……

江寒拿出手機,給張德昭撥打了過去。

老張接起電話:“喂?”

江寒:“張教授,我是江寒。”

張德昭笑了起來:“是不是想好了,打算提前來上預科?”

江寒微微一笑:“那倒不是,我這次找您,是有別的事情。”

張德昭脾氣很好:“只要不是你改主意不來了,那就有的商量。”

江寒呵呵一笑:“您老對我有點缺少信心了,說好的事情,哪那麼容易變卦?”

老張鬆了口氣:“那就好……什麼事?說吧。”

江寒將自己的需求描述了一遍。

“手寫漢字的素材?”

老張思考了一下,說:“據我所知,訊飛那邊的確有一個素材庫,規模好像還不小。”

頓了頓:“只是……”

江寒笑着問:“只是怎麼?”

老張嘆了口氣:“我跟他們的朱總也不是很熟,空口白話的,很難讓人家把那麼重要的東西分享出來。”

江寒微微一笑:“我可不是衝着佔便宜去的,該掏的錢還是會掏的……”

又說:“勞煩您從中撮合一下,不管是有償使用,還是合作開發,我都可以考慮。”

老張考慮了一會兒,一咬牙:“行,我就豁出這張老臉,去當一回說客!”

江寒連忙感謝,想了想,又補充說:“當然,如果他們的條件太苛刻,那就算了,我也不想白忙活……”

張德昭哈哈一笑:“這個你就儘管放心吧,我一定儘量把條件談得‘合理’一點。”

接下來,老張又詢問了一下江寒的學習情況,這纔是他最關心的事情。

江寒挑不那麼聳人聽聞的部分,簡單地彙報了一下。

比如說,“粗略”地翻完了大學本科階段,所有的信息學、數學,以及“少”部分物理學教材……

雖然江寒已經儘量輕描淡寫了,但聽在老張的耳朵裡,仍稍嫌浮誇了一點。

“多學點數學和物理也是好事,但切記貪多嚼不爛,一定要保證學多少、會多少,在學好信息學的基礎上,再兼顧其他科目……”

對於老張的殷殷叮囑,江寒連聲稱是。

不過,回頭該怎麼學,還得怎麼學。

自己的路,只能自己去走。

放下電話後,江寒繼續完善程序。

本以爲這事兒,即使老張親自出馬,一時半會兒的,只怕也談不下來。

誰料,還沒過兩個小時,老張的電話就打了過來。

第46章 月考開始第226章 還能剩下幾個?第33章 蘋果開發者賬號第55章 委託第30章 立人設第361章 有點像“年輕”時的自己第196章 背黑鍋我來第59章 上乾貨第421章 身世大白第68章 舉報了、舉報了第204章 是男人就餵飽她第110章 敲竹槓第69章 論如何追女孩紙第201章 組內學習競賽第68章 舉報了、舉報了第267章 數據增廣和集成學習第236章 意志堅強,沒有毛病請假,存稿丟失一章,正在想辦法重寫第56章 花錢容易賺錢難第430章 超算落成,九段助陣第337章 拐着彎地誇自己?第80章 碰碰船和真人CS第296章 攪動風雲第136章 打造算術邏輯單元第113章 刷分的可能性第137章 聽鬆小院,好地方?第330章 小孔成像和PNP問題第252章 生吃海蔘,不蘸醬油第7章 所謂“取整”,就是……第64章 渣男第8章 裝〇也要講基本法第348章 只會下蛋,不會生寶寶第299章 膽大妄爲,實力恐怖第49章 高老師的難題第316章 順藤摸瓜第94章 水論文的正確姿勢第300章 沒有硝煙的戰鬥第194章 睡不着怎麼辦?第311章 系統安全特聘測試員第310章 唯一的破綻第91章 這麼忙嗎?第149章 夢後樓臺深鎖第114章 收音機,以及1:10?第280章 這就成了“學者”了?第19章 一切爲了押韻第228章 恐怖如斯第167章 提醒還是邀請?第111章 虛擬空間,開啓!第251章 特效藥第358章 27個學術點第310章 唯一的破綻第110章 敲竹槓第32章 借MacBook一用第345章 意外連連第156章 你高興的太早了第393章 男人不能沒有事業第113章 刷分的可能性第373章 肉體永生,還是機械飛昇?第112章 圖紙和垃圾桶第333章 不怕教壞了乖女兒?第108章 情趣第321章 星戰銀行,黑卡飛刀第168章 本能反應第239章 沒有對比就沒有傷害第75章 金少樓的警告第374章 手工打造LED顯示器第145章 陳萱的邀請第278章 Root Me,Hack Me第63章 巧嗎?第113章 刷分的可能性第330章 小孔成像和PNP問題第92章 《激光雕刻機》第253章 不幸猜中了第287章 夢裡不知身是客第265章 羨慕使人質壁分離第293章 精誠所致,金石爲開?第142章 哪捨得叫你疊被鋪牀?第257章 NOIP中最難的題型第238章 競爭對手?第6章 三個系統倒有四種資源?第41章 要是不帥不酷呢?第302章 聳人聽聞,觸目驚心第264章 不知人間疾苦第284章 江寒的操作第155章 到底什麼關係?第184章 眼神這麼好使的嗎?第69章 論如何追女孩紙第104章 鮮花與牛糞第293章 精誠所致,金石爲開?第280章 這就成了“學者”了?第282章 又一顆壞蘋果?第212章 他和夏總到底什麼關係?第241章 學習改變命運第93章 《泡沫》第391章 一切交給時間第32章 借MacBook一用第312章 阱中有坑,坑裡有釘第191章 好像只能擠一擠了第116章 要節制一點了第318章 飛機點餐攻略
第46章 月考開始第226章 還能剩下幾個?第33章 蘋果開發者賬號第55章 委託第30章 立人設第361章 有點像“年輕”時的自己第196章 背黑鍋我來第59章 上乾貨第421章 身世大白第68章 舉報了、舉報了第204章 是男人就餵飽她第110章 敲竹槓第69章 論如何追女孩紙第201章 組內學習競賽第68章 舉報了、舉報了第267章 數據增廣和集成學習第236章 意志堅強,沒有毛病請假,存稿丟失一章,正在想辦法重寫第56章 花錢容易賺錢難第430章 超算落成,九段助陣第337章 拐着彎地誇自己?第80章 碰碰船和真人CS第296章 攪動風雲第136章 打造算術邏輯單元第113章 刷分的可能性第137章 聽鬆小院,好地方?第330章 小孔成像和PNP問題第252章 生吃海蔘,不蘸醬油第7章 所謂“取整”,就是……第64章 渣男第8章 裝〇也要講基本法第348章 只會下蛋,不會生寶寶第299章 膽大妄爲,實力恐怖第49章 高老師的難題第316章 順藤摸瓜第94章 水論文的正確姿勢第300章 沒有硝煙的戰鬥第194章 睡不着怎麼辦?第311章 系統安全特聘測試員第310章 唯一的破綻第91章 這麼忙嗎?第149章 夢後樓臺深鎖第114章 收音機,以及1:10?第280章 這就成了“學者”了?第19章 一切爲了押韻第228章 恐怖如斯第167章 提醒還是邀請?第111章 虛擬空間,開啓!第251章 特效藥第358章 27個學術點第310章 唯一的破綻第110章 敲竹槓第32章 借MacBook一用第345章 意外連連第156章 你高興的太早了第393章 男人不能沒有事業第113章 刷分的可能性第373章 肉體永生,還是機械飛昇?第112章 圖紙和垃圾桶第333章 不怕教壞了乖女兒?第108章 情趣第321章 星戰銀行,黑卡飛刀第168章 本能反應第239章 沒有對比就沒有傷害第75章 金少樓的警告第374章 手工打造LED顯示器第145章 陳萱的邀請第278章 Root Me,Hack Me第63章 巧嗎?第113章 刷分的可能性第330章 小孔成像和PNP問題第92章 《激光雕刻機》第253章 不幸猜中了第287章 夢裡不知身是客第265章 羨慕使人質壁分離第293章 精誠所致,金石爲開?第142章 哪捨得叫你疊被鋪牀?第257章 NOIP中最難的題型第238章 競爭對手?第6章 三個系統倒有四種資源?第41章 要是不帥不酷呢?第302章 聳人聽聞,觸目驚心第264章 不知人間疾苦第284章 江寒的操作第155章 到底什麼關係?第184章 眼神這麼好使的嗎?第69章 論如何追女孩紙第104章 鮮花與牛糞第293章 精誠所致,金石爲開?第280章 這就成了“學者”了?第282章 又一顆壞蘋果?第212章 他和夏總到底什麼關係?第241章 學習改變命運第93章 《泡沫》第391章 一切交給時間第32章 借MacBook一用第312章 阱中有坑,坑裡有釘第191章 好像只能擠一擠了第116章 要節制一點了第318章 飛機點餐攻略