發(fā)布時間:2020-02-08所屬分類:科技論文瀏覽:1次
摘 要: 摘要:文章通過利用高效快捷的光學(xué)字符識別技術(shù),設(shè)計并實(shí)現(xiàn)了一種機(jī)車視頻轉(zhuǎn)儲分析系統(tǒng)。為了提高轉(zhuǎn)儲分析效率,系統(tǒng)首先對列車運(yùn)行監(jiān)控裝置(LKJ)文件預(yù)分析并提取關(guān)鍵數(shù)據(jù),其次通過光學(xué)字符識別技術(shù)獲取視頻中附帶時間、司機(jī)、車次等信息,最終以時間為主
摘要:文章通過利用高效快捷的光學(xué)字符識別技術(shù),設(shè)計并實(shí)現(xiàn)了一種機(jī)車視頻轉(zhuǎn)儲分析系統(tǒng)。為了提高轉(zhuǎn)儲分析效率,系統(tǒng)首先對列車運(yùn)行監(jiān)控裝置(LKJ)文件預(yù)分析并提取關(guān)鍵數(shù)據(jù),其次通過光學(xué)字符識別技術(shù)獲取視頻中附帶時間、司機(jī)、車次等信息,最終以時間為主軸建立列車運(yùn)行監(jiān)控裝置文件和視頻文件之間的信息關(guān)聯(lián)。同時集成視頻轉(zhuǎn)碼功能以增強(qiáng)系統(tǒng)兼容性。實(shí)驗(yàn)結(jié)果表明:系統(tǒng)有效提高分析效率。
關(guān)鍵詞:學(xué)字符識別技術(shù);視頻轉(zhuǎn)儲分析;列車運(yùn)行監(jiān)控裝置
1概述隨著經(jīng)濟(jì)的發(fā)展,近年火車不斷的提速,不僅提高了鐵路的運(yùn)作效率,也縮短來來去去忙碌的人們在旅途上花費(fèi)的時間,提高工作效率。然而,在我們的生活節(jié)奏不斷提高的同時,隨之帶來的安全問題和責(zé)任,也日漸加重。雖然目前國內(nèi)的鐵軌交通中,實(shí)施了很嚴(yán)密的視頻監(jiān)控系統(tǒng)[1-2],通過架設(shè)大量各種各樣的攝像機(jī)來監(jiān)控各個場合,配合其他的安全措施,以避免意外事件的發(fā)生。但是現(xiàn)有的、傳統(tǒng)的監(jiān)控系統(tǒng)也面臨著很大的挑戰(zhàn)。大量的視頻源和LKJ[3,4]文件通過人工監(jiān)管的方式,進(jìn)行監(jiān)督和分析。在如此多的數(shù)據(jù)流當(dāng)中,人的監(jiān)管工作就顯得繁重而低效。視頻分析技術(shù)[5]作為智能視頻監(jiān)控系統(tǒng)的核心技術(shù),正越來越廣泛地應(yīng)用于中國鐵路通信系統(tǒng)之中,為鐵路安全的監(jiān)控提供了一種先進(jìn)可靠的技術(shù)手段。
當(dāng)前國內(nèi)很多機(jī)務(wù)段車載視頻圖像的轉(zhuǎn)儲分析工作,是每天機(jī)車入段后,由技術(shù)人員取下視頻文件存儲硬盤,并做好相應(yīng)標(biāo)記(如車次、運(yùn)行時間等),拿到數(shù)據(jù)管理中心進(jìn)行人工挑檢分析并存儲,并將部分?jǐn)?shù)據(jù)采用刻錄光盤方式保持。這種數(shù)據(jù)存儲方式,所需的硬盤和光盤數(shù)量巨大,管理難度較高并且數(shù)據(jù)分析耗時長,投入較多的人力物力且效率低下。
針對上述問題,文中設(shè)計并實(shí)現(xiàn)了一種基于光學(xué)字符識別技術(shù)(OCR)[6]的機(jī)車視頻轉(zhuǎn)儲分析系統(tǒng)。其主要特點(diǎn)是實(shí)現(xiàn)LKJ與視頻的同步分析展示。為了提高系統(tǒng)的智能化水平,系統(tǒng)中先對列車運(yùn)行監(jiān)控裝置文件預(yù)分析并提取關(guān)鍵數(shù)據(jù),通過光學(xué)字符識別技術(shù)獲取視頻中附帶時間、司機(jī)、車次等信息,以時間為主軸建立列車運(yùn)行監(jiān)控裝置文件和視頻文件之間的信息關(guān)聯(lián),并集成轉(zhuǎn)碼功能以增強(qiáng)系統(tǒng)兼容性。
2OCR簡介
OCR(OpticalCharacterRecognition)是指電子設(shè)備檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機(jī)文字的過程;即,針對印刷體字符,采用光學(xué)的方式將紙質(zhì)文檔中的文字轉(zhuǎn)換成為黑白點(diǎn)陣的圖像文件,并通過識別軟件將圖像中的文字轉(zhuǎn)換成文本格式,供文字處理軟件進(jìn)一步編輯加工的技術(shù)。OCR識別率主要取決于:掃描分辨率,不求最“高”,只求最“佳”。根據(jù)經(jīng)驗(yàn),五號印刷體采用250~300dpi比較合適;字號比較大(四號以上),需要使用用150~200dpi;對比度:為了達(dá)到最佳的識別效果,對輸入稿件在掃描時的要求是清晰,使掃描文件黑白分明,有利于軟件的識別;偏斜程度:現(xiàn)在的OCR大都采用字模識別的方式,因此圖像如果有一定程度的傾斜,就會嚴(yán)重影響識別效果,一方面需要盡量擺正掃描文件;另一方面還需要使用軟件進(jìn)行偏斜校正;圖片模式:一般對彩色模式識別很差,黑白模式的圖片識別較好;字體:印刷體識別率高,手寫體識別率很低,需要人工校正。如何除錯或利用輔助信息提高識別正確率,是OCR最重要的課題,ICR(IntelligentCharacterRecognition)的名詞也因此而產(chǎn)生。衡量一個OCR系統(tǒng)性能好壞的主要指標(biāo)有:拒識率、誤識率、識別速度、用戶界面的友好性,產(chǎn)品的穩(wěn)定性,易用性及可行性等。
3系統(tǒng)介紹
系統(tǒng)分為四個功能模塊、兩個存儲庫。分別是:LKJ預(yù)分析模塊、視頻轉(zhuǎn)儲及分析模塊、關(guān)聯(lián)模塊,和業(yè)務(wù)模塊。存儲庫分為基礎(chǔ)存儲庫和視頻存儲庫,基礎(chǔ)存儲庫存放LKJ分析結(jié)果數(shù)據(jù)、用戶登錄數(shù)據(jù)和LKJ與視頻關(guān)聯(lián)關(guān)系數(shù)據(jù)等,基礎(chǔ)存儲庫存儲數(shù)據(jù)量較大,讀寫操作相對頻繁,對其性能要求較高。視頻存儲庫主要按一定的規(guī)則存儲視頻文件。
3.1LKJ預(yù)分析模塊
機(jī)車LKJ文件實(shí)時記錄機(jī)車位置、速度、管壓、工況、缸壓等機(jī)車實(shí)時狀態(tài)數(shù)據(jù),類似于飛機(jī)的黑匣子,以二進(jìn)制形式存儲于IC卡或其它可移動介質(zhì)中,是判斷機(jī)車是否正常運(yùn)行和故障排除的重要依據(jù),分析機(jī)車LKJ文件是視頻分析室首要工作。由于機(jī)車運(yùn)行過程中產(chǎn)生的LKJ數(shù)量較多且文件較大,普通分析系統(tǒng)[7]對LKJ處理效率較低,且比較繁瑣。
一般情況下,LKJ分析工作主要有三部分組成:LKJ下載、LKJ分析和LKJ分析結(jié)果曲線圖展示。LKJ分析耗時主要集中在LKJ下載和分析。傳統(tǒng)串行分析方式分析效率過于低下。
設(shè)計中采用多任務(wù)預(yù)分析機(jī)制對LKJ文件讀取分析,如圖1所示,每個下載任務(wù)中均集成預(yù)分析機(jī)制,相比于傳統(tǒng)的下載后分析機(jī)制,設(shè)計中采用多任務(wù)并發(fā)、邊下載邊分析的機(jī)制,實(shí)際實(shí)現(xiàn)中根據(jù)LKJ文件的個數(shù),確定對應(yīng)的任務(wù)數(shù),分析后得到的關(guān)鍵節(jié)點(diǎn),比如機(jī)車啟動時間、超速時間和位置等存入基礎(chǔ)粗出庫待后續(xù)處理,同時實(shí)時顯示各任務(wù)分析進(jìn)度。機(jī)車LKJ分析軟件[8]一般以動態(tài)曲線圖的方式展現(xiàn)給用戶,相比于解析原二進(jìn)制LKJ文件,加入預(yù)分析機(jī)制的LKJ曲線圖更加流暢平滑,用戶交互操作更加方便快捷。多線程機(jī)制能大幅提升系統(tǒng)分析效率。多線程無需跨進(jìn)程邊界,程序邏輯和控制方式簡單,所有線程可以直接共享內(nèi)存和變量等,線程方式消耗的總資源比進(jìn)程方式好。但是,如果工作機(jī)制出現(xiàn)混亂或者線程工作狀態(tài)出現(xiàn)異常會引起災(zāi)難性后果。LKJ文件以多個二進(jìn)制文件的形式存儲于介質(zhì)中。當(dāng)多個線程同時讀取一個LKJ文件時,諸線程應(yīng)能實(shí)時獲得其它線程的讀取進(jìn)度和位置,當(dāng)前線程使用“事件”實(shí)時通知其它線程自己工作進(jìn)度。同時,LKJ曲線繪制線程需在分析線程分析完一定的LKJ數(shù)據(jù)之后才能啟動繪制,兩者為“生產(chǎn)者消費(fèi)者”關(guān)系,系統(tǒng)中使用“信號量”結(jié)合“事件”,控制兩類線程間的同步和LKJ曲線繪制線程的數(shù)量。
3.2視頻轉(zhuǎn)儲及分析模塊
機(jī)車中視頻一般存儲于機(jī)車車載NVR中,機(jī)車運(yùn)行結(jié)束由相關(guān)負(fù)責(zé)人取下硬盤,通過相關(guān)軟件轉(zhuǎn)儲到指定存儲服務(wù)器,由于同一機(jī)務(wù)段不同的機(jī)車所使用的軟硬件廠家不同且各個廠家之間互不兼容,所以,諸多機(jī)務(wù)段都存在多個軟硬件同時存在的情況,這勢必造成大量人員和時間的投入,造成浪費(fèi),且工作效率低下。為了解決這個問題,設(shè)計中為各個廠家視頻監(jiān)控設(shè)備提供統(tǒng)一轉(zhuǎn)碼服務(wù),加入轉(zhuǎn)碼功能的分析平臺,能擯棄各視頻廠家差異,對于用戶透明。從而減少人力物力的投入。
期刊推薦:《甘肅科技》是甘肅省科技廳主管、甘肅省科技情報研究所主辦的面向國內(nèi)外公開發(fā)行的綜合性指導(dǎo)類科技期刊。設(shè)有決策參考、技術(shù)創(chuàng)新、信息技術(shù)、情報工作、研究與探討、建設(shè)科技、醫(yī)學(xué)研究、農(nóng)林園地等欄目。
如圖2所示。首先,對所有接入系統(tǒng)中的機(jī)車視頻存儲設(shè)備,若其編碼方式非H264編碼,視頻轉(zhuǎn)碼模塊會為其解碼再編碼,使其為標(biāo)準(zhǔn)H264碼流,在解碼過程中通過OCR獲取一幀視頻流中附帶信息,如時間,車次,司機(jī)編號等,處理后的視頻文件存入視頻存儲庫,從視頻中提取的信息存入基礎(chǔ)存儲庫,等待與LKJ文件的關(guān)聯(lián)。如圖2所示。
系統(tǒng)中轉(zhuǎn)碼服務(wù)使用FFMPEG做基礎(chǔ)支持。轉(zhuǎn)碼服務(wù)主要分為:數(shù)據(jù)接口模塊、存儲管理模塊、轉(zhuǎn)碼算法模塊、數(shù)據(jù)處理模塊、控制管理模塊等。開源FFMPEG作為一款成熟的視頻處理工具,隨著視頻分析技術(shù)的發(fā)展,其用途越加廣泛。
3.3關(guān)聯(lián)模塊
機(jī)車事故分析定位或運(yùn)行狀態(tài)查看,現(xiàn)階段主要手段是LKJ與視頻相結(jié)合的方式[9,10]。現(xiàn)存系統(tǒng)主要問題是由LKJ信息定位視頻信息或者由視頻信息定位LKJ信息較麻煩,需由軟件操作者經(jīng)過多次計算、拖放去完成。定位效率低下。
為了解決上述問題,研發(fā)信息匹配服務(wù)(如圖3所示),信息匹配服務(wù)以時間和車次為依據(jù),自動關(guān)聯(lián)LKJ預(yù)分析結(jié)果和視頻中提取的信息,建立關(guān)聯(lián)后的記錄更新到基礎(chǔ)存儲庫,更新后的記錄支持的業(yè)務(wù)功能有:UI同步播放展示、由LKJ信息到視頻信息的定位或者由視頻信息到LKJ信息的定位。有效提高視頻分析或事件定位效率。
由于LKJ預(yù)分析結(jié)果與視頻中提取的信息信息量較大,頻繁的讀寫會影響視頻搜索效率。系統(tǒng)中只保留關(guān)鍵節(jié)點(diǎn)處的信息,比如行車過程中信號燈改變、機(jī)車進(jìn)出站,速度有明顯變化等狀況下的信息。為了更進(jìn)一步優(yōu)化存儲效率,在基礎(chǔ)存儲庫中以時間、司機(jī)編號、車次等為索引列建立多列索引。多列建索引比對每個列分別建索引更有優(yōu)勢,因?yàn)樗饕⒌迷蕉嗑驮秸即疟P空間,在更新數(shù)據(jù)的時候速度會更慢。
3.4系統(tǒng)業(yè)務(wù)
系統(tǒng)設(shè)計的總體業(yè)務(wù)架構(gòu)如圖4所示,總體分為輸入輸出兩部分,存儲庫左側(cè)為輸入部分,存儲庫右側(cè)為輸出部分。
輸入部分主要完成LKJ預(yù)分析,以及LKJ預(yù)分析結(jié)果與視頻關(guān)聯(lián)。輸出部分則為最上層與用戶交互的部分。分為多路視頻播放及控制、錄像轉(zhuǎn)儲、分析結(jié)果查看、關(guān)聯(lián)點(diǎn)播和異常報警。多路播放及控制用于事故原因查找或驗(yàn)證,錄像轉(zhuǎn)儲是為保存事故證據(jù)而研發(fā)的類似于“證據(jù)上傳”的功能。關(guān)聯(lián)點(diǎn)播功能即同步展示LKJ曲線圖與視頻文件,異常報警:當(dāng)LKJ中發(fā)現(xiàn)有異常信息時,即時向用戶提示異常,由用戶進(jìn)行下一步處理。
4系統(tǒng)實(shí)現(xiàn)
為驗(yàn)證方案可行行及性能,采用CS架構(gòu)搭建系統(tǒng)架構(gòu),開發(fā)語言為C#和C++,OCR算法由公司團(tuán)隊(duì)與中國科學(xué)院某研究所聯(lián)合研發(fā),數(shù)據(jù)庫和視頻存儲庫采用Oracle+FTP,客戶端與服務(wù)端之間使用WCF通信。由于機(jī)車數(shù)據(jù)為保密數(shù)據(jù),牽涉到公共安全,為保證數(shù)據(jù)傳輸安全性,所有需傳輸?shù)臄?shù)據(jù)由數(shù)據(jù)發(fā)送端使用MD5數(shù)據(jù)加密算法進(jìn)行加密,數(shù)據(jù)接收方接到數(shù)據(jù)后按加密方反操作進(jìn)行解密。系統(tǒng)部分界面如圖5所示。
為排除因?qū)嶒?yàn)條件對實(shí)驗(yàn)結(jié)果造成的影響,取同一班列車的LKJ文件和視頻文件分別在博飛轉(zhuǎn)儲分析系統(tǒng)V1.0和捷信安通兩款分析平臺做比較,列車運(yùn)行時長約2.5h,各軟件參數(shù)對比見表1。
表2中“平均耗時統(tǒng)計”是對本次機(jī)車多次運(yùn)行記錄多次分析后的平均耗時統(tǒng)計,從實(shí)際實(shí)驗(yàn)結(jié)果可以看出,新設(shè)計分析系統(tǒng)在分析耗時方便有了很大的改善,與“博飛V1.0”相比,系統(tǒng)中加入了LKJ預(yù)分析機(jī)制和LKJ與視頻同步定位功能,所以分析效率有很大的提高,而捷信安通由于本身不支持多窗口播放,所以分析耗時最長。由于新平臺增加了視頻轉(zhuǎn)碼功能,減少多軟件來回操作的麻煩,兼容性較好,獲得用戶好評。
5總結(jié)與展望
文中設(shè)計并實(shí)現(xiàn)了一種機(jī)車視頻轉(zhuǎn)儲分析系統(tǒng)。通過LKJ預(yù)分析機(jī)制和LKJ與視頻的關(guān)聯(lián)分析提高了視頻分析[11,12]效率,并在軟硬件兼容性有了很大的提高,但也存在不足,比如LKJ與視頻的分析需機(jī)車完成運(yùn)行后才能進(jìn)行分析,為事后定位方式。下一步研究方向?yàn)椋横槍Ξ?dāng)前鐵路行業(yè)應(yīng)用需求,開發(fā)離線及在線視頻智能分析系統(tǒng)[13,14]。一方面,在線智能分析系統(tǒng)針對在途機(jī)車在運(yùn)行過程中,對司機(jī)的值乘行為、標(biāo)準(zhǔn)操作動作、呼叫應(yīng)答等進(jìn)行智能音視頻在線分析,同時結(jié)合前方路況實(shí)時視頻圖像、機(jī)車運(yùn)行實(shí)時數(shù)據(jù)綜合判斷司機(jī)行為是否違規(guī),并對違規(guī)行為進(jìn)行在線提醒,降低行車安全事故發(fā)生幾率,同時有利于地面人員實(shí)施監(jiān)控管理機(jī)車乘務(wù)人員。另一方面,離線智能分析系統(tǒng)用于滿足當(dāng)前大量離線視頻文件的快速、準(zhǔn)確分析,解決傳統(tǒng)視頻分析完全依靠人工操作模式。