聯(lián)合作戰(zhàn)模式下的信息過(guò)濾方法
本文發(fā)表于《指揮信息系統(tǒng)與技術(shù)》2023年第2期
作者:馬雷鳴,張道偉
引用格式:馬雷鳴,張道偉. 聯(lián)合作戰(zhàn)模式下的信息過(guò)濾方法[J]. 指揮信息系統(tǒng)與技術(shù),2023,14(2):76-80.
【資料圖】
摘要
信息化作戰(zhàn)是當(dāng)前主要作戰(zhàn)方式之一,面向弱連接、高實(shí)時(shí)和資源受限的戰(zhàn)場(chǎng)邊緣網(wǎng)絡(luò)環(huán)境,以信息化技術(shù)為主導(dǎo)建立陸軍、海軍和空軍各兵種間可靠的和互連互通的協(xié)同作戰(zhàn)模式成為聯(lián)合作戰(zhàn)研究熱點(diǎn)。基于信息文本的虛詞特征,提出了一種聯(lián)合作戰(zhàn)模式下的信息過(guò)濾方法,通過(guò)模擬各軍兵種在云-邊-端協(xié)同模式下的信息過(guò)濾,既降低了作戰(zhàn)資源占用率又保障了作戰(zhàn)信息文本的高實(shí)時(shí)與唯一性。
0引言
聯(lián)合作戰(zhàn)指在現(xiàn)代戰(zhàn)場(chǎng)信息互連互通環(huán)境下的陸軍、海軍和空軍等軍兵種之間協(xié)同作戰(zhàn)的模式。針對(duì)戰(zhàn)術(shù)邊緣弱連接、高動(dòng)態(tài)和高實(shí)時(shí)的網(wǎng)絡(luò)環(huán)境下各軍兵種聯(lián)合作戰(zhàn)需求,可通過(guò)建立云-邊-端協(xié)同架構(gòu)實(shí)現(xiàn)邊緣戰(zhàn)術(shù)信息的可靠傳輸。軍事領(lǐng)域中,云的網(wǎng)絡(luò)環(huán)境穩(wěn)定,計(jì)算存儲(chǔ)能力充足,并可按需共享存儲(chǔ)和通信網(wǎng)絡(luò)等資源;邊的資源較少,且部署在戰(zhàn)術(shù)邊緣;端由嵌入式終端、平板和手機(jī)組成,輕量便攜。
信息過(guò)濾一直是熱門研究問題,在資源受限的聯(lián)合作戰(zhàn)模式下,如何有效對(duì)重復(fù)的作戰(zhàn)信息進(jìn)行過(guò)濾不僅能夠節(jié)省資源,更是高實(shí)時(shí)和高動(dòng)態(tài)的作戰(zhàn)實(shí)情的基本要求。目前,信息過(guò)濾方法可分為以下3種類型:
1) 基于URL(統(tǒng)一資源定位符)的過(guò)濾方法。該類方法基于以下假設(shè):具有相同URL的網(wǎng)絡(luò)資源一般是相同的。多軍兵種聯(lián)合作戰(zhàn)模式下重復(fù)的作戰(zhàn)信息的URL相同的概率更低,因此該類方法應(yīng)用較廣,其中常用的URL過(guò)濾方法是基于布隆過(guò)濾器進(jìn)行去重。
2) 基于協(xié)同的過(guò)濾方法。該類方法以用戶為基礎(chǔ),基于用戶的行為數(shù)據(jù)挖掘用戶喜好,從而篩選內(nèi)容,其中最近鄰協(xié)同過(guò)濾技術(shù)是目前常用技術(shù)之一。
3) 基于內(nèi)容的過(guò)濾方法。該類方法利用文本內(nèi)容進(jìn)行相似識(shí)別,從信息文本中提取一組特征,并基于特征進(jìn)行降維后再進(jìn)行相似度比較,從而判斷是否需要過(guò)濾。
1相關(guān)工作
英文文本過(guò)濾去重起源于20世紀(jì)70年代學(xué)術(shù)界存在的代碼重復(fù)問題,目前國(guó)外英文文本相似性檢測(cè)系統(tǒng)較多,其中常用的是iParadigms 公司開發(fā)的基于數(shù)字指紋的Tumitin平臺(tái)。漢語(yǔ)文本相似檢測(cè)最早由何云峰團(tuán)隊(duì)研發(fā),之后潘謙紅等提出了一種基于屬性論的文本相似度計(jì)算方法。Simhash算法是Google公司進(jìn)行海量去重的主要算法,其實(shí)質(zhì)是降維技術(shù),但在戰(zhàn)術(shù)邊緣環(huán)境下,計(jì)算資源有限且工作量繁重。基于協(xié)同過(guò)濾的算法通過(guò)推測(cè)用戶喜好進(jìn)行選擇性信息過(guò)濾,由于戰(zhàn)場(chǎng)信息瞬息萬(wàn)變且無(wú)法準(zhǔn)確推測(cè)用戶喜好,故不適用于聯(lián)合作戰(zhàn)模式下的信息過(guò)濾。
云-邊-端架構(gòu)中,云由各級(jí)中心云構(gòu)成,其網(wǎng)絡(luò)環(huán)境穩(wěn)定,并可按需共享通信網(wǎng)絡(luò)等資源;邊指覆蓋了各級(jí)各類業(yè)務(wù)信息系統(tǒng)的邊緣云,并可利用有限資源構(gòu)建高內(nèi)聚的服務(wù)能力;端由平板和手機(jī)等終端組成,具有輕量便攜的特征。邊對(duì)上可與中心云互連,對(duì)下可為終端用戶提供伴隨式服務(wù),也可與其他邊互連,共同形成云-邊-端的協(xié)同架構(gòu)。鑒于此,本文提出了一種聯(lián)合作戰(zhàn)模式下的信息過(guò)濾方法,先基于虛詞提取作戰(zhàn)信息樣本,再通過(guò)樣本組成特征碼,最后利用余弦相似度比較文本相似度。試驗(yàn)結(jié)果表明,該方法適用于計(jì)算和存儲(chǔ)資源有限的聯(lián)合戰(zhàn)場(chǎng)環(huán)境。
2基于虛詞的信息過(guò)濾方法
聯(lián)合作戰(zhàn)模式下的信息過(guò)濾方法(本文方法)可對(duì)作戰(zhàn)信息進(jìn)行過(guò)濾,重復(fù)閾值以文獻(xiàn)提出的閾值為標(biāo)準(zhǔn):如果2篇文章之間有超過(guò)80%的用詞相同,則這2篇文章是重復(fù)的。本文方法流程如圖1所示,包括以下3個(gè)階段:1) 構(gòu)建云-邊-端架構(gòu)下的協(xié)同作戰(zhàn)模式,自主形成云-邊協(xié)同、邊-邊協(xié)同、云-端協(xié)同和端-端協(xié)同模式,并將各模式下的作戰(zhàn)信息匯聚至樣本庫(kù);2) 對(duì)樣本庫(kù)中的作戰(zhàn)信息進(jìn)行特征提取,并對(duì)作戰(zhàn)信息樣本進(jìn)行抽取;3)對(duì)作戰(zhàn)信息樣本進(jìn)行特征碼提取,并基于余弦相似度進(jìn)行過(guò)濾操作,最終形成不含重復(fù)信息的作戰(zhàn)信息庫(kù)。
圖1 本文方法流程
2.1 云-邊-端架構(gòu)
在資源受限、窄帶寬和弱連接的戰(zhàn)場(chǎng)網(wǎng)絡(luò)環(huán)境中,構(gòu)建云-邊-端架構(gòu)是實(shí)現(xiàn)戰(zhàn)場(chǎng)可靠通信的有效途徑。當(dāng)網(wǎng)絡(luò)通信情況良好時(shí),云可向下連接邊以形成云-邊協(xié)同,邊可向下連接端以形成邊-端協(xié)同,同時(shí)通過(guò)上下級(jí)同步實(shí)現(xiàn)作戰(zhàn)信息同步;當(dāng)邊和端因窄帶寬等原因造成與上級(jí)中心連接斷開時(shí),可自動(dòng)切換為采用對(duì)等協(xié)同模式隨遇接入可連接的自組網(wǎng)絡(luò)并共享資源,從而實(shí)現(xiàn)云-邊-端架構(gòu)下多種模式的無(wú)縫切換。云-邊-端架構(gòu)如圖2所示。
圖2 云-邊-端架構(gòu)
2.2 作戰(zhàn)信息特征提取
多數(shù)作戰(zhàn)信息文本會(huì)分段描述,而每個(gè)段落均占一定篇幅并出現(xiàn)大量虛詞,因此可基于虛詞提取作戰(zhàn)信息樣本,并基于樣本比較2條作戰(zhàn)信息是否重復(fù)。基于上述推測(cè),本文利用文獻(xiàn)給出的在線網(wǎng)絡(luò)中的常用虛詞表對(duì)作戰(zhàn)信息特征進(jìn)行了提取。常用虛詞表如圖3所示。
圖3 常用虛詞表
2.3 作戰(zhàn)信息樣本抽取
大部分信息樣本均具有虛詞數(shù)不少于3個(gè)的段落。基于此,本文初步假設(shè)以比較作戰(zhàn)信息樣本是否重復(fù)作為作戰(zhàn)信息過(guò)濾的判定依據(jù)是合理的。本文從軍事新聞網(wǎng)站抓取2則信息,標(biāo)記為作戰(zhàn)信息1和作戰(zhàn)信息2,如圖4和圖5所示。為了便于描述,定義如下:含虛詞數(shù)不少于3的自然段稱大段落(big paragraph);字?jǐn)?shù)不少于L的自然段稱長(zhǎng)段落(long paragraph),若取L=20,則字?jǐn)?shù)不少于20的自然段就是長(zhǎng)段落。
圖4 作戰(zhàn)信息1
圖5 作戰(zhàn)信息2
基于上述定義,本文對(duì)樣本庫(kù)中的作戰(zhàn)信息順序進(jìn)行了讀取并統(tǒng)計(jì)了大段落,將前3個(gè)大段落存入數(shù)據(jù)庫(kù)作為樣本以便后續(xù)試驗(yàn),如作戰(zhàn)信息1;對(duì)于篇幅較短且含大段落少于3個(gè)的情況進(jìn)行特殊處理,如作戰(zhàn)信息2,重新遍歷將前幾個(gè)長(zhǎng)段落補(bǔ)齊3個(gè)組成為樣本。提取的作戰(zhàn)信息1樣本和作戰(zhàn)信息2樣本如圖6和圖7所示。
圖6 作戰(zhàn)信息1樣本
圖7 作戰(zhàn)信息2樣本
2.4 特征碼提取
2.5 相似度比較
2.6 評(píng)價(jià)標(biāo)準(zhǔn)
3試驗(yàn)與分析
為了驗(yàn)證本文方法的實(shí)際效果,本文從中國(guó)軍網(wǎng)隨機(jī)抓取新聞?wù)囊陨晌谋緲颖尽榱舜_保試驗(yàn)的準(zhǔn)確性,抓取了同類別文本樣本和不同類別文本樣本2組數(shù)據(jù)。其中,樣本1為同類別文本樣本,指類別選擇為軍事的樣本,共計(jì)10 000條;樣本2為不同類別文本樣本,指選擇類別為陸軍、海軍、空軍、火箭軍和聯(lián)勤的樣本各2 000條,共計(jì)10 000條。本文方法信息過(guò)濾流程如圖8所示。
圖8 本文方法信息過(guò)濾流程
3.1 試驗(yàn)步驟與結(jié)果
對(duì)樣本庫(kù)中的模擬作戰(zhàn)信息文本進(jìn)行以下操作:
1) 模擬云-邊-端協(xié)同模式,在試驗(yàn)環(huán)境下通過(guò)筆記本、平板和手機(jī)分別模擬云、邊和端,并構(gòu)成三層架構(gòu)的協(xié)同關(guān)系,2臺(tái)手機(jī)模擬端-端對(duì)等協(xié)同關(guān)系,每次點(diǎn)擊“同步”時(shí)向同一數(shù)據(jù)庫(kù)發(fā)送作戰(zhàn)信息樣本;
2) 依次讀取樣本庫(kù)內(nèi)作戰(zhàn)信息樣本,統(tǒng)計(jì)含虛詞數(shù)是否不少于3,若是則記為大段落并保留,若大段落數(shù)不少于3,則將前3段作為樣本,停止讀取;若讀到最末行,大段落數(shù)仍少于3則從頭讀取,取最長(zhǎng)的數(shù)個(gè)段落補(bǔ)齊3段作為樣本;
3) 提取樣本特征碼,并對(duì)2)中的樣本進(jìn)行分割,并將其中虛詞和標(biāo)點(diǎn)符號(hào)替換為空格;
4) 基于3)的特征碼比較余弦相似度,設(shè)定余弦相似度值為閾值,超過(guò)閾值則判定為重復(fù)文本;
5) 對(duì)樣本1和樣本2分別進(jìn)行試驗(yàn),試驗(yàn)結(jié)果如圖9所示。由圖9(c)可知,樣本1當(dāng)閾值為0.82時(shí), 值達(dá)到最大值,此時(shí)的準(zhǔn)確率P、召回率R和F1值分別為98.7%、100%和99.3%;樣本2當(dāng)閾值為0.78時(shí), 值達(dá)到最大值,此時(shí)的準(zhǔn)確率 、召回率 和 值分別為98.4%、100%和99.2%。
圖9 不同余弦相似度閾值下的評(píng)價(jià)指標(biāo)
3.2 試驗(yàn)分析
本文方法通過(guò)虛詞將大文本樣本簡(jiǎn)化為特征段,并使用余弦相似度進(jìn)行相似度比較,既簡(jiǎn)化了計(jì)算又節(jié)省了計(jì)算資源。試驗(yàn)結(jié)果可見,本文方法在同類樣本和不同類樣本上的準(zhǔn)確率P、召回率R和F1值均達(dá)到了98%以上,確保了作戰(zhàn)資源獲取的唯一性;通過(guò)對(duì)重復(fù)信息進(jìn)行過(guò)濾,降低了資源占有率,適應(yīng)了資源受限的聯(lián)合戰(zhàn)場(chǎng)環(huán)境。
4結(jié)束語(yǔ)
本文基于虛詞和余弦相似度對(duì)聯(lián)合作戰(zhàn)模式下的信息過(guò)濾方法進(jìn)行了研究,并通過(guò)模擬自主切換的云-邊-端協(xié)同模式,對(duì)不同類型樣本進(jìn)行了作戰(zhàn)信息過(guò)濾試驗(yàn)。本文方法通過(guò)對(duì)作戰(zhàn)信息進(jìn)行降維提高了文本相似度對(duì)比效率。試驗(yàn)結(jié)果驗(yàn)證了基于虛詞和余弦相似度的方法可對(duì)作戰(zhàn)信息進(jìn)行有效過(guò)濾,可節(jié)約邊緣戰(zhàn)術(shù)環(huán)境下的計(jì)算與存儲(chǔ)資源。
關(guān)鍵詞:
[責(zé)任編輯:xwzkw]
相關(guān)閱讀
- (2023-08-19)聯(lián)合作戰(zhàn)模式下的信息過(guò)濾方法
- (2023-08-19)徐州方特夜場(chǎng)幾點(diǎn)到幾點(diǎn)結(jié)束2023年?
- (2023-08-19)2023鄭州七夕怎么過(guò)呢
- (2023-08-19)西寧企業(yè)評(píng)價(jià)的職業(yè)技能等級(jí)證書和社會(huì)評(píng)價(jià)的“含金量”一樣嗎?
- (2023-08-19)東北暴雨,水稻等糧食作物影響幾何
- (2023-08-19)半場(chǎng)-李帥中柱武磊多次錯(cuò)失良機(jī) 上海海港0-0梅州客家
- (2023-08-19)收評(píng):滬指震蕩調(diào)整跌0.82% 地產(chǎn)、券商股逆勢(shì)活躍
- (2023-08-19)暴漲100 倍、估值堪比 OpenAI,Sam Altman 的世界幣卻迎來(lái)最大危機(jī)
- (2023-08-19)班主任每學(xué)期收5萬(wàn)元班費(fèi)?當(dāng)?shù)鼗貞?yīng) 已介入調(diào)查!
- (2023-08-19)2023年佛山市第一人民醫(yī)院“十佳醫(yī)生”評(píng)選結(jié)果出爐
- (2023-08-19)共享經(jīng)濟(jì)貴在提質(zhì)增效
- (2023-08-19)2015速騰和思域哪個(gè)好?外觀、配置、性能、價(jià)格比較
- (2023-08-19)怎樣安裝無(wú)線路由器教程(怎樣安裝無(wú)線路由器)
- (2023-08-19)信用卡逾期還不上被起訴會(huì)坐牢嗎
- (2023-08-19)《博德之門3》梅麗娜丈夫怎么復(fù)活 梅麗娜丈夫復(fù)活攻略
- (2023-08-19)“神秘人”能救恒大汽車嗎?實(shí)探紐頓金華超級(jí)工廠:計(jì)劃耗資約20億,廠房由地方國(guó)企“代建”
- (2023-08-19)燃!東部戰(zhàn)區(qū)發(fā)布戰(zhàn)訓(xùn)MV《閱海峽》
- (2023-08-19)黟縣住建局:“四心”管理 提升群眾幸福指數(shù)
- (2023-08-19)安徽淮南:勞模上好開學(xué)第一課
- (2023-08-19)外交部禮賓司司長(zhǎng)洪磊接受瑞典新任駐華大使歐思誠(chéng)遞交國(guó)書副本
- (2023-08-19)外交部:中俄艦船正常過(guò)航符合國(guó)際法和國(guó)際慣例
- (2023-08-19)修車學(xué)徒要學(xué)多久(修車學(xué)徒)
- (2023-08-19)注意!英洛華將于9月5日召開股東大會(huì)
- (2023-08-19)核查:俄襲擊英國(guó)在烏的海軍基地造成數(shù)十名高級(jí)指揮官喪生?
- (2023-08-19)陳年酒:從私人愛好到圈層愛好,投資市場(chǎng)不斷擴(kuò)大|產(chǎn)業(yè)鏈情報(bào)站
- (2023-08-19)眾志成城 防汛救災(zāi)丨突進(jìn)湯家莊
- (2023-08-19)今年首只“黑天鵝”!茅臺(tái)飲料領(lǐng)跌,白酒行情終結(jié)自此了?
- (2023-08-19)離岸人民幣對(duì)美元匯率盤中跌破7.3,專家:中長(zhǎng)期人民幣匯率貶值空間不大
- (2023-08-19)8月15日基金凈值:南方隆元產(chǎn)業(yè)主題混合最新凈值0.785,跌0.51%
- (2023-08-19)“持證上崗”的武大學(xué)生夫妻可申請(qǐng)合宿,別盯細(xì)節(jié)要看格局





