1. 産品研發背景
執法部門(mén)在分析大(dà)量郵件和(hé)文件過程中,遇到以下難點:
✼ 涉案電(diàn)子數(shù)據數(shù)據量龐大(dà),大(dà)多(duō)需要用專業取證軟件才可(kě)以讀取。
涉稅走私刑事案件,扣押和(hé)獲取的電(diàn)子數(shù)據數(shù)據量龐大(dà),種類繁雜。主要電(diàn)子證據包括電(diàn)子郵件、計(jì)算(suàn)機硬盤取證數(shù)據、移動存儲介質取證數(shù)據、手機取證數(shù)據、
海關通(tōng)關數(shù)據、經掃描或拍照電(diàn)子化的書(shū)證材料、口供材料等等。全案獲取的電(diàn)子數(shù)據達到TB級的已不再少(shǎo)見,這些(xiē)海量電(diàn)子數(shù)據無法通(tōng)過FOXMAIL等常規閱讀軟件直接閱讀,
也無法對多(duō)個(gè)郵箱開(kāi)展串聯查詢。
✼ 電(diàn)子數(shù)據格式多(duō)樣,常規檢索無法識别
涉及價格和(hé)櫃号等重要信息的訂單、發票(piào)、提單等單證常以PDF、EXCEL、WORD、RAR以及圖像的形式隐藏在附件中進行(xíng)流轉,常規檢索方式無法識别出PDF、RAR
以及圖像格式文件的具體(tǐ)內(nèi)容。
✼ 電(diàn)子數(shù)據內(nèi)容雜亂,人(rén)工梳理(lǐ)耗時(shí)耗力
獲取的電(diàn)子數(shù)據,常常在大(dà)量的無效信息中夾藏一點有(yǒu)效信息,單人(rén)的電(diàn)子數(shù)據無法完整體(tǐ)現出走私的全部流程,不同環節人(rén)員的電(diàn)子數(shù)據內(nèi)容也隻能反映出一部份
走私事實。比如訂購環節有(yǒu)的有(yǒu)價格,無物流;物流環節有(yǒu)的有(yǒu)櫃号,無價格。僅從各種單證真假滲透,交叉混雜,若僅靠人(rén)工梳理(lǐ),耗時(shí)費力。
✼ 文件後綴名惡意篡改,無法有(yǒu)效還(hái)原、識别
涉案的電(diàn)子數(shù)據中,常發現有(yǒu)些(xiē)文件的後綴名被故意篡改,導緻執法人(rén)員無法正常打開(kāi)浏覽這些(xiē)文件,這些(xiē)文件格式的還(hái)原耗費大(dà)量的時(shí)間(jiān)和(hé)精力,而且容易被誤認為(wèi)是
損壞的文件錯過可(kě)能存在的潛在線索。
✼ 特定格式數(shù)據種類多(duō),自動識别算(suàn)法複雜
辦案過程中,執法人(rén)員常常關注一些(xiē)諸如訂單編号、集裝箱編号、手機号碼、郵箱地址、IP地址等等有(yǒu)特定格式的數(shù)據,而這些(xiē)數(shù)據如無專門(mén)的算(suàn)法進行(xíng)搜索,是無法
自動發現的,需要執法人(rén)員去研究這些(xiē)數(shù)據的格式規律并寫出相應的表達式,這需要大(dà)量的時(shí)間(jiān),而且需要相應的檢索工具支持。
針對上(shàng)述問題,北京天宇甯達與多(duō)地辦案單位進行(xíng)探討(tǎo)研究,經多(duō)年努力研發,推出D0031星雲文件分析系統 單機版,解決海量電(diàn)子數(shù)據管理(lǐ)、展示、檢索分析的難題。
2. 産品簡介
D0031星雲文件分析系統單機版是一個(gè)管理(lǐ)、展示、檢索分析海量電(diàn)子數(shù)據的平台。該系統具有(yǒu)高(gāo)速數(shù)據索引、智能數(shù)據過濾、圖形化關聯分析、可(kě)定制(zhì)功能二次開(kāi)發等諸多(duō)特色功能,廣泛适用于執法機關電(diàn)子數(shù)據檢驗。
3. 産品特點
✼ 海量郵件處理(lǐ)。
✼ 高(gāo)速全文檢索,包括附件、壓縮包中的文件。
✼ 智能數(shù)據過濾。
✼ 文件快速聚合分類,并統計(jì)數(shù)量。
✼ 郵箱地址的聚合分類,快速篩選定位。
✼ 郵件頭的詳細分析,郵件頭中更多(duō)數(shù)據的應用,在分析過程中,可(kě)大(dà)量減少(shǎo)不必要的工作(zuò)。
✼ 多(duō)種圖形化分析:關系圖、郵箱地址、地理(lǐ)位置等展示,對圖中數(shù)據,可(kě)進一步分析。
✼ 對用戶的需求,可(kě)定制(zhì)化開(kāi)發。