数十个G的压缩数据包被带回办案点。小王和他的小组连夜奋战。服务器嗡嗡作响,屏幕上代码滚动。数据清洗、去重、关联、匹配……这是一个枯燥却至关重要的过程,如同沙里淘金。
“林处,数据基本清洗完毕了。五年,市级财政专项资金支付记录,一共一百八十七万五千六百多条。”小王的声音带着疲惫,也带着兴奋。
林万骁走到电脑前,看着屏幕上结构清晰的数据库表:“很好。现在,建立几个初步模型。”
他拉过白板,写下几个关键词:
“一、时间异常模型。筛选所有节假日期间的支付记录、凌晨等非工作时间的支付操作、以及同一项目资金在极短时间内(例如24小时内)完成所有审批流程的记录。”
“二、对象异常模型。重点分析收款方:注册时间不足一年的新公司、同一法人或关联方控制的多个企业集群、注册资本与获得资金规模严重不匹配的企业。”
“三、额度异常模型。关注金额恰好处在不同层级审批权限临界点以下的支付。特别是那些频繁出现的、金额总是比上一级审批权限低一块钱的支付。”
“另外,做一个关联分析,交叉比对这三个模型筛选出的异常记录,找出重叠点。那些同时满足多个异常条件的支付,就是我们的重点怀疑对象。”
任务再次分解。办案点的几台电脑全面开工。SQL查询语句不断编写、运行。Excel的透视表功能被用到极致,海量数据被切割、重组、聚合,寻找着违反统计规律的蛛丝马迹。
时间一分一秒过去。窗外夜幕降临,又渐渐泛起鱼肚白。
“有了!”凌晨时分,小王突然喊了一声,声音沙哑却充满发现的光芒。
小主,
林万骁和几乎要睡着的郑国栋立刻围了过去。
“看这里,”小王指着屏幕上一张复杂的关联图和一串筛选出的记录,“按照您说的几个模型交叉比对,我们锁定了三十七个高度可疑的项目支付。主要集中在农业产业化补贴、中小企业创新基金和灾后重建补助这几个大类。”