为数据:抓取实控人“抖音/微博点赞记录”(如“赌场视频”“奢侈品拍卖”)、搜索记录(“如何转移资产”“海外避税天堂”);
• 供应商关联数据:用IP定位技术追踪“供应商注册地址”与“实控人亲属住址”的重合度(>50%判定为“关联交易”);
• 机构暗盘数据:解析“券商研报”的“推荐逻辑”与“Level-2数据”的矛盾(如“推荐买入”但“机构席位净卖出”)。
“代码要像‘侦探’,”林静在“逻辑蜂巢”白板写伪代码,“比如抓取‘抖音点赞’时,过滤‘官方蓝V账号’的互动,只留‘实控人私人账号’的行为。”
(2)跨市场传染数据
林静嵌入“情绪共振系数”抓取模块:
• A股→港股:抓取“A股暴跌标的”的“港股兄弟公司”融券余额(如“宁德时代”与“宁德港股”);
• 美股→A股:追踪“中概股ADR溢价率”与“A股对应板块”的“恐惧指数”滞后相关性(通常滞后30分钟)。
“数据抓取不是‘下载文件’,是‘织网捕鱼’,”她指着终端上的“数据流向图”,“网眼要细(沉默数据),网线要韧(非结构化数据),才能捕到‘资本大鱼’。”
3. 周严的“规则数据”:用“老兵经验”筛出“人情信号”
(1)熔断“三级响应”数据
周严的“规则长城”活页本列出抓取清单:
• 一级熔断数据:恐慌指数(<20或>80)、关联交易占比(>净资产5%)、人情压力关键词(如“行长特批”“地方纳税”);
• 二级熔断数据:流动性覆盖率(<100%)、跨市场共振值(>0.8)、机构调研频次(突增200%可能是“做局”);
• 三级熔断数据:担保链断裂倒计时(<7天)、数据投毒确认(如“供应商欠款”与“现金流”背离)。
“每个数据都要‘过算盘’,”周严用铜算盘演示“关联交易占比”计算,“比如某房企‘技术授权费1.2亿’,按行业标准应<5000万,溢价140%——算盘一拨就知道是‘利益输送’。”
(2)人情风控“黑名单”数据
周严重点抓取“非财务人情信号”:
• 高管行为:突击投保“高额寿险”(保额>净资产20%)、子女留学目的地(瑞士/新加坡等“资产隐匿地”);
本章未完,请点击下一页继续阅读!