队,代码库普遍在5万行以下。体验好,好评是真的。赵文渊不是在作假。他的产品在当前用户规模下确实能打。
但企业客户的代码库动辄几十万行。
这不是Bug。Bug可以修。这是架构选型的根本性问题,特征提取没做分层剪枝,核心引擎直接用大模型全量推理。5万行以下没问题,上下文窗口装得下。超过20万行,窗口溢出,模型开始产生幻觉。检测结果从“准确”变成“瞎猜”。
要修?重写核心引擎。
至少三个月。
赵文渊大概率还不知道。公测期用户全是小项目,数据漂亮得很,他肯定觉得自己牛逼坏了。
等真接了企业单,才会发现这事有多棘手。
韩路一关掉视界。精力掉了六十多点。
他靠在椅背上,看着CodeSafe首页那行“最完整的AI代码审查方案”。
苏念念推门进来带了一股外面的风。围巾还没摘,径直走到韩路一对面坐下,掏出电脑。两人约好了在Bug Café碰面。
“我注册了CodeSafe。”
“嗯。”
“搞个对比测试?”她打开一个GitHub仓库。“这个开源项目,Python后端服务,大概八万行。各跑一遍。”
两台电脑同时开始跑。
BugKiller的进度条先到底。CodeSafe慢了快一分钟。
结果出来了。苏念念把两个窗口并排放在一起。
BugKiller报了50个。CodeSafe报了36个。
韩路一又开视界扫了一遍,51个Bug。
他拿视界的结果当答案,逐条比对。BugKiller:50个里48个是真的,2个误报,漏了3个。CodeSafe:36个里32个是真的,4个误报,漏了19个。
看了二十分钟源码确认之后,他把误报数据告诉苏念念。
苏念念在本子上算。“误报率,我们百分之四,他们百分之十一。”
漏报率他没提,总不能跟苏念念解释自己为什么知道真实答案是51个。心里默算了一下,百分之六比百分之三十七。
八万行代码库上,CodeSafe的误报率明显上升了。
但数量还不是关键。
苏念念点开BugKiller第一条检测结果。Bug描述下面挂着一段影响评估:“上线后影响预
本章未完,请点击下一页继续阅读!