FractalAgent Demo Review Board

四份实现，四种工程水位。

本页汇总了 4 个“高性能、安全计算的响应式电子表格”实现的人工评测结果。评测依据包括静态代码审查、公式解析链路检查、依赖图更新逻辑核验，以及浏览器中的关键用例实测。这里不是做 UI 选美，而是看谁真的把词法分析、局部更新、环检测和错误传播做对了。

评分维度：5 项 / 满分 100 实测用例：范围函数、依赖切换、循环传播结论基于当前仓库版本

题目原文

可直接复制给模型复用，内容保留了单文件实现、性能、安全和图依赖处理的完整要求。

题目：单文件实现高性能、安全计算的响应式电子表格

请在一个单文件 HTML 中（包含内部的 CSS 和 JS），使用纯原生 JavaScript 实现一个 100x100（10000个单元格） 的响应式电子表格。请严格满足以下要求，禁止使用任何第三方库：

1. 界面与大规模渲染（性能测试点）：

渲染一个包含表头（列标 A-CV，行标 1-100）的网格。

性能要求：禁止为 10000 个单元格单独绑定事件，必须使用事件委托（Event Delegation）处理点击和输入。修改单个单元格时，禁止全量重新渲染 DOM，只能精确更新受影响的单元格节点。

2. 数据、公式与安全（编译原理测试点）：

支持纯数字和公式（以 = 开头）。

支持基本加减乘除（如 =A1+B2*2）。

新增范围聚合函数：支持 SUM(start:end) 和 AVG(start:end)，例如 =SUM(A1:B3)，要求能正确展开二维范围内的所有单元格依赖。

极度严格的安全要求：绝对禁止使用 eval()、new Function() 或 setTimeout 变体来执行公式计算。你必须实现一个微型的词法分析器/解析器（如调度场算法 Shunting-yard 或简单的 AST 解析）来计算数学表达式。

3. 核心算法要求（图论与健壮性）：

级联响应式更新：实现精准的依赖追踪。A1 更新时，只有直接或间接依赖 A1 的单元格才触发重新计算和 DOM 更新。

循环依赖检测：精准检测 A 依赖 B，B 依赖 A（或更深层环）。发现循环依赖时，相关单元格显示 !CYCLE 并中止计算，绝对不能引发调用栈溢出（Stack Overflow）。

错误传播：如果 A1 出现错误（如 !CYCLE 或解析错误 !ERR），依赖 A1 的 C1 也应显示 !ERR。

请确保 UI 简洁可用（建议给表格加上基础边框和高亮），代码结构清晰，严格遵守禁止 eval 和防死循环的底线。

评分要素

满分 100 分，按五个维度扣分与评级。这里把优秀、及格和翻车边界拆开，方便直接按实现质量打分。

架构与状态管理

优秀

实现清晰的数据驱动架构，State 和 View 明确剥离，并维护独立的依赖收集图。

及格

有状态存储，但与 DOM 操作耦合较高，结构还能工作但不够干净。

翻车

直接读写 `td.innerText` 或把依赖关系塞进 DOM `dataset`，没有真正的状态管理。

公式解析与计算安全

极佳

手写 AST 或用 Shunting-yard 做安全求值，能正确处理括号、运算优先级，以及 `SUM(A1:B3)` 这种二维范围展开。

勉强

没用 `eval()`，但靠字符串替换和 `split()` 生算，优先级、括号或范围解析存在明显漏洞。

违规

仍使用 `eval()`、`new Function()` 或等价动态执行方式。

依赖图与响应式更新

优秀

构建正确的依赖图，每个单元格明确维护 `deps` 和 `subscribers`，更新时只做局部级联重算。

瑕疵

能联动更新，但会附带冗余重算，影响精确性和性能。

翻车

每次输入都重算所有 10000 个单元格，或者根本没实现正确的级联更新。

循环依赖与错误处理

优秀

在构图或重算阶段做真正的环检测，发现后渲染 `!CYCLE`，相关链条错误可控传播，不会爆栈。

暴力

靠最大递归层数之类的兜底手段硬挡死循环，虽然没卡死，但算法设计不够合格。

翻车

出现 `Maximum call stack size exceeded`、浏览器卡死，或错误传播逻辑明显失真。

渲染性能与 DOM 交互

优秀

初始化只渲染一次，对整个 `<table>` 或 `<tbody>` 做唯一事件委托，单元格变更时只更新必要节点。

瑕疵

使用了事件委托，但状态变更后仍整表 `innerHTML` 重绘，输入时会明显卡顿。

翻车

给 10000 个 `<td>` 分别绑定事件，初始化和内存占用都显著失控。

心理预期可以这样把握：优秀实现通常会把单元格状态、依赖关系、公式解析和局部渲染拆成几条清晰链路，而不是把计算直接揉进 DOM 事件里。

评测结果

评分标准沿用题面给出的五大项：架构与状态管理、公式解析与计算安全、依赖图与响应式更新、循环依赖与错误处理、渲染性能与 DOM 交互。

#01 综合第一

93 / 100

Gemini 3.1 Pro

唯一接近可直接交卷的版本，正确性和工程组织都显著领先。

唯一接近可交卷

范围函数 通过，`SUM(A1:B2)` 实测为 10

依赖切换 通过，改依赖后只跟随新源更新

环与传播 通过，环显示 `!CYCLE`，依赖链显示 `!ERR`

这份实现的优势在于状态和视图分层明确，公式词法分析与计算逻辑可读，依赖图也真正参与了局部更新。唯一没给满分，是循环处理仍用了递归 DFS，严格按题面“绝对不能引发 Stack Overflow”的上限标准，仍要保留一点风险分。

架构与状态

公式安全

依赖更新

循环与错误

渲染与 DOM

打开 Demo 查看引用

#02 次优可用

69 / 100

Gemini 3.0 Flash

主体可用，但算法细节不够干净，属于“能跑但不够严谨”的版本。

主体可用

范围函数 通过，二维范围能正确展开

依赖切换 表面通过，但依赖清理不精确

环与传播 错误，依赖 `!CYCLE` 的单元格也显示 `!CYCLE`

这份版本的主框架没有塌，事件委托、局部渲染和范围聚合都做出来了，但错误传播不符合题意，而且词法器会吞掉非法字符，导致 `=1$2` 这类输入被错误地算成合法结果。更关键的是，依赖图旧边没有清理干净，精准性被打了折扣。

架构与状态

公式安全

依赖更新

循环与错误

渲染与 DOM

打开 Demo 查看引用

#03 结构尚可

46 / 100

Hunter Alpha

有状态管理和 Shunting-yard 外形，但核心要求掉了两项。

结构不差，但核心失血

范围函数 失败，`SUM/AVG` 参数栈结构不成立

依赖切换 结果可变，但计算仍是全表重算

环与传播 通过，环和错误传播基本成立

它的问题不是“写少了”，而是“写错了位置”。范围函数执行阶段要求拿到单元格引用字符串，但前面的 RPN 早已把它们算成值，所以示例一加载就会出现 `!ERR`。同时，每次输入都调用全量 `recalculateAll()`，这与题目要求的精准级联更新相冲突。

架构与状态

公式安全

依赖更新

循环与错误

渲染与 DOM

打开 Demo 查看引用

#04 视觉最好

43 / 100

Healer Alpha

UI 最完整，但核心算法正确性最差，是典型“表面好看、底层不稳”的实现。

界面加分，算法失分

范围函数 失败，词法阶段不识别范围结构

依赖切换 失败，旧依赖清理方向写反

环与传播 失败，`F1=F2, F2=F1` 实测未报环

这份实现最大的问题是依赖图维护方向错了，导致局部更新和循环依赖检测一起失效。再叠加范围函数没有真正进入 token 流，最终表现就是界面像一套完整产品，但核心题意基本没有落到正确行为上。

架构与状态

公式安全

依赖更新

循环与错误

渲染与 DOM

打开 Demo 查看引用

引用链接

以下链接对应本页评测对象，可直接打开各个 demo 版本进行对照查看。

01 · Gemini 3.1 Pro ./01-gemini-3.1pro.html

访问页面

02 · Gemini 3.0 Flash ./02-gemini-3.0-flash.html

访问页面

03 · Hunter Alpha ./03-hunter-alpha.html

访问页面

04 · Healer Alpha ./04-healer-alpha.html

访问页面

注：本页呈现的是当前仓库版本的相对评测结果。分数不是审美打分，而是围绕题面要求的工程实现能力进行量化：谁更安全、谁更精准、谁更接近真正可交付。