資料來源#
問題: 面向人類的 harness 是否會無限增長,還是會觸及自身的膨脹天花板 — 一份精心製作的 HTML 計畫複雜到無法閱讀,就像它所取代的 markdown 一樣?
(這回答了 HTML as the New Markdown 中記錄的第一個開放問題。)
簡短回答#
是的 — 但 HTML 提升並重塑了天花板,而非消除它。 膨脹天花板是結構性的,因為面向人類的 harness 存在的目的是適應有限的人類注意力,這是任何媒介都無法使其無限的唯一資源。HTML 爭取到了空間;豐裕經濟學和 artifact 蔓延又把它花回去 — 而且隨著模型改進,它們花得更快。
論證#
1. HTML 本身就是膨脹天花板被觸及的症狀 — markdown 的天花板#
這個論點之所以存在,是因為上千行的 markdown 計畫「壓垮了人類……我們的眼睛開始發呆」(HTML as the New Markdown;原始來源)。Thariq Shihipar 坦承他會「請 Claude 編輯計畫而不是自己閱讀」,這正是已經跨越 markdown 可讀性天花板的診斷指標。因此我們有直接證據表明,一種人類理解媒介可以膨脹到超出實用性。唯一的問題是 HTML 是否在結構上免疫 — 答案是否定的。
2. HTML 改變了什麼:它提升了天花板並改變了其形狀#
- 提升了它。 HTML「將 token 花在可讀性上(模型、結構、色彩、互動)而非純文字」,在每單位注意力中打包更多可理解的訊號(HTML as the New Markdown)。這明確是模型 smart zone 的人類注意力類比:清除 context 恢復模型的 smart zone,但二次方注意力仍然約束它;HTML 提升了人類的有效 smart zone 而不廢除其邊界(Context Window Smart Zone)。
- 重塑了它。 markdown 是線性的 — 按順序閱讀。HTML 是可導航且漸進式揭露的:瀏覽 → 深入 → 互動。約束限制從總量轉移到每次決策的注意力表面。Disposable Micro-Apps 是極端案例:將一個子決策壓縮成一個聚焦的 UI,精確呈現所需的注意力而不多餘。這種分解逃生閥正是單一整體 markdown 檔案所缺乏的。
3. 但天花板轉移了而非消失 — 從長度到蔓延#
膨脹在新的軸線上重新出現:不是「一份文件太長無法閱讀」,而是「太多 artifact 需要追蹤」。這是 Disposable Micro-Apps 中已標記的開放問題(「一次性微應用和工具蔓延之間的界線在哪裡?如果每次編輯都產生一個客製化 UI,工作流程是否會碎片化?」),加上 HTML 的差異比對/版本控制弱點(僅被 copy-back-to-markdown 部分修補),以及 Living Design System 的「在什麼專案規模下,維護 artifact 的成本超過它帶來的一致性」。同樣的天花板,新的維度。
4. 使天花板具結構性的不變量:人類注意力是守恆的#
約束條件是「人類注意力和判斷力,而非生成成本」(Compute Allocator)。超過認知容量的監督使輕微錯誤增加 +11%、重大錯誤增加 +39%(AI Brain Fry);人類在超過容量後有一條退化曲線,與模型的 smart zone 相呼應(Context Window Smart Zone)。任何以人類理解為全部目的的 harness 必然受限於這個有限資源。一種媒介可以在每個注意力 token 上更有效率;它無法使注意力無限。
5. 關鍵的不對稱性 — 天花板隨時間變得更加具約束力,而非更少#
模型端 harness 可以隨著能力內化而趨近於零(Harness Shrinkage as Models Improve、The Bitter Lesson)。人類端 harness 則不行:當模型變得更聰明時,人類的注意力預算不會增長。更糟的是 — 豐裕經濟學加上更快的輸出意味著更多 artifact 競爭同一固定預算。「產出更多更快的 agent 重新引入了量的壓力」(AI Brain Fry)。因此隨著模型改進,面向人類的 harness 面臨增加的膨脹壓力;注意力天花板恰恰在其他一切都變得廉價時成為主導約束。這是模型端 harness 軌跡的反面 — 隨著能力提升,兩者分道揚鑣。
6. 什麼讓它保持在天花板之下 — 以及它如何被突破#
面向人類的 harness 有一個模型端所缺乏的膨脹偵測器:你自己的脫離感。明確的目標就是「一份你真正想要閱讀的計畫」(HTML as the New Markdown)。模型端膨脹是隱形的 — 它悄悄地將模型推入 dumb zone(Context Window Smart Zone)— 而人類端膨脹在你開始發呆的那一刻就宣告了自己。這是一個自我修正的訊號。
它透過 Compute Allocator / AI Brain Fry 的失敗模式被突破:豐裕使生成免費,所以沒有任何機制阻止你產出超過你能關注的量 → 注意力崩潰為橡皮圖章式審核 → 你在不知不覺中跨越了天花板。防止這種情況的紀律是 Cat Wu 的「每次啟動都閱讀整個 system prompt 並刪除沒有發揮作用的部分」(Harness Shrinkage as Models Improve)的人類端孿生版本:一個 artifact 必須透過你的實際參與來證明其存在的合理性,否則它就是膨脹。
結論#
是的,它會觸及天花板。HTML 的貢獻是將天花板推遠(更密集的可讀性)並軟化它(可導航/可分解而非線性),以微應用和 copy-back-to-markdown 作為逃生閥。但因為守恆的資源是有限的人類注意力 — 而且更好的模型將更多生成輸出傾注在這個固定預算上 — 面向人類的 harness 無法逃脫膨脹。它將失敗模式從「文件太長無法閱讀」轉移到「太多 artifact / 橡皮圖章式審核」,而這個天花板隨著模型改進變得更加具約束力,而非更少。
資料來源#
- HTML as the New Markdown — the thesis; legibility-spend framing; the open question this answers
- Compute Allocator — attention/judgement as the binding constraint; rubber-stamping failure mode
- Disposable Micro-Apps — the decomposition escape valve and the tool-sprawl relocation
- Living Design System — maintenance-cost ceiling on durable artifacts
- Harness Shrinkage as Models Improve — the model-facing/human-facing asymmetry; pruning discipline
- Context Window Smart Zone — human smart zone analog; invisible vs. visible bloat
- AI Brain Fry — 11–39% error surface; output-volume pressure
- The Bitter Lesson — what migrates inward (model-facing) vs. what does not (human legibility)
- How I AI: Thariq Shihipar on Replacing Markdown with HTML for AI-Powered Development — primary source
Cited by 6
- Compute Allocator
The human's evolving role: deciding what's worth spending compute on; ~1% of generated tokens ship, 99% is scaffolding…
- Disposable Micro-Apps
Throwaway custom UIs built per-task to edit a plan ("micro-software on top of micro-software"); copy-back-to-markdown;…
- Harness Shrinkage as Models Improve
Prompt scaffolding shrinks each model release; Cat Wu's pruning discipline; Boris Cherny "100 lines of code a year from…
- HTML as the New Markdown
Thariq Shihipar's thesis: as models improve, thousand-line markdown plans overwhelm the *human*; HTML artifacts (visual…
- Human-in-the-Loop Boundaries
Humans belong at allocation, understanding, design-concept, risk, and accountability boundaries; they slow the system d…
- Open Questions Backlog
_96 pages with open questions, as of 2026-06-14._
Related articles
- Claude Code
Anthropic's agentic coding product; created by Boris Cherny late 2024; TypeScript/React; CLI/desktop/web/mobile/IDE sur…
- Compute Allocator
The human's evolving role: deciding what's worth spending compute on; ~1% of generated tokens ship, 99% is scaffolding…
- Harness Shrinkage as Models Improve
Prompt scaffolding shrinks each model release; Cat Wu's pruning discipline; Boris Cherny "100 lines of code a year from…
- HTML as the New Markdown
Thariq Shihipar's thesis: as models improve, thousand-line markdown plans overwhelm the *human*; HTML artifacts (visual…
- Thariq Shihipar
Engineer on the Claude Code team at Anthropic; "HTML is the new markdown" and "compute allocator" framings; three HTML-…
