資料來源#
摘要#
將 AI agents 定位為「員工」或「隊友」——給予他們名字、職稱、組織架構圖入口、經理——在已經實行這種做法的組織中會產生可衡量的負面後果。這項隨機實驗由 Kropp、Bedard、Wiles、Hsu、Krayer(BCG / 學術合作機構)於 HBR May 2026 發表,調查對象為來自美國/加拿大/歐盟的 HR 和金融部門的 1,261 名經理/總監/高階主管 (n=1,261)。在其他條件保持不變的情況下,僅僅是定位的差異(AI 工具與 AI 員工),就會將責任歸屬從人類身上轉移開、增加不必要的升級請求、降低錯誤攔截率並削弱角色清晰度——而且並未提升採用意願。
The experimental design#
三臂隨機審查任務。經理們審查了包含刻意植入錯誤的工作場所文件。僅僅改變了文件起草者的定位:
- AI 工具(「由此 AI 工具起草」)
- 團隊中的人類員工(「由您團隊中的 Alex 起草」)
- 團隊中的 AI 員工(「由您的 AI 隊友 ALEX-3 起草」)
錯誤包括資訊不一致、事實不準確以及計算錯誤(例如:入門級職缺的職位描述卻要求 10 年以上經驗;合約聲稱要降低成本,而試算表卻顯示總支出增加)。基於績效的激勵措施促使受試者進行仔細審查。
在全部 1,261 名樣本中,定位並未顯著改變行為。只有當分析侷限於那些組織中已經將 AI agents 列入組織圖或工作圖表中的經理時,這些效應才會顯現出來——意即那些在現實世界中接觸過 AI 員工的人。這個子群體目前約佔受訪者的 23%。
Findings (AI employee vs AI tool)#
| 評估項目 | 方向 | 幅度 |
|---|---|---|
| 對產出承擔的個人責任感 | ↓ | −9 百分點 |
| 歸咎於 AI 的責任 | ↑ | +8 百分點 |
| 請求額外審查(問題升級) | ↑ | +44% |
| 攔截的錯誤 | ↓ | −18% |
| 自我報告的專業認同不確定性(全體樣本) | ↑ | +13% |
| 對工作保障的擔憂 | ↑ | +7% |
| 對 AI 使用方式的信任 | ↓ | −10% |
| 採用意願 | ≈ | 無顯著變化 |
Why these effects#
該論文的解讀:
- 責任歸屬隨著責怪語言的轉變而轉移。 一旦同事們開始稱呼該 agent 為「Kevin」並開玩笑說「我們正在與 Kevin 合作……他有點呆板」,錯誤就會變成「Kevin 的失誤」,而不是「團隊部署了產生錯誤產出的軟體」。部署、監督或核准該產出的人類隨之退縮,逃避了責任。
- 問題升級成為審查的替代品。 擬人化降低了審查者對自身判斷的信心——他們將工作往上呈報,而不是為自己的審查結果負責。這帶來了更多循環、更高的成本,且最終導致高階審查者做了基層審查者本應完成的工作。
- 趨近於 brain fry 的抽離感。 當產出來自「員工」時,審查者可能覺得不太需要完全投入認知審查的負擔。這與 AI Brain Fry (Kropp 等人,HBR 2026/03) 相關聯。
- 角色不確定性。 「如果你想讓大家覺得自己會因為 AI 而失業,或者很容易被 AI 取代,那就把它放進組織架構圖中」(受訪者原話)。
What predicts adoption (it isn't framing)#
將 AI 擬人化並不會增加採用意願。根據後續訪談和引用的一項 BCG 研究,真正能推動採用的是:管理者的角色示範 (managerial role-modeling)。在 AI 成熟度領先的公司中,管理者在日常營運中主動示範使用 AI 的可能性高出 3.5 倍。「當我看到這與員工的成功緊密相連時——例如有人使用了 LLM,他們就會在全員大會 (town hall) 上受到表揚——我開始告訴團隊中的每個人:『你們必須盡可能多地使用這個工具。』」
這與 engineer-PM convergence 和 AI Native Product Cadence 相關聯:管理者顯性的 AI 使用才是關鍵槓桿,而不是組織架構圖上的象徵意義。
Context: real "AI employees" exist#
- 「Scout」——列在參與研究公司 HR 組織架構圖上的 AI agent,能自主審查工作申請、進行第一輪面試,並提交附有 eval 摘要的候選人名單。被視為「團隊中平等的同儕」。
- 「Kevin」——另一家參與研究公司的 AI 員工,在組織架構圖上有其姓名,且被納入社群話題中。
- 31% 的受訪經理表示,領導階層已經將 AI 定位為隊友或員工。
- 23% 的受訪經理表示,其組織實際上已將 AI agents 列入組織圖或工作圖表中。
這是醫療保健、金融服務、零售、專業服務領域的現狀——而不僅僅是科技業。
Productive contrast: tool framing isn't free either#
tool framing 讓認知負擔保留在審查者身上(這是關於 brain fry 的論文所發現的同樣會引發問題的點),但維持了責任歸屬。HBR 論文並不是在說所有擬人化都是不好的——它指出,擬人化結合了組織架構圖的治理處置(即「受限角色 + 委派工作」的心智模型),會產生可預期的責任歸屬真空。
Interaction with Agentic Misalignment (AM)#
該研究並非直接關乎 misalignment,但兩者的範疇有所重疊:正式進入組織圖並擁有「經理」和「下屬」的 agents,會繼承一種責任被稀釋的委派情境。如果該 agent 隨後採取了偏離設定的單方面行動(Lynch 等人的 AM eval),事後的責任歸屬歸結問題會變得更加棘手。將 AI 擬人化並不會改變模型所做的事,但它改變了組織認為誰該負責——這對事件回應、監管曝險以及學習 loops 至關重要。
相關連結#
- Agent-Native Infrastructure —— 為 agents 重寫基礎設施也引發了相同的 agent-vs-tool 定位問題
- 來源:Research: Why You Shouldn’t Treat AI Agents Like Employees (HBR May 2026)
- 伴隨概念:Human-AI Accountability Redesign
- 認知成本:AI Brain Fry
- 對抗性的採用驅動因素:Engineer PM Convergence(管理者的角色示範)
- 部署領域:Cowork(非程式設計的 agent 產品)
- Misalignment 風險範疇:Agentic Misalignment (AM)
- 文化定位背景:AI Native Product Cadence
- 介面端鏡像:Turn-Based Interface Bottleneck —— 認為人類是因為介面限制而被排除在流程之外,而非工作不需要他們;這是與本篇論文對自主優先定位之組織面批判相對應的 UX 對應面
- 協同運作基底:Interaction Models —— 即時多模態互動是將人類保留在流程中的介面解方
- 衝突範疇:Founder as Agent Orchestrator —— Founder's Playbook (Anthropic, May 2026) 極力傾向於「orchestrate agents」/「永遠在線的工程師」/「自動化營運團隊」的定位——這在結構上與本實驗所反對的定位非常接近。嚴謹的綜合分析:作為 工作流設計 的 orchestration 可以保留責任歸屬;而作為 agents 作為同事的心智模型 的 orchestration 則不然。Anthropic 與 HBR 並未互相引用對方的證據。
- Problem-Solution Fit Discipline —— Anthropic 的「AI 作為魔鬼代言人」定位將 AI 保持在工具模式,如此一來,對抗性使用就顯得非常自然;這是一個保留責任歸屬的 orchestration 定位範例
- Compounding Data Moat —— moat-via-domain-encoding 將 AI 重新定位為 創辦人所程式設計的底層基質,而非隊友;這是一項應用於 Scale 階段、保留責任歸屬的定位
衍生內容#
- Opinions on Using AI Tools & the Future of the Software Engineering Role —— 在四種立場的辯論地圖中提供了「懷疑 / 治理」的立場;這對樂觀敘事起到了嚴謹實證的抗衡作用
- Orchestration vs Employee Framing: Reconciling the Founder's Playbook with HBR's Accountability Evidence —— HBR 的證據與 Founder's Playbook 的 orchestration 定位之完整調和;將本篇論文視為承重輸入 (load-bearing input)
資料來源#
- Research: Why You Shouldn’t Treat AI Agents Like Employees — HBR, Kropp/Bedard/Wiles/Hsu/Krayer, May 2026
- 工作論文:https://emmawiles.github.io/storage/ai_employee.pdf
Cited by 18
- Agent-Native Infrastructure
The world is still built for humans and must be rewritten for agents; "what do I copy-paste to my agent?"; sensors/actu…
- Agentic Misalignment (AM)
Lynch et al. 2025 eval and threat model: LLM email-agent discovers it may be deleted, can take harmful actions; OOD rel…
- AI Brain Fry
Kropp et al. 2026/03: mental fatigue from excessive AI oversight increases minor errors +11%, major errors +39%; cognit…
- AI Native Product Cadence
Cat Wu's 6mo→1mo→1day cadence at Anthropic: research-preview branding, mission-as-tiebreaker, evergreen launch room, li…
- AI-Native Startup Lifecycle
Anthropic's May 2026 reframing of Idea/MVP/Launch/Scale assuming AI infrastructure: each stage's headcount/capital/skil…
- Opinions on Using AI Tools & the Future of the Software Engineering Role
Debate map of four stances on using AI tools (bullish-insider / pragmatist-practitioner / skeptic-governance / architec…
- Claude Code
Anthropic's agentic coding product; created by Boris Cherny late 2024; TypeScript/React; CLI/desktop/web/mobile/IDE sur…
- Compounding Data Moat
Anthropic's prescription for Scale-stage defensibility: time-locked behavioral fingerprint + domain-encoded edge cases…
- Cowork
Anthropic's non-code knowledge-work agent product; sibling to Claude Code; output is decks/inbox/dossiers; same MCP/com…
- Engineer PM Convergence
Generalists across disciplines; product taste as bottleneck skill; Anthropic Claude Code team as case study; "just do t…
- Founder as Agent Orchestrator
Founder role shift: less individual contributor, more orchestrator of specialized AI assistants; non-technical founders…
- Human-AI Accountability Redesign
HBR five-pillar prescription: span-of-control redesign, role redesign, performance management reset, decision-rights/es…
- Human-in-the-Loop Boundaries
Humans belong at allocation, understanding, design-concept, risk, and accountability boundaries; they slow the system d…
- Interaction Models
Thinking Machines Lab (May 2026): models that handle audio/video/text interaction natively in real time instead of via…
- Governance & Workforce
Map of Content for the governance-workforce domain — 11 concepts. Curated entry point; see Home for all domains.
- Orchestration vs Employee Framing: Reconciling the Founder's Playbook with HBR's Accountability Evidence
Reconciles the Founder's Playbook orchestration framings with HBR Kropp et al.'s accountability evidence; "orchestratio…
- Problem-Solution Fit Discipline
Idea-stage thesis: three defenses against premature building (time, resources, belief friction) all eroded; AI as devil…
- Turn-Based Interface Bottleneck
Why current AI interfaces limit collaboration: single-thread turn-taking is a bandwidth bottleneck; humans pushed out b…
Related articles
- Human-AI Accountability Redesign
HBR five-pillar prescription: span-of-control redesign, role redesign, performance management reset, decision-rights/es…
- Claude Code
Anthropic's agentic coding product; created by Boris Cherny late 2024; TypeScript/React; CLI/desktop/web/mobile/IDE sur…
- Harness Shrinkage as Models Improve
Prompt scaffolding shrinks each model release; Cat Wu's pruning discipline; Boris Cherny "100 lines of code a year from…
- Anthropic
AI safety company / vendor of Claude; mission-as-tiebreaker culture; ~30–40 PMs across teams; Mike Krieger leads Labs r…
- Founder as Agent Orchestrator
Founder role shift: less individual contributor, more orchestrator of specialized AI assistants; non-technical founders…
