80 lines
4.4 KiB
Markdown
80 lines
4.4 KiB
Markdown
# Agent-Native 创作平台:交互与架构重构
|
||
|
||
基于你的需求,我们将平台从“工具流”升级为 **"Agent-Native" 协作平台**。核心理念是:**用户是导演,Agent 是制片人兼编剧团队,系统是数字化片场。**
|
||
|
||
## 1. 核心交互范式转变
|
||
|
||
| 传统模式 (Terminal/Form) | Agent-Native 模式 (Interactive Canvas) |
|
||
| :--- | :--- |
|
||
| **即时响应** | **异步长流程 (Long-Running Process)** |
|
||
| 用户等待 spinner 转圈 | Agent 在后台工作,实时推送进度卡片 |
|
||
| 审核是“通过/拒绝”按钮 | 审核是 **"待办任务 (Inbox)"** 和 **"批注 (Annotation)"** |
|
||
| 记忆是后台数据库 | 记忆是 **"可视化知识图谱"**,Agent 主动引用并展示 |
|
||
|
||
## 2. 关键流程设计
|
||
|
||
### 2.1 项目启动 (Onboarding)
|
||
* **保持不变**: 支持上传剧本/灵感/文字。
|
||
* **新增**: Agent 立即介入,进行 **"初始设定构建"**。
|
||
* Agent: "收到你的灵感。我正在生成初步的世界观和人物小传... 完成。请确认或修改。" (推送一个可交互的设定卡片)
|
||
|
||
### 2.2 剧集创作 (Execution & Planning)
|
||
* **用户动作**: 点击 "开始创作第 X 集"。
|
||
* **Agent 行为**:
|
||
1. **规划 (Planning)**: Agent 生成一个 "创作计划书" (ToDo List)。
|
||
* *示例*: "1. 回顾上一集伏笔; 2. 构思本集大纲; 3. 撰写初稿; 4. 自查一致性。"
|
||
2. **透明化执行**: 用户在界面右侧看到 Agent 正在打钩完成这些步骤。
|
||
3. **流式输出**: 左侧编辑器实时显示 Agent 正在写的内容 (Ghost-writing)。
|
||
|
||
### 2.3 记忆系统 (Active Memory) - "Agent 记得什么"
|
||
* **不是后台黑盒**,而是 **前台高亮**。
|
||
* **交互**: 当 Agent 写到 "主角拔出了那把生锈的剑" 时,界面侧边栏自动弹出记忆卡片:
|
||
* *记忆引用*: "关联记忆: EP01 - 主角在废墟中捡到了生锈的剑 (Confidence: 98%)"
|
||
* **作用**: 让用户知道 Agent 是基于记忆在写作,而不是瞎编。
|
||
|
||
### 2.4 审核系统 (Human-in-the-Loop) - "导演请过目"
|
||
* **拒绝 Terminal 形式**: 不要让用户在聊天框里打 "通过"。
|
||
* **任务流形式**:
|
||
* Agent 发现潜在问题 (如: "这句台词可能有点OOC"),但它不确定。
|
||
* Agent **不中断流程**,而是生成一个 **"审核任务 (Review Task)"** 推送到用户的 **"导演信箱"**。
|
||
* 用户可以在方便时处理这些任务:点击 "忽略" (Agent 继续) 或 "修正" (Agent 根据修正重写)。
|
||
* **最终交付**: Agent 完成初稿后,提交 "验收申请"。系统自动跑一遍 `ReviewManager`,把高风险问题标记在文本上 (类似 Word 的批注)。
|
||
|
||
## 3. 页面架构重构
|
||
|
||
建议将 `ProjectWorkspace.tsx` 改造为 **三栏式布局**:
|
||
|
||
* **左栏 (Navigation & Context)**:
|
||
* 剧集列表
|
||
* **动态上下文**: 当前生效的世界观、活跃的人物状态 (随剧情进度变化)。
|
||
* **中栏 (Canvas - 创作区)**:
|
||
* **剧本编辑器**: 多人(人+AI) 协作编辑器。
|
||
* **流式内容**: Agent 的输出实时上屏。
|
||
* **批注层**: 审核系统发现的问题直接高亮显示。
|
||
* **右栏 (Agent Command Center - 导演控制台)**:
|
||
* **Chat**: 与 Agent 对话 ("把这段改得悲伤一点")。
|
||
* **Plan**: Agent 的当前执行计划 (Step 1/2/3)。
|
||
* **Inbox**: **需要用户决策的任务** (审核请求、分支选择、设定确认)。
|
||
|
||
## 4. 技术实现要点
|
||
|
||
### 4.1 异步任务与 WebSocket
|
||
* Agent 的运行是长流程 (可能持续几分钟)。
|
||
* 后端使用 Celery/TaskQueue 执行 Agent 逻辑。
|
||
* 前端通过 WebSocket 接收:
|
||
* `token`: 文本生成流。
|
||
* `plan_update`: 步骤状态变更。
|
||
* `memory_hit`: 记忆引用通知。
|
||
* `review_request`: 审核任务推送。
|
||
|
||
### 4.2 记忆与审核的 Tool 封装
|
||
* **Memory Tool**: 不仅返回文本,还返回 `metadata` (引用来源 ID),前端据此渲染引用卡片。
|
||
* **Review Tool**: 生成结构化的 `ReviewIssue` 对象,前端将其渲染为编辑器中的 **Annotation (批注)**。
|
||
|
||
---
|
||
|
||
### 总结
|
||
你的直觉非常敏锐。**Terminal 是给程序员用的,Dashboard 是给创作者用的。**
|
||
|
||
通过 **"任务流 (Inbox)"** 和 **"可视化批注"** 替代简单的对话交互,将记忆和审核无缝融入创作流,这才是真正的 Enterprise-grade Agent 平台。
|