creative_studio/DESIGN_V2.md

4.4 KiB
Raw Permalink Blame History

Agent-Native 创作平台:交互与架构重构

基于你的需求,我们将平台从“工具流”升级为 "Agent-Native" 协作平台。核心理念是:用户是导演Agent 是制片人兼编剧团队,系统是数字化片场。

1. 核心交互范式转变

传统模式 (Terminal/Form) Agent-Native 模式 (Interactive Canvas)
即时响应 异步长流程 (Long-Running Process)
用户等待 spinner 转圈 Agent 在后台工作,实时推送进度卡片
审核是“通过/拒绝”按钮 审核是 "待办任务 (Inbox)""批注 (Annotation)"
记忆是后台数据库 记忆是 "可视化知识图谱"Agent 主动引用并展示

2. 关键流程设计

2.1 项目启动 (Onboarding)

  • 保持不变: 支持上传剧本/灵感/文字。
  • 新增: Agent 立即介入,进行 "初始设定构建"
    • Agent: "收到你的灵感。我正在生成初步的世界观和人物小传... 完成。请确认或修改。" (推送一个可交互的设定卡片)

2.2 剧集创作 (Execution & Planning)

  • 用户动作: 点击 "开始创作第 X 集"。
  • Agent 行为:
    1. 规划 (Planning): Agent 生成一个 "创作计划书" (ToDo List)。
      • 示例: "1. 回顾上一集伏笔; 2. 构思本集大纲; 3. 撰写初稿; 4. 自查一致性。"
    2. 透明化执行: 用户在界面右侧看到 Agent 正在打钩完成这些步骤。
    3. 流式输出: 左侧编辑器实时显示 Agent 正在写的内容 (Ghost-writing)。

2.3 记忆系统 (Active Memory) - "Agent 记得什么"

  • 不是后台黑盒,而是 前台高亮
  • 交互: 当 Agent 写到 "主角拔出了那把生锈的剑" 时,界面侧边栏自动弹出记忆卡片:
    • 记忆引用: "关联记忆: EP01 - 主角在废墟中捡到了生锈的剑 (Confidence: 98%)"
  • 作用: 让用户知道 Agent 是基于记忆在写作,而不是瞎编。

2.4 审核系统 (Human-in-the-Loop) - "导演请过目"

  • 拒绝 Terminal 形式: 不要让用户在聊天框里打 "通过"。
  • 任务流形式:
    • Agent 发现潜在问题 (如: "这句台词可能有点OOC"),但它不确定。
    • Agent 不中断流程,而是生成一个 "审核任务 (Review Task)" 推送到用户的 "导演信箱"
    • 用户可以在方便时处理这些任务:点击 "忽略" (Agent 继续) 或 "修正" (Agent 根据修正重写)。
  • 最终交付: Agent 完成初稿后,提交 "验收申请"。系统自动跑一遍 ReviewManager,把高风险问题标记在文本上 (类似 Word 的批注)。

3. 页面架构重构

建议将 ProjectWorkspace.tsx 改造为 三栏式布局

  • 左栏 (Navigation & Context):
    • 剧集列表
    • 动态上下文: 当前生效的世界观、活跃的人物状态 (随剧情进度变化)。
  • 中栏 (Canvas - 创作区):
    • 剧本编辑器: 多人(人+AI) 协作编辑器。
    • 流式内容: Agent 的输出实时上屏。
    • 批注层: 审核系统发现的问题直接高亮显示。
  • 右栏 (Agent Command Center - 导演控制台):
    • Chat: 与 Agent 对话 ("把这段改得悲伤一点")。
    • Plan: Agent 的当前执行计划 (Step 1/2/3)。
    • Inbox: 需要用户决策的任务 (审核请求、分支选择、设定确认)。

4. 技术实现要点

4.1 异步任务与 WebSocket

  • Agent 的运行是长流程 (可能持续几分钟)。
  • 后端使用 Celery/TaskQueue 执行 Agent 逻辑。
  • 前端通过 WebSocket 接收:
    • token: 文本生成流。
    • plan_update: 步骤状态变更。
    • memory_hit: 记忆引用通知。
    • review_request: 审核任务推送。

4.2 记忆与审核的 Tool 封装

  • Memory Tool: 不仅返回文本,还返回 metadata (引用来源 ID),前端据此渲染引用卡片。
  • Review Tool: 生成结构化的 ReviewIssue 对象,前端将其渲染为编辑器中的 Annotation (批注)

总结

你的直觉非常敏锐。Terminal 是给程序员用的Dashboard 是给创作者用的。

通过 "任务流 (Inbox)""可视化批注" 替代简单的对话交互,将记忆和审核无缝融入创作流,这才是真正的 Enterprise-grade Agent 平台。