FEASIBILITY_ANALYSIS.md 16 KB

犀牛急救 · 客户发掘系统 — 真实业务可行性分析

分析日期:2026-02-11
分析对象:lead-discovery 前端 Demo 全部 7 个页面 + 2 个服务
分析维度:每个功能模块的设计意图 → 当前实现 → 技术可行性 → 落地差距 → 建议方案


一、系统全局架构评估

当前架构

Angular 19 SPA(纯前端)
├── MockDataService        ← 所有数据硬编码,无后端
├── QuickScreenService     ← 模拟 AI 分类,规则写死
├── EML 解析 API           ← 唯一的真实外部服务调用
└── 7 个页面组件            ← 纯展示 + 本地状态操作

核心问题

维度 现状 生产要求
数据持久化 内存中的硬编码数组,刷新即丢 数据库 + API
AI 能力 if-else 关键词匹配 LLM / ML 模型
邮件接入 硬编码 6 封模拟邮件 IMAP/SMTP 或邮件网关
多用户 无认证、无权限 登录 + RBAC
数据来源 仅邮件 + 手动录入 展会、平台 API、爬虫等

二、逐页面/模块深度分析


1. AI 仪表盘(Dashboard)

设计意图:一屏展示 AI 每日批量处理结果,销售人员只需验证。

✅ 可行的部分

功能 可行性 说明
今日统计卡片(新线索/待验证/已确认/管线总值) ✅ 完全可行 标准 BI 聚合查询,任何数据库都能支持
AI 批次状态展示 ✅ 可行 需要后端任务调度系统(如 Celery / BullMQ)
待验证线索列表 + 确认/无效操作 ✅ 可行 标准 CRUD,加上状态机流转
画像分布柱状图 ✅ 可行 简单的 GROUP BY 聚合

⚠️ 需要补足的部分

功能 当前状态 落地所需
"AI 每日批量处理" 硬编码的 discoveryBatches 数组 真实的定时任务系统:每日凌晨拉取新邮件 → 调用 LLM 分类 → 写入数据库 → 生成批次报告
最近活动流 硬编码 6 条假数据 需要事件总线 / 操作日志表
画像分类准确性 if-else 关键词匹配 需要 LLM(GPT-4o / Claude)或微调模型

💡 技术建议

  • 定时批处理:使用 Node.js + BullMQ 或 Python + Celery,每日 08:00 触发
  • AI 分类:GPT-4o 的 structured output 模式,输入邮件正文,输出 {persona, grade, confidence, keywords}
  • 预估成本:每封邮件约 $0.01-0.03(GPT-4o-mini),日均 50 封 ≈ $0.5-1.5/天

2. 邮件收件箱(Inbox)

设计意图:接收邮件 → 快速筛选 → 创建线索的核心工作流。

✅ 可行的部分

功能 可行性 说明
邮件列表 + 详情阅读 ✅ 可行 对接 IMAP 协议即可(如 Gmail API / Microsoft Graph)
附件展示与下载 ✅ 可行 邮件附件存储到 OSS/S3
EML 文件导入 + 解析 已实现 已对接 eml.brainwork.club API,含附件分析和产品需求提取
快速筛选 → 创建线索 ✅ 可行 筛选逻辑替换为 LLM 调用即可
批量筛选 ✅ 可行 并发调用 LLM API + 进度反馈

⚠️ 需要补足的部分

功能 当前状态 落地所需
邮件实时接收 硬编码 6 封模拟邮件 IMAP 轮询 / Webhook(Gmail Push / Microsoft Graph Subscription)
快速筛选 AI classifyByDomain() 用 if-else 替换为 LLM API 调用,Prompt 中嵌入 6 个画像定义
筛选结果持久化 内存操作,刷新丢失 后端 API + 数据库
EML 导入后的线索关联 创建了线索但未持久化 需要后端存储

💡 技术建议

  • 邮件接入方案对比
方案 复杂度 实时性 推荐场景
IMAP 轮询(每 5 分钟) MVP 阶段
Gmail API + Pub/Sub 用 Gmail 的团队
Microsoft Graph + Webhook 用 Outlook 的团队
自建邮件网关(Postfix) 最高 需要完全控制
  • AI 筛选 Prompt 设计(已有良好基础):

    你是一个外贸线索分类专家。根据以下邮件内容,判断客户画像:
    P1-医药分销商 / P2-工业安全供应商 / P3-政府机构采购 / P4-品牌OEM / P5-电商零售 / P6-低质量
    
    输出 JSON:{ persona, personaLabel, valueGrade, confidence, matchedKeywords[], mainBusiness }
    
  • EML 导入已具备真实能力:当前的 EML 解析 API 是整个系统中唯一真正可用的外部服务,可直接用于生产


3. 线索看板(Kanban)

设计意图:多维度可视化线索状态,支持按等级/画像/阶段三种视图。

✅ 可行的部分

功能 可行性 说明
三种看板视图切换 ✅ 完全可行 纯前端 UI 逻辑,数据从 API 获取即可
按客户类型过滤 ✅ 可行 标准筛选查询
线索卡片展示 ✅ 可行 数据模型设计合理

⚠️ 需要补足的部分

功能 当前状态 落地所需
拖拽排序/移动阶段 ❌ 未实现 需要 Angular CDK DragDrop + 后端状态更新 API
实时协作 ❌ 无 WebSocket / SSE 推送(多人同时操作看板)
数据持久化 内存数据 后端 API

💡 技术建议

  • 看板的 UI 设计已经很成熟,落地成本低
  • 拖拽功能用 @angular/cdk/drag-drop 即可,约 1-2 天工作量
  • 建议先不做实时协作,MVP 阶段用乐观更新 + 冲突提示

4. 线索管理(Lead List)

设计意图:全量线索的表格视图 + 按画像分组 + 统计面板。

✅ 可行的部分

功能 可行性 说明
列表视图 + 搜索过滤 ✅ 完全可行 标准数据表格
按画像分组视图 ✅ 可行 前端分组 + 折叠
统计视图(画像/等级/阶段分布) ✅ 可行 后端聚合查询

⚠️ 需要补足的部分

功能 当前状态 落地所需
分页 ❌ 无(全量加载) 线索量超过 100 条后必须分页
排序 ❌ 无 服务端排序
批量操作 ❌ 无 批量确认/批量分配/批量导出
导出 Excel ❌ 无 后端生成 + 下载

💡 技术建议

  • 数据量 < 500 条时前端分页足够,> 500 条需服务端分页
  • 建议增加「导出 Excel」功能,外贸团队强需求

5. 线索详情(Lead Detail)

设计意图:单条线索的全景视图 + AI 画像分析 + 销售验证 + 产品推荐 + 跟进管理。

✅ 可行的部分

功能 可行性 说明
客户画像分析卡片 ✅ 可行 数据结构完善,展示逻辑清晰
快速筛选结果展示 ✅ 可行 已有完整的数据模型
销售验证表单(确认/修改画像) 高价值 人工反馈 → 可用于微调 AI 模型
跟进阶段时间线 ✅ 可行 状态机设计合理
推荐产品列表 ✅ 可行 基于客户类型的规则匹配

⚠️ 需要补足的部分

功能 当前状态 落地所需
AI 调研报告 硬编码模拟文本 需要真实的 AI 调研流程(见下方详述)
"深度分析"按钮 点击后弹 SnackBar "Phase 3 上线" 需要实现完整的深度分析 Pipeline
验证结果反馈循环 仅修改前端状态 需要存储反馈 → 定期用反馈数据优化 AI 模型

💡 AI 调研报告的真实实现方案

这是系统中技术挑战最大的功能:

触发深度分析
    ↓
Step 1: 抓取公司官网(Puppeteer / Playwright)
    ↓
Step 2: 提取关键信息(LLM 结构化提取)
    - 公司规模、主营业务、产品线
    - 联系方式、社交媒体
    ↓
Step 3: 产品匹配分析(LLM + 本地产品库)
    - 匹配我方产品 → 客户需求
    - 计算利润空间
    ↓
Step 4: 竞品分析(可选,需要爬虫)
    ↓
Step 5: 生成销售策略建议(LLM)
    ↓
输出结构化报告(3-5 分钟)

技术可行性:✅ 可行,但需要注意:

  • 官网抓取可能被反爬(需要代理池)
  • 耗时较长(3-5 分钟),需要异步任务 + 进度推送
  • LLM 调用成本:每次深度分析约 $0.05-0.15

6. 客户画像知识库(Personas)

设计意图:定义和管理 6 类客户画像,作为 AI 分类的知识基础。

✅ 可行的部分

功能 可行性 说明
6 类画像定义展示 设计优秀 P1-P6 的定义、关键词、策略体系完整
AI 行动规则(4 步流程) ✅ 可行 可直接作为 LLM Prompt 的一部分
销售经验备注(可添加) 高价值 团队知识沉淀,可反哺 AI
代表线索预览 ✅ 可行 简单查询

⚠️ 需要补足的部分

功能 当前状态 落地所需
画像定义编辑 硬编码在 lead.model.ts 需要后端 CRUD API,支持管理员编辑画像规则
关键词管理 固定数组 支持增删改关键词,修改后实时影响 AI 分类
经验备注持久化 仅内存操作 需要数据库存储
画像效果统计 硬编码的 leadCountconversionRate 需要从真实数据计算

💡 技术建议

  • 画像知识库是整个系统的核心资产,当前的 6 类画像定义质量很高
  • 建议将画像定义存入数据库,作为 LLM Prompt 的动态模板
  • 销售经验备注可以用 RAG(检索增强生成)方式注入 AI 上下文

7. 产品目录(Product Catalog)

设计意图:展示公司产品线,支持搜索和按客户类型过滤。

✅ 可行的部分

功能 可行性 说明
产品卡片展示 ✅ 完全可行 标准商品目录
搜索 + 客户类型过滤 ✅ 可行 简单查询
价格展示(批发/零售) ✅ 可行

⚠️ 需要补足的部分

功能 当前状态 落地所需
产品图片 ❌ 无图片 需要产品图片上传和 CDN
库存状态 ❌ 无 对接 ERP/库存系统
价格策略 固定价格 阶梯价格、客户专属价格
产品编辑 硬编码 后台管理界面

8. 快速筛选服务(QuickScreenService)

设计意图:模拟 AI 对邮件/手动输入进行快速分类。

当前实现 vs 真实需求

维度 当前(模拟) 生产(真实)
分类方法 classifyByDomain() — 关键词 if-else LLM API 调用(GPT-4o / Claude)
国家识别 域名后缀推断(.de → DE) IP 地理定位 + LLM 推断
置信度 硬编码数值 LLM 自评估 + 历史校准
产品推荐 按客户类型固定映射 LLM 理解需求 → 语义匹配产品库
耗时 simulateDelay(1500ms) 真实 LLM 调用 2-5 秒

💡 真实实现方案

// 生产环境的 screenEmail 伪代码
async screenEmail(email: Email): Promise<QuickScreenResult> {
  // 1. 调用 LLM 进行结构化分析
  const llmResult = await this.openai.chat.completions.create({
    model: 'gpt-4o-mini',
    response_format: { type: 'json_schema', schema: screenResultSchema },
    messages: [
      { role: 'system', content: this.buildSystemPrompt() },  // 包含 6 个画像定义
      { role: 'user', content: `邮件主题:${email.subject}\n正文:${email.body}` }
    ]
  });

  // 2. 解析结果
  const parsed = JSON.parse(llmResult.choices[0].message.content);

  // 3. 基于画像匹配产品(规则 + 语义混合)
  const products = await this.matchProducts(parsed.persona, email.body);

  return { ...parsed, suggestedProducts: products };
}

可行性:✅ 完全可行,GPT-4o-mini 的 JSON 模式输出稳定,成本低($0.01/次)


三、核心 AI 能力可行性总结

AI 功能 技术成熟度 准确率预估 成本/次 建议
邮件画像分类(P1-P6) ⭐⭐⭐⭐⭐ 85-92% $0.01 GPT-4o-mini,Prompt 中嵌入画像定义
价值等级评估(S/A/B/C) ⭐⭐⭐⭐ 80-88% 同上 与画像分类一起输出
关键词提取 ⭐⭐⭐⭐⭐ 90%+ 同上 LLM 原生能力
产品需求提取(从邮件) ⭐⭐⭐⭐ 85%+ $0.02 已有 EML API 支持
官网抓取 + 分析 ⭐⭐⭐ 75-85% $0.05-0.15 需要 Puppeteer + LLM,反爬是挑战
竞品分析 ⭐⭐ 60-75% $0.10+ 数据源有限,建议作为辅助参考
销售话术生成 ⭐⭐⭐⭐ N/A $0.02 LLM 强项,但需要人工审核

四、数据源接入可行性

当前系统支持的线索来源

来源 代码中的 source 值 当前状态 真实接入方案
邮件 'email' ✅ 有 EML 导入 + 模拟收件箱 IMAP 轮询 / Gmail API
手动录入 'manual' ✅ 有表单 已可用
展会 'exhibition' ❌ 仅硬编码 批量 CSV 导入 / 名片 OCR
平台 'platform' ❌ 仅硬编码 阿里国际站 API / Made-in-China API
AI 发现 'ai_discovery' ❌ 仅定义,无实现 定时爬虫 + LLM 筛选

各来源接入难度

来源 难度 工期 说明
邮件(IMAP) ⭐⭐ 1-2 周 成熟方案,imapflow
邮件(Gmail API) ⭐⭐ 1 周 需要 OAuth 2.0
CSV 批量导入 2-3 天 前端解析 + 后端存储
阿里国际站 ⭐⭐⭐ 2-3 周 需要开放平台账号 + API 对接
名片 OCR ⭐⭐ 1 周 用现成 OCR API(百度/腾讯)
网络爬虫发现 ⭐⭐⭐⭐ 3-4 周 反爬、数据清洗、法律合规

五、落地路线图建议

Phase 1:MVP(4-6 周)— 让系统真正能用

✅ 后端 API + 数据库(NestJS/Express + PostgreSQL)
✅ 用户认证(JWT)
✅ 邮件接入(IMAP 轮询,每 5 分钟)
✅ AI 快速筛选(GPT-4o-mini 替换 if-else)
✅ 线索 CRUD + 持久化
✅ EML 导入(已有,保留)
✅ CSV 批量导入(展会/平台线索)

Phase 2:增强(3-4 周)— 提升效率

✅ AI 每日批量处理(定时任务)
✅ 看板拖拽
✅ 画像知识库可编辑
✅ 产品目录管理后台
✅ 销售验证反馈收集
✅ 数据导出(Excel)

Phase 3:智能化(4-6 周)— AI 深度能力

✅ AI 深度调研报告(官网抓取 + 分析)
✅ 产品语义匹配(向量搜索)
✅ 销售话术自动生成
✅ 基于反馈的模型优化
✅ 平台 API 对接(阿里国际站等)

六、结论

整体评价

维度 评分 说明
业务逻辑设计 ⭐⭐⭐⭐⭐ 画像体系、分类流程、跟进阶段设计专业且完整
数据模型 ⭐⭐⭐⭐⭐ Lead / Email / Product / Persona 模型覆盖全面
UI/UX 质量 ⭐⭐⭐⭐ Material Design 风格统一,交互流畅
AI 功能真实性 ⭐⭐ 核心 AI 全部是模拟,需要替换为真实 LLM
数据持久化 无后端,刷新全丢
生产就绪度 ⭐⭐ 优秀的原型,但距离生产还需 Phase 1 的全部工作

一句话总结

这是一个业务逻辑设计极其优秀的原型系统。 画像体系(P1-P6)、分类流程、产品匹配规则都经过深思熟虑,可直接指导生产开发。当前最大的差距是缺少后端和真实 AI 能力,但所有设计的功能在 2026 年的技术条件下均可实现,核心 AI 分类功能使用 GPT-4o-mini 即可达到 85%+ 准确率,成本可控(日均 $1-3)。建议按 Phase 1 → 2 → 3 的路线图推进,4-6 周即可交付可用的 MVP。