犀牛急救 · 客户发掘系统 — 真实业务可行性分析

分析日期：2026-02-11
分析对象：lead-discovery 前端 Demo 全部 7 个页面 + 2 个服务
分析维度：每个功能模块的设计意图 → 当前实现 → 技术可行性 → 落地差距 → 建议方案

一、系统全局架构评估

当前架构

Angular 19 SPA（纯前端）
├── MockDataService        ← 所有数据硬编码，无后端
├── QuickScreenService     ← 模拟 AI 分类，规则写死
├── EML 解析 API           ← 唯一的真实外部服务调用
└── 7 个页面组件            ← 纯展示 + 本地状态操作

核心问题

维度	现状	生产要求
数据持久化	内存中的硬编码数组，刷新即丢	数据库 + API
AI 能力	if-else 关键词匹配	LLM / ML 模型
邮件接入	硬编码 6 封模拟邮件	IMAP/SMTP 或邮件网关
多用户	无认证、无权限	登录 + RBAC
数据来源	仅邮件 + 手动录入	展会、平台 API、爬虫等

二、逐页面/模块深度分析

1. AI 仪表盘（Dashboard）

设计意图：一屏展示 AI 每日批量处理结果，销售人员只需验证。

✅ 可行的部分

功能	可行性	说明
今日统计卡片（新线索/待验证/已确认/管线总值）	✅ 完全可行	标准 BI 聚合查询，任何数据库都能支持
AI 批次状态展示	✅ 可行	需要后端任务调度系统（如 Celery / BullMQ）
待验证线索列表 + 确认/无效操作	✅ 可行	标准 CRUD，加上状态机流转
画像分布柱状图	✅ 可行	简单的 GROUP BY 聚合

⚠️ 需要补足的部分

功能	当前状态	落地所需
"AI 每日批量处理"	硬编码的 `discoveryBatches` 数组	真实的定时任务系统：每日凌晨拉取新邮件 → 调用 LLM 分类 → 写入数据库 → 生成批次报告
最近活动流	硬编码 6 条假数据	需要事件总线 / 操作日志表
画像分类准确性	if-else 关键词匹配	需要 LLM（GPT-4o / Claude）或微调模型

💡 技术建议

定时批处理：使用 Node.js + BullMQ 或 Python + Celery，每日 08:00 触发
AI 分类：GPT-4o 的 structured output 模式，输入邮件正文，输出 {persona, grade, confidence, keywords}
预估成本：每封邮件约 $0.01-0.03（GPT-4o-mini），日均 50 封 ≈ $0.5-1.5/天

2. 邮件收件箱（Inbox）

设计意图：接收邮件 → 快速筛选 → 创建线索的核心工作流。

✅ 可行的部分

功能	可行性	说明
邮件列表 + 详情阅读	✅ 可行	对接 IMAP 协议即可（如 Gmail API / Microsoft Graph）
附件展示与下载	✅ 可行	邮件附件存储到 OSS/S3
EML 文件导入 + 解析	✅ 已实现	已对接 `eml.brainwork.club` API，含附件分析和产品需求提取
快速筛选 → 创建线索	✅ 可行	筛选逻辑替换为 LLM 调用即可
批量筛选	✅ 可行	并发调用 LLM API + 进度反馈

⚠️ 需要补足的部分

功能	当前状态	落地所需
邮件实时接收	硬编码 6 封模拟邮件	IMAP 轮询 / Webhook（Gmail Push / Microsoft Graph Subscription）
快速筛选 AI	`classifyByDomain()` 用 if-else	替换为 LLM API 调用，Prompt 中嵌入 6 个画像定义
筛选结果持久化	内存操作，刷新丢失	后端 API + 数据库
EML 导入后的线索关联	创建了线索但未持久化	需要后端存储

💡 技术建议

邮件接入方案对比：

方案	复杂度	实时性	推荐场景
IMAP 轮询（每 5 分钟）	低	中	MVP 阶段
Gmail API + Pub/Sub	中	高	用 Gmail 的团队
Microsoft Graph + Webhook	中	高	用 Outlook 的团队
自建邮件网关（Postfix）	高	最高	需要完全控制

AI 筛选 Prompt 设计（已有良好基础）：

你是一个外贸线索分类专家。根据以下邮件内容，判断客户画像：
P1-医药分销商 / P2-工业安全供应商 / P3-政府机构采购 / P4-品牌OEM / P5-电商零售 / P6-低质量

输出 JSON：{ persona, personaLabel, valueGrade, confidence, matchedKeywords[], mainBusiness }

EML 导入已具备真实能力：当前的 EML 解析 API 是整个系统中唯一真正可用的外部服务，可直接用于生产

3. 线索看板（Kanban）

设计意图：多维度可视化线索状态，支持按等级/画像/阶段三种视图。

✅ 可行的部分

功能	可行性	说明
三种看板视图切换	✅ 完全可行	纯前端 UI 逻辑，数据从 API 获取即可
按客户类型过滤	✅ 可行	标准筛选查询
线索卡片展示	✅ 可行	数据模型设计合理

⚠️ 需要补足的部分

功能	当前状态	落地所需
拖拽排序/移动阶段	❌ 未实现	需要 Angular CDK DragDrop + 后端状态更新 API
实时协作	❌ 无	WebSocket / SSE 推送（多人同时操作看板）
数据持久化	内存数据	后端 API

💡 技术建议

看板的 UI 设计已经很成熟，落地成本低
拖拽功能用 @angular/cdk/drag-drop 即可，约 1-2 天工作量
建议先不做实时协作，MVP 阶段用乐观更新 + 冲突提示

4. 线索管理（Lead List）

设计意图：全量线索的表格视图 + 按画像分组 + 统计面板。

✅ 可行的部分

功能	可行性	说明
列表视图 + 搜索过滤	✅ 完全可行	标准数据表格
按画像分组视图	✅ 可行	前端分组 + 折叠
统计视图（画像/等级/阶段分布）	✅ 可行	后端聚合查询

⚠️ 需要补足的部分

功能	当前状态	落地所需
分页	❌ 无（全量加载）	线索量超过 100 条后必须分页
排序	❌ 无	服务端排序
批量操作	❌ 无	批量确认/批量分配/批量导出
导出 Excel	❌ 无	后端生成 + 下载

💡 技术建议

数据量 < 500 条时前端分页足够，> 500 条需服务端分页
建议增加「导出 Excel」功能，外贸团队强需求

5. 线索详情（Lead Detail）

设计意图：单条线索的全景视图 + AI 画像分析 + 销售验证 + 产品推荐 + 跟进管理。

✅ 可行的部分

功能	可行性	说明
客户画像分析卡片	✅ 可行	数据结构完善，展示逻辑清晰
快速筛选结果展示	✅ 可行	已有完整的数据模型
销售验证表单（确认/修改画像）	✅ 高价值	人工反馈 → 可用于微调 AI 模型
跟进阶段时间线	✅ 可行	状态机设计合理
推荐产品列表	✅ 可行	基于客户类型的规则匹配

⚠️ 需要补足的部分

功能	当前状态	落地所需
AI 调研报告	硬编码模拟文本	需要真实的 AI 调研流程（见下方详述）
"深度分析"按钮	点击后弹 SnackBar "Phase 3 上线"	需要实现完整的深度分析 Pipeline
验证结果反馈循环	仅修改前端状态	需要存储反馈 → 定期用反馈数据优化 AI 模型

💡 AI 调研报告的真实实现方案

这是系统中技术挑战最大的功能：

触发深度分析
    ↓
Step 1: 抓取公司官网（Puppeteer / Playwright）
    ↓
Step 2: 提取关键信息（LLM 结构化提取）
    - 公司规模、主营业务、产品线
    - 联系方式、社交媒体
    ↓
Step 3: 产品匹配分析（LLM + 本地产品库）
    - 匹配我方产品 → 客户需求
    - 计算利润空间
    ↓
Step 4: 竞品分析（可选，需要爬虫）
    ↓
Step 5: 生成销售策略建议（LLM）
    ↓
输出结构化报告（3-5 分钟）

技术可行性：✅ 可行，但需要注意：

官网抓取可能被反爬（需要代理池）
耗时较长（3-5 分钟），需要异步任务 + 进度推送
LLM 调用成本：每次深度分析约 $0.05-0.15

6. 客户画像知识库（Personas）

设计意图：定义和管理 6 类客户画像，作为 AI 分类的知识基础。

✅ 可行的部分

功能	可行性	说明
6 类画像定义展示	✅ 设计优秀	P1-P6 的定义、关键词、策略体系完整
AI 行动规则（4 步流程）	✅ 可行	可直接作为 LLM Prompt 的一部分
销售经验备注（可添加）	✅ 高价值	团队知识沉淀，可反哺 AI
代表线索预览	✅ 可行	简单查询

⚠️ 需要补足的部分

功能	当前状态	落地所需
画像定义编辑	硬编码在 `lead.model.ts`	需要后端 CRUD API，支持管理员编辑画像规则
关键词管理	固定数组	支持增删改关键词，修改后实时影响 AI 分类
经验备注持久化	仅内存操作	需要数据库存储
画像效果统计	硬编码的 `leadCount` 和 `conversionRate`	需要从真实数据计算

💡 技术建议

画像知识库是整个系统的核心资产，当前的 6 类画像定义质量很高
建议将画像定义存入数据库，作为 LLM Prompt 的动态模板
销售经验备注可以用 RAG（检索增强生成）方式注入 AI 上下文

7. 产品目录（Product Catalog）

设计意图：展示公司产品线，支持搜索和按客户类型过滤。

✅ 可行的部分

功能	可行性	说明
产品卡片展示	✅ 完全可行	标准商品目录
搜索 + 客户类型过滤	✅ 可行	简单查询
价格展示（批发/零售）	✅ 可行	—

⚠️ 需要补足的部分

功能	当前状态	落地所需
产品图片	❌ 无图片	需要产品图片上传和 CDN
库存状态	❌ 无	对接 ERP/库存系统
价格策略	固定价格	阶梯价格、客户专属价格
产品编辑	硬编码	后台管理界面

8. 快速筛选服务（QuickScreenService）

设计意图：模拟 AI 对邮件/手动输入进行快速分类。

当前实现 vs 真实需求

维度	当前（模拟）	生产（真实）
分类方法	`classifyByDomain()` — 关键词 if-else	LLM API 调用（GPT-4o / Claude）
国家识别	域名后缀推断（`.de` → DE）	IP 地理定位 + LLM 推断
置信度	硬编码数值	LLM 自评估 + 历史校准
产品推荐	按客户类型固定映射	LLM 理解需求 → 语义匹配产品库
耗时	`simulateDelay(1500ms)`	真实 LLM 调用 2-5 秒

💡 真实实现方案

// 生产环境的 screenEmail 伪代码
async screenEmail(email: Email): Promise<QuickScreenResult> {
  // 1. 调用 LLM 进行结构化分析
  const llmResult = await this.openai.chat.completions.create({
    model: 'gpt-4o-mini',
    response_format: { type: 'json_schema', schema: screenResultSchema },
    messages: [
      { role: 'system', content: this.buildSystemPrompt() },  // 包含 6 个画像定义
      { role: 'user', content: `邮件主题：${email.subject}\n正文：${email.body}` }
    ]
  });

  // 2. 解析结果
  const parsed = JSON.parse(llmResult.choices[0].message.content);

  // 3. 基于画像匹配产品（规则 + 语义混合）
  const products = await this.matchProducts(parsed.persona, email.body);

  return { ...parsed, suggestedProducts: products };
}

可行性：✅ 完全可行，GPT-4o-mini 的 JSON 模式输出稳定，成本低（$0.01/次）

三、核心 AI 能力可行性总结

AI 功能	技术成熟度	准确率预估	成本/次	建议
邮件画像分类（P1-P6）	⭐⭐⭐⭐⭐	85-92%	$0.01	GPT-4o-mini，Prompt 中嵌入画像定义
价值等级评估（S/A/B/C）	⭐⭐⭐⭐	80-88%	同上	与画像分类一起输出
关键词提取	⭐⭐⭐⭐⭐	90%+	同上	LLM 原生能力
产品需求提取（从邮件）	⭐⭐⭐⭐	85%+	$0.02	已有 EML API 支持
官网抓取 + 分析	⭐⭐⭐	75-85%	$0.05-0.15	需要 Puppeteer + LLM，反爬是挑战
竞品分析	⭐⭐	60-75%	$0.10+	数据源有限，建议作为辅助参考
销售话术生成	⭐⭐⭐⭐	N/A	$0.02	LLM 强项，但需要人工审核

四、数据源接入可行性

当前系统支持的线索来源

来源	代码中的 source 值	当前状态	真实接入方案
邮件	`'email'`	✅ 有 EML 导入 + 模拟收件箱	IMAP 轮询 / Gmail API
手动录入	`'manual'`	✅ 有表单	已可用
展会	`'exhibition'`	❌ 仅硬编码	批量 CSV 导入 / 名片 OCR
平台	`'platform'`	❌ 仅硬编码	阿里国际站 API / Made-in-China API
AI 发现	`'ai_discovery'`	❌ 仅定义，无实现	定时爬虫 + LLM 筛选

各来源接入难度

来源	难度	工期	说明
邮件（IMAP）	⭐⭐	1-2 周	成熟方案，`imapflow` 库
邮件（Gmail API）	⭐⭐	1 周	需要 OAuth 2.0
CSV 批量导入	⭐	2-3 天	前端解析 + 后端存储
阿里国际站	⭐⭐⭐	2-3 周	需要开放平台账号 + API 对接
名片 OCR	⭐⭐	1 周	用现成 OCR API（百度/腾讯）
网络爬虫发现	⭐⭐⭐⭐	3-4 周	反爬、数据清洗、法律合规

五、落地路线图建议

Phase 1：MVP（4-6 周）— 让系统真正能用

✅ 后端 API + 数据库（NestJS/Express + PostgreSQL）
✅ 用户认证（JWT）
✅ 邮件接入（IMAP 轮询，每 5 分钟）
✅ AI 快速筛选（GPT-4o-mini 替换 if-else）
✅ 线索 CRUD + 持久化
✅ EML 导入（已有，保留）
✅ CSV 批量导入（展会/平台线索）

Phase 2：增强（3-4 周）— 提升效率

✅ AI 每日批量处理（定时任务）
✅ 看板拖拽
✅ 画像知识库可编辑
✅ 产品目录管理后台
✅ 销售验证反馈收集
✅ 数据导出（Excel）

Phase 3：智能化（4-6 周）— AI 深度能力

✅ AI 深度调研报告（官网抓取 + 分析）
✅ 产品语义匹配（向量搜索）
✅ 销售话术自动生成
✅ 基于反馈的模型优化
✅ 平台 API 对接（阿里国际站等）

六、结论

整体评价

维度	评分	说明
业务逻辑设计	⭐⭐⭐⭐⭐	画像体系、分类流程、跟进阶段设计专业且完整
数据模型	⭐⭐⭐⭐⭐	Lead / Email / Product / Persona 模型覆盖全面
UI/UX 质量	⭐⭐⭐⭐	Material Design 风格统一，交互流畅
AI 功能真实性	⭐⭐	核心 AI 全部是模拟，需要替换为真实 LLM
数据持久化	⭐	无后端，刷新全丢
生产就绪度	⭐⭐	优秀的原型，但距离生产还需 Phase 1 的全部工作

一句话总结

这是一个业务逻辑设计极其优秀的原型系统。 画像体系（P1-P6）、分类流程、产品匹配规则都经过深思熟虑，可直接指导生产开发。当前最大的差距是缺少后端和真实 AI 能力，但所有设计的功能在 2026 年的技术条件下均可实现，核心 AI 分类功能使用 GPT-4o-mini 即可达到 85%+ 准确率，成本可控（日均 $1-3）。建议按 Phase 1 → 2 → 3 的路线图推进，4-6 周即可交付可用的 MVP。

FEASIBILITY_ANALYSIS.md 16 KB Permalink History Raw

犀牛急救 · 客户发掘系统 — 真实业务可行性分析

一、系统全局架构评估

当前架构

核心问题

二、逐页面/模块深度分析

1. AI 仪表盘（Dashboard）

✅ 可行的部分

⚠️ 需要补足的部分

💡 技术建议

2. 邮件收件箱（Inbox）

✅ 可行的部分

⚠️ 需要补足的部分

💡 技术建议

3. 线索看板（Kanban）

✅ 可行的部分

⚠️ 需要补足的部分

💡 技术建议

4. 线索管理（Lead List）

✅ 可行的部分

⚠️ 需要补足的部分

💡 技术建议

5. 线索详情（Lead Detail）

✅ 可行的部分

⚠️ 需要补足的部分

💡 AI 调研报告的真实实现方案

6. 客户画像知识库（Personas）

✅ 可行的部分

⚠️ 需要补足的部分

💡 技术建议

7. 产品目录（Product Catalog）

✅ 可行的部分

⚠️ 需要补足的部分

8. 快速筛选服务（QuickScreenService）

当前实现 vs 真实需求

💡 真实实现方案

三、核心 AI 能力可行性总结

四、数据源接入可行性

当前系统支持的线索来源

各来源接入难度

五、落地路线图建议

Phase 1：MVP（4-6 周）— 让系统真正能用

Phase 2：增强（3-4 周）— 提升效率

Phase 3：智能化（4-6 周）— AI 深度能力

六、结论

整体评价

一句话总结

FEASIBILITY_ANALYSIS.md 16 KB

Permalink History Raw