# DataMate 知识图谱 - 实体关系图
> Schema 版本:1.0.0
> 更新日期:2026-02-17
## 核心实体关系总览
```mermaid
graph LR
%% 实体定义
Dataset["Dataset
数据集"]
Field["Field
字段"]
LabelTask["LabelTask
标注任务"]
Workflow["Workflow
工作流"]
Job["Job
作业"]
User["User
用户"]
Org["Org
组织"]
KnowledgeSet["KnowledgeSet
知识集"]
%% 关系连接
Dataset -->|HAS_FIELD| Field
Dataset -->|DERIVED_FROM| Dataset
Dataset -->|BELONGS_TO| Org
Job -->|USES_DATASET| Dataset
Job -->|PRODUCES| Dataset
Job -->|DEPENDS_ON| Job
Workflow -->|TRIGGERS| Job
Workflow -->|USES_DATASET| Dataset
LabelTask -->|USES_DATASET| Dataset
LabelTask -->|ASSIGNED_TO| User
User -->|BELONGS_TO| Org
Field -->|IMPACTS| Field
KnowledgeSet -->|SOURCED_FROM| Dataset
%% 样式
classDef dataAsset fill:#4A90D9,stroke:#2C5F8A,color:#fff,stroke-width:2px
classDef task fill:#7B68EE,stroke:#5A4CB5,color:#fff,stroke-width:2px
classDef actor fill:#50C878,stroke:#3A9B5B,color:#fff,stroke-width:2px
classDef knowledge fill:#FFB347,stroke:#CC8F39,color:#fff,stroke-width:2px
class Dataset,Field dataAsset
class LabelTask,Workflow,Job task
class User,Org actor
class KnowledgeSet knowledge
```
## 分领域视图
### 数据血缘视图
展示数据集之间的派生关系和字段级血缘。
```mermaid
graph TB
subgraph 源数据层
DS_RAW["Dataset
原始数据集"]
F1["Field: user_id"]
F2["Field: event_type"]
F3["Field: timestamp"]
end
subgraph 处理层
JOB_CLEAN["Job
清洗作业"]
JOB_SYNTH["Job
合成作业"]
end
subgraph 产出数据层
DS_CLEAN["Dataset
清洗后数据集"]
DS_SYNTH["Dataset
合成数据集"]
F1_CLEAN["Field: user_id"]
F4["Field: user_segment"]
end
DS_RAW -->|HAS_FIELD| F1
DS_RAW -->|HAS_FIELD| F2
DS_RAW -->|HAS_FIELD| F3
JOB_CLEAN -->|USES_DATASET| DS_RAW
JOB_CLEAN -->|PRODUCES| DS_CLEAN
JOB_SYNTH -->|USES_DATASET| DS_CLEAN
JOB_SYNTH -->|PRODUCES| DS_SYNTH
DS_CLEAN -->|DERIVED_FROM| DS_RAW
DS_SYNTH -->|DERIVED_FROM| DS_CLEAN
DS_CLEAN -->|HAS_FIELD| F1_CLEAN
DS_SYNTH -->|HAS_FIELD| F4
F1 -->|IMPACTS| F1_CLEAN
F1_CLEAN -->|IMPACTS| F4
classDef source fill:#E8F4FD,stroke:#4A90D9,color:#333
classDef process fill:#F3E8FF,stroke:#7B68EE,color:#333
classDef output fill:#E8FFF0,stroke:#50C878,color:#333
class DS_RAW,F1,F2,F3 source
class JOB_CLEAN,JOB_SYNTH process
class DS_CLEAN,DS_SYNTH,F1_CLEAN,F4 output
```
### 任务编排视图
展示工作流、作业和任务之间的编排关系。
```mermaid
graph LR
subgraph 工作流定义
WF_CLEAN["Workflow
清洗管道"]
WF_EVAL["Workflow
评估管道"]
end
subgraph 作业执行
JOB1["Job
清洗作业 #1"]
JOB2["Job
清洗作业 #2"]
JOB3["Job
评估作业"]
end
subgraph 标注任务
LT1["LabelTask
人工标注"]
LT2["LabelTask
自动标注"]
end
subgraph 人员
U1["User
张三"]
U2["User
李四"]
end
WF_CLEAN -->|TRIGGERS| JOB1
WF_CLEAN -->|TRIGGERS| JOB2
WF_EVAL -->|TRIGGERS| JOB3
JOB2 -->|DEPENDS_ON| JOB1
JOB3 -->|DEPENDS_ON| JOB2
LT1 -->|ASSIGNED_TO| U1
LT2 -->|ASSIGNED_TO| U2
classDef wf fill:#7B68EE,stroke:#5A4CB5,color:#fff
classDef job fill:#9B8FFF,stroke:#7B68EE,color:#fff
classDef task fill:#B8A9FF,stroke:#9B8FFF,color:#fff
classDef user fill:#50C878,stroke:#3A9B5B,color:#fff
class WF_CLEAN,WF_EVAL wf
class JOB1,JOB2,JOB3 job
class LT1,LT2 task
class U1,U2 user
```
### 组织归属视图
展示用户、数据集与组织的归属关系。
```mermaid
graph TB
subgraph 组织
ORG1["Org
数据工程部"]
ORG2["Org
AI研发部"]
end
subgraph 人员
U1["User: 张三"]
U2["User: 李四"]
U3["User: 王五"]
end
subgraph 数据资产
DS1["Dataset: 用户行为日志"]
DS2["Dataset: 医学影像集"]
DS3["Dataset: 训练数据集"]
end
U1 -->|BELONGS_TO| ORG1
U2 -->|BELONGS_TO| ORG1
U3 -->|BELONGS_TO| ORG2
DS1 -->|BELONGS_TO| ORG1
DS2 -->|BELONGS_TO| ORG2
DS3 -->|BELONGS_TO| ORG2
classDef org fill:#FFB347,stroke:#CC8F39,color:#fff
classDef user fill:#50C878,stroke:#3A9B5B,color:#fff
classDef data fill:#4A90D9,stroke:#2C5F8A,color:#fff
class ORG1,ORG2 org
class U1,U2,U3 user
class DS1,DS2,DS3 data
```
### 知识溯源视图
展示知识集与数据集的溯源关系。
```mermaid
graph LR
subgraph 数据源
DS1["Dataset
用户行为日志"]
DS2["Dataset
产品文档"]
end
subgraph 知识资产
KS1["KnowledgeSet
用户行为知识库"]
end
subgraph 标注
LT["LabelTask
知识标注"]
end
KS1 -->|SOURCED_FROM| DS1
KS1 -->|SOURCED_FROM| DS2
LT -->|USES_DATASET| DS1
classDef data fill:#4A90D9,stroke:#2C5F8A,color:#fff
classDef knowledge fill:#FFB347,stroke:#CC8F39,color:#fff
classDef task fill:#7B68EE,stroke:#5A4CB5,color:#fff
class DS1,DS2 data
class KS1 knowledge
class LT task
```
## 综合示例:完整数据流
展示从原始数据到知识资产的完整处理链路。
```mermaid
graph TB
%% 组织和人员
ORG["Org: 数据工程部"]
USER["User: 张三"]
%% 数据资产
DS_RAW["Dataset: 原始日志"]
DS_CLEAN["Dataset: 清洗数据"]
F_UID_RAW["Field: user_id (原始)"]
F_UID_CLEAN["Field: user_id (清洗)"]
%% 处理流程
WF["Workflow: 清洗管道"]
JOB["Job: 清洗作业"]
LT["LabelTask: 情感标注"]
%% 知识
KS["KnowledgeSet: 行为知识库"]
%% 组织归属
USER -->|BELONGS_TO| ORG
DS_RAW -->|BELONGS_TO| ORG
%% 数据结构
DS_RAW -->|HAS_FIELD| F_UID_RAW
DS_CLEAN -->|HAS_FIELD| F_UID_CLEAN
%% 处理链路
WF -->|TRIGGERS| JOB
JOB -->|USES_DATASET| DS_RAW
JOB -->|PRODUCES| DS_CLEAN
DS_CLEAN -->|DERIVED_FROM| DS_RAW
%% 字段血缘
F_UID_RAW -->|IMPACTS| F_UID_CLEAN
%% 任务分配
LT -->|USES_DATASET| DS_CLEAN
LT -->|ASSIGNED_TO| USER
%% 知识溯源
KS -->|SOURCED_FROM| DS_CLEAN
%% 样式
classDef org fill:#FFB347,stroke:#CC8F39,color:#fff,stroke-width:2px
classDef user fill:#50C878,stroke:#3A9B5B,color:#fff,stroke-width:2px
classDef data fill:#4A90D9,stroke:#2C5F8A,color:#fff,stroke-width:2px
classDef field fill:#87CEEB,stroke:#4A90D9,color:#333,stroke-width:1px
classDef process fill:#7B68EE,stroke:#5A4CB5,color:#fff,stroke-width:2px
classDef knowledge fill:#FF6B6B,stroke:#CC5555,color:#fff,stroke-width:2px
class ORG org
class USER user
class DS_RAW,DS_CLEAN data
class F_UID_RAW,F_UID_CLEAN field
class WF,JOB,LT process
class KS knowledge
```
## 图例
| 颜色 | 分类 | 包含实体 |
|------|------|---------|
| 蓝色 | 数据资产 | Dataset, Field |
| 紫色 | 任务/流程 | Workflow, Job, LabelTask |
| 绿色 | 人员 | User, Org |
| 橙色/红色 | 知识 | KnowledgeSet |