feat：问题生成过程优化及COT数据生成优化 (#169)

* fix(chart): update Helm chart helpers and values for improved configuration * feat(SynthesisTaskTab): enhance task table with tooltip support and improved column widths * feat(CreateTask, SynthFileTask): improve task creation and detail view with enhanced payload handling and UI updates * feat(SynthFileTask): enhance file display with progress tracking and delete action * feat(SynthFileTask): enhance file display with progress tracking and delete action * feat(SynthDataDetail): add delete action for chunks with confirmation prompt * feat(SynthDataDetail): update edit and delete buttons to icon-only format * feat(SynthDataDetail): add confirmation modals for chunk and synthesis data deletion * feat(DocumentSplitter): add enhanced document splitting functionality with CJK support and metadata detection * feat(DataSynthesis): refactor data synthesis models and update task handling logic * feat(DataSynthesis): streamline synthesis task handling and enhance chunk processing logic * feat(DataSynthesis): refactor data synthesis models and update task handling logic * fix(generation_service): ensure processed chunks are incremented regardless of question generation success * feat(CreateTask): enhance task creation with new synthesis templates and improved configuration options * feat(CreateTask): enhance task creation with new synthesis templates and improved configuration options * feat(CreateTask): enhance task creation with new synthesis templates and improved configuration options * feat(CreateTask): enhance task creation with new synthesis templates and improved configuration options
2025-12-18 16:51:18 +08:00
parent 761f7f6a51
commit e0e9b1d94d
14 changed files with 1362 additions and 571 deletions
--- a/frontend/src/pages/SynthesisTask/CreateTask.tsx
+++ b/frontend/src/pages/SynthesisTask/CreateTask.tsx
@@ -1,7 +1,7 @@
 import { useEffect, useState } from "react";
 import type { Dataset, DatasetFile } from "@/pages/DataManagement/dataset.model";
-import { Steps, Card, Select, Input, Checkbox, Button, Form, message } from "antd";
-import { Eye, ArrowLeft, ArrowRight, Play, Search, MoreHorizontal } from "lucide-react";
+import { Steps, Card, Select, Input, Button, Form, message, Tag, Tooltip, InputNumber } from "antd";
+import { Eye, ArrowLeft, ArrowRight, Play, Search, Sparkles, Brain, Layers } from "lucide-react";
 import { Link, useNavigate } from "react-router";
 import { queryDatasetsUsingGet } from "../DataManagement/dataset.api";
 import DatasetFileTransfer from "@/components/business/DatasetFileTransfer";
@@ -31,13 +31,18 @@ export default function SynthesisTaskCreate() {
  const [selectedFiles, setSelectedFiles] = useState<string[]>([]);
  const [selectedMap, setSelectedMap] = useState<Record<string, DatasetFile>>({});
  const [selectedDataset, setSelectedDataset] = useState<Dataset | null>(null);
+  // 当前选中的模板类型（QA / COT），用于高亮展示
  const [selectedSynthesisTypes, setSelectedSynthesisTypes] = useState<string[]>(["qa"]);
  const [taskType, setTaskType] = useState<"qa" | "cot">("qa");
-  const [promptTemplate, setPromptTemplate] = useState<string>("");
+  const [questionPrompt, setQuestionPrompt] = useState<string>("");
+  const [answerPrompt, setAnswerPrompt] = useState<string>("");
  const [submitting, setSubmitting] = useState(false);
  const [modelOptions, setModelOptions] = useState<{ label: string; value: string }[]>([]);
  const [modelsLoading, setModelsLoading] = useState(false);
-  const [selectedModel, setSelectedModel] = useState<string | undefined>(undefined);
+  const [questionModelId, setQuestionModelId] = useState<string | undefined>(undefined);
+  const [answerModelId, setAnswerModelId] = useState<string | undefined>(undefined);
+
+  // 文本切片配置
  const [sliceConfig, setSliceConfig] = useState({
    processType: "DEFAULT_CHUNK" as
      | "DEFAULT_CHUNK"
@@ -45,10 +50,23 @@ export default function SynthesisTaskCreate() {
      | "PARAGRAPH_CHUNK"
      | "FIXED_LENGTH_CHUNK"
      | "CUSTOM_SEPARATOR_CHUNK",
-    chunkSize: 500,
-    overlapSize: 50,
+    chunkSize: 3000,
+    overlapSize: 100,
    delimiter: "",
  });
+
+  // 问题/答案合成配置（与后端 question_synth_config / answer_synth_config 对齐）
+  const [questionConfig, setQuestionConfig] = useState({
+    number: 1,
+    temperature: 0.7,
+  });
+  const [answerConfig, setAnswerConfig] = useState({
+    // 答案侧不再需要 number，只保留温度
+    temperature: 0.7,
+  });
+  // 合成总数上限，默认 5000
+  const [maxQaPairs, setMaxQaPairs] = useState<number | undefined>(5000);
+
  const sliceOptions = [
    { label: "默认分块", value: "DEFAULT_CHUNK" },
    { label: "按章节分块", value: "CHAPTER_CHUNK" },
@@ -62,33 +80,43 @@ export default function SynthesisTaskCreate() {
    return data;
  };

-  const fetchPrompt = async (type: "qa" | "cot") => {
+  // 问题 Prompt：固定使用 QUESTION 类型获取
+  const fetchQuestionPrompt = async () => {
    try {
-      const synthTypeParam = type.toUpperCase();
-      const res = await getPromptByTypeUsingGet(synthTypeParam);
+      const res = await getPromptByTypeUsingGet("QUESTION");
      const prompt = typeof res === "string" ? res : (res as { data?: string })?.data ?? "";
-      setPromptTemplate(prompt || "");
+      setQuestionPrompt(prompt || "");
    } catch (e) {
      console.error(e);
-      message.error("获取提示词模板失败");
-      setPromptTemplate("");
+      message.error("获取问题 Prompt 模板失败");
+      setQuestionPrompt("");
    }
  };

-  useEffect(() => {
-    fetchDatasets();
-  }, []);
-
-  useEffect(() => {
-    fetchPrompt(taskType);
-  }, [taskType]);
+  // 答案 Prompt：根据当前任务类型获取 QA/COT 模板
+  const fetchAnswerPrompt = async (type: "qa" | "cot") => {
+    try {
+      const synthTypeParam = type === "qa" ? "QA" : "COT";
+      const res = await getPromptByTypeUsingGet(synthTypeParam);
+      const prompt = typeof res === "string" ? res : (res as { data?: string })?.data ?? "";
+      setAnswerPrompt(prompt || "");
+    } catch (e) {
+      console.error(e);
+      message.error("获取答案 Prompt 模板失败");
+      setAnswerPrompt("");
+    }
+  };

+  // 拉取模型列表，仅保留 CHAT 模型
  useEffect(() => {
    const loadModels = async () => {
      setModelsLoading(true);
      try {
        const { data } = await queryModelListUsingGet({ page: 0, size: 1000 });
-        const options = (data?.content || []).map((model: ModelI) => ({
+        const chatModels: ModelI[] = (data?.content || []).filter(
+          (model: ModelI) => model.type === "CHAT"
+        );
+        const options = chatModels.map((model) => ({
          label: `${model.modelName} (${model.provider})`,
          value: model.id,
        }));
@@ -102,11 +130,22 @@ export default function SynthesisTaskCreate() {
    loadModels();
  }, []);

+  // 默认选中第一个 CHAT 模型作为问题/答案模型
  useEffect(() => {
-    if (!selectedModel && modelOptions.length > 0) {
-      setSelectedModel(modelOptions[0].value);
+    if (modelOptions.length > 0) {
+      setQuestionModelId((prev) => prev ?? modelOptions[0].value);
+      setAnswerModelId((prev) => prev ?? modelOptions[0].value);
    }
-  }, [modelOptions, selectedModel]);
+  }, [modelOptions]);
+
+  useEffect(() => {
+    fetchDatasets();
+  }, []);
+
+  useEffect(() => {
+    fetchQuestionPrompt();
+    fetchAnswerPrompt(taskType);
+  }, [taskType]);

  // 表单数据
  const [formValues, setFormValues] = useState<CreateTaskFormValues>({
@@ -131,13 +170,12 @@ export default function SynthesisTaskCreate() {
  const handleCreateTask = async () => {
    try {
      const values = (await form.validateFields()) as CreateTaskFormValues;
-      // precise validation
      if (!(taskType === "qa" || taskType === "cot")) {
        message.error("请选择一个合成类型");
        return;
      }
-      if (!selectedModel) {
-        message.error("请选择模型");
+      if (!questionModelId || !answerModelId) {
+        message.error("请选择问题和答案使用的模型");
        return;
      }
      if (selectedFiles.length === 0) {
@@ -145,25 +183,42 @@ export default function SynthesisTaskCreate() {
        return;
      }

-      // 构造后端要求的参数格式
-      const payload: Record<string, unknown> = {
-        name: values.name || form.getFieldValue("name"),
-        model_id: selectedModel,
-        source_file_id: selectedFiles,
+      const synthConfig: Record<string, unknown> = {
        text_split_config: {
          chunk_size: sliceConfig.chunkSize,
          chunk_overlap: sliceConfig.overlapSize,
        },
-        synthesis_config: {
-          prompt_template: promptTemplate,
+        question_synth_config: {
+          model_id: questionModelId,
+          prompt_template: questionPrompt,
+          number: questionConfig.number,
+          temperature: questionConfig.temperature,
        },
-        synthesis_type: taskType === "qa" ? "QA" : "COT",
+        answer_synth_config: {
+          model_id: answerModelId,
+          prompt_template: answerPrompt,
+          temperature: answerConfig.temperature,
+        },
+        max_qa_pairs: typeof maxQaPairs === "number" && maxQaPairs > 0 ? maxQaPairs : undefined,
      };

-      // 只有在有真实内容时携带 description，避免强制传空字符串
-      const desc = values.description ?? form.getFieldValue("description");
-      if (typeof desc === "string" && desc.trim().length > 0) {
-        payload.description = desc.trim();
+      const payload: Record<string, unknown> = {
+        name: values.name || form.getFieldValue("name"),
+        description: values.description ?? form.getFieldValue("description"),
+        synthesis_type: taskType === "qa" ? "QA" : "COT",
+        source_file_id: selectedFiles,
+        synth_config: synthConfig,
+      };
+
+      // 清洗 description：空字符串转为 undefined，让后端用 validator 处理为 None
+      const desc = payload.description;
+      if (typeof desc === "string" && desc.trim().length === 0) {
+        delete payload.description;
+      }
+
+      // 如果未设置 max_qa_pairs，则从 synth_config 中移除该字段，避免传递 undefined
+      if (synthConfig.max_qa_pairs === undefined) {
+        delete (synthConfig as { max_qa_pairs?: number }).max_qa_pairs;
      }

      setSubmitting(true);
@@ -187,25 +242,43 @@ export default function SynthesisTaskCreate() {
        return;
      }
      console.error(error);
-      message.error((error instanceof Error ? error.message : "合成任务创建失败"));
+      message.error(error instanceof Error ? error.message : "合成任务创建失败");
    } finally {
      setSubmitting(false);
    }
  };

-  // 仅两个一级类型，无二级目录
-  const synthesisTypes = [
-    { id: "qa", name: "生成问答对" },
-    { id: "cot", name: "生成COT链式推理" },
-  ] as const;
+  // 仅两个一级类型，无二级目录 -> 扩展为模板配置
+  const synthesisTemplates = [
+    {
+      id: "sft-qa",
+      type: "qa" as const,
+      title: "SFT 问答数据合成",
+      subtitle: "从长文档自动生成高质量问答样本",
+      badge: "推荐",
+      description:
+        "适用于构建监督微调（SFT）问答数据集，支持从知识库或长文档中抽取关键问答对。",
+      colorClass: "from-sky-500/10 via-sky-400/5 to-transparent",
+      borderClass: "border-sky-100 hover:border-sky-300",
+      icon: Sparkles,
+    },
+    {
+      id: "cot-reasoning",
+      type: "cot" as const,
+      title: "COT 链式推理合成",
+      subtitle: "一步步推理过程与最终答案",
+      badge: "推理增强",
+      description:
+        "生成包含模型推理中间过程的 COT 数据，用于提升模型的复杂推理和解释能力。",
+      colorClass: "from-violet-500/10 via-violet-400/5 to-transparent",
+      borderClass: "border-violet-100 hover:border-violet-300",
+      icon: Brain,
+    },
+  ];

-  const handleSynthesisTypeSelect = (typeId: "qa" | "cot") => {
-    setSelectedSynthesisTypes((prev) => {
-      const next = prev.includes(typeId) ? [] : [typeId];
-      if (next[0] === "qa") setTaskType("qa");
-      if (next[0] === "cot") setTaskType("cot");
-      return next;
-    });
+  const handleTemplateClick = (tpl: (typeof synthesisTemplates)[number]) => {
+    setTaskType(tpl.type);
+    setSelectedSynthesisTypes([tpl.type]);
  };

  useEffect(() => {
@@ -247,120 +320,374 @@ export default function SynthesisTaskCreate() {

    if (createStep === 2) {
      return (
-        <div className="">
-          <div className="grid grid-cols-12 gap-6 min-h-[500px]">
-            {/* 左侧合成指令（仅两个一级类型，单选） */}
+        <div className="px-1 pb-2 pt-1">
+          <div className="grid grid-cols-12 gap-5 min-h-[520px]">
+            {/* 左侧合成指令模板区：占 1/3 宽度 */}
            <div className="col-span-4 space-y-4">
-              <Card className="shadow-sm border-0 bg-white">
-                <h1 className="text-base">合成指令（仅支持单选）</h1>
-                <div className="space-y-3 mb-4">
-                  <div className="relative">
-                    <Search className="w-3 h-3 absolute left-2 top-1/2 transform -translate-y-1/2 text-gray-400" />
-                    <Input placeholder="搜索名称" className="pl-7 text-xs h-8" />
+              <Card className="shadow-sm border border-slate-100/80 bg-gradient-to-b from-slate-50/70 via-white to-white">
+                <div className="flex items-center justify-between mb-3">
+                  <div>
+                    <h1 className="text-sm font-semibold text-slate-900 flex items-center gap-1.5">
+                      <Sparkles className="w-4 h-4 text-amber-500" />
+                      合成指令模板
+                    </h1>
+                    <p className="text-[11px] text-slate-500 mt-0.5">
+                      从左侧选择一个模板，我们会自动为你填充合适的 Prompt 与合成策略。
+                    </p>
                  </div>
+                  <Tag color="blue" className="text-[10px] px-2 py-0.5 rounded-full">
+                    单选
+                  </Tag>
                </div>
-                <div className="space-y-2">
-                  {synthesisTypes.map((type) => (
-                    <div
-                      key={type.id}
-                      className={`flex items-center gap-2 p-2 rounded-lg cursor-pointer text-xs transition-colors ${
-                        selectedSynthesisTypes.includes(type.id)
-                          ? "bg-blue-50 text-blue-700 border border-blue-200"
-                          : "hover:bg-gray-50"
-                      }`}
-                      onClick={() => handleSynthesisTypeSelect(type.id)}
-                    >
-                      <Checkbox
-                        checked={selectedSynthesisTypes.includes(type.id)}
-                        onChange={() => handleSynthesisTypeSelect(type.id)}
-                      />
-                      <span className="flex-1">{type.name}</span>
-                      <MoreHorizontal className="w-3 h-3 text-gray-400" />
-                    </div>
-                  ))}
+
+                <div className="space-y-3">
+                  <div className="relative">
+                    <Search className="w-3 h-3 absolute left-2 top-1/2 -translate-y-1/2 text-gray-400" />
+                    <Input
+                      placeholder="搜索模板名称，如：SFT 问答 / COT 推理"
+                      className="pl-6 text-[11px] h-7 rounded-full bg-slate-50/80 border-slate-100 focus:bg-white"
+                      disabled
+                    />
+                  </div>
+
+                  <div className="space-y-2 max-h-[420px] overflow-auto pr-1 custom-scrollbar-thin">
+                    {synthesisTemplates.map((tpl) => {
+                      const Icon = tpl.icon;
+                      const active = selectedSynthesisTypes.includes(tpl.type);
+
+                      return (
+                        <div
+                          key={tpl.id}
+                          onClick={() => handleTemplateClick(tpl)}
+                          className={`group relative rounded-xl border p-2.5 text-xs transition-all duration-200 cursor-pointer bg-white/80 hover:bg-white/100 ${
+                            tpl.borderClass
+                          } ${
+                            active
+                              ? "ring-1 ring-offset-1 ring-blue-500/60 border-blue-400/70 shadow-sm bg-gradient-to-r " +
+                                tpl.colorClass
+                              : "border-slate-100 hover:shadow-sm"
+                          }`}
+                        >
+                          <div className="flex items-start gap-2.5">
+                            <div
+                              className={`mt-0.5 flex h-7 w-7 items-center justify-center rounded-full bg-white/60 shadow-sm border ${
+                                active ? "border-blue-200" : "border-slate-100"
+                              }`}
+                            >
+                              <Icon
+                                className={`h-3.5 w-3.5 ${
+                                  active
+                                    ? "text-blue-500 drop-shadow-[0_0_6px_rgba(59,130,246,0.45)]"
+                                    : "text-slate-400 group-hover:text-slate-500"
+                                }`}
+                              />
+                            </div>
+                            <div className="flex-1 min-w-0">
+                              <div className="flex items-center gap-1.5 mb-0.5">
+                                <span
+                                  className={`truncate text-[12px] font-medium ${
+                                    active ? "text-slate-900" : "text-slate-800"
+                                  }`}
+                                >
+                                  {tpl.title}
+                                </span>
+                                {tpl.badge && (
+                                  <Tag
+                                    color={tpl.type === "qa" ? "processing" : "purple"}
+                                    className="text-[10px] px-1.5 py-0 h-4 flex items-center rounded-full"
+                                  >
+                                    {tpl.badge}
+                                  </Tag>
+                                )}
+                              </div>
+                              <p className="text-[11px] text-slate-500 leading-snug truncate">
+                                {tpl.subtitle}
+                              </p>
+                              <p className="mt-1 text-[11px] text-slate-400 leading-snug line-clamp-2">
+                                {tpl.description}
+                              </p>
+                            </div>
+                          </div>
+
+                          <div className="absolute inset-y-2 right-1 flex items-center">
+                            <Tooltip title={active ? "当前已选模板" : "点击应用此模板"}>
+                              <div
+                                className={`flex h-5 w-5 items-center justify-center rounded-full border text-[10px] transition-colors ${
+                                  active
+                                    ? "bg-blue-500 text-white border-blue-500 shadow-sm"
+                                    : "bg-white/70 text-slate-300 border-slate-100 group-hover:text-slate-400"
+                                }`}
+                              >
+                                {active ? "✓" : ""}
+                              </div>
+                            </Tooltip>
+                          </div>
+                        </div>
+                      );
+                    })}
+                  </div>
                </div>
              </Card>
            </div>

-            {/* 右侧合成配置 */}
+            {/* 右侧合成配置：占 2/3 宽度 */}
            <div className="col-span-8">
-              <Card className="h-full shadow-sm border-0 bg-white">
-                <div className="flex items-center justify-between">
-                  <h1>合成配置</h1>
+              <Card className="h-full shadow-sm border border-slate-100/80 bg-gradient-to-b from-white via-slate-50/60 to-white">
+                <div className="flex items-center justify-between mb-3">
+                  <div>
+                    <h1 className="text-sm font-semibold text-slate-900 flex items-center gap-1.5">
+                      <Layers className="w-4 h-4 text-indigo-500" />
+                      合成配置
+                    </h1>
+                    <p className="text-[11px] text-slate-500 mt-0.5">
+                      根据左侧模板自动带出配置，你也可以在此基础上进行微调。
+                    </p>
+                  </div>
                  <div className="flex items-center gap-2">
-                    <Button className="hover:bg-white text-xs" type="default">
-                      <Eye className="w-3 h-3 mr-1" />
-                      启用调测
-                    </Button>
+                    <Tooltip title="在正式创建任务前，先小批量运行验证效果">
+                      <Button size="small" className="hover:bg-white text-[11px]" type="default">
+                        <Eye className="w-3 h-3 mr-1" />
+                        启用调测
+                      </Button>
+                    </Tooltip>
                  </div>
                </div>

                <div className="space-y-4">
-                  {/* 切片配置 */}
-                  <Card className="shadow-sm border">
+                  {/* 步骤说明条 */}
+                  <div className="flex items-center gap-3 px-3 py-2 rounded-lg bg-slate-50 border border-slate-100 text-[11px] text-slate-500">
+                    <span className="inline-flex items-center justify-center w-5 h-5 rounded-full bg-indigo-600 text-white text-[10px] font-semibold">1</span>
+                    <span>设置合成总数</span>
+                    <span className="text-slate-300">/</span>
+                    <span className="inline-flex items-center justify-center w-5 h-5 rounded-full bg-indigo-600 text-white text-[10px] font-semibold">2</span>
+                    <span>配置文本切片策略</span>
+                    <span className="text-slate-300">/</span>
+                    <span className="inline-flex items-center justify-center w-5 h-5 rounded-full bg-indigo-600 text-white text-[10px] font-semibold">3</span>
+                    <span>配置问题合成参数</span>
+                    <span className="text-slate-300">/</span>
+                    <span className="inline-flex items-center justify-center w-5 h-5 rounded-full bg-indigo-600 text-white text-[10px] font-semibold">4</span>
+                    <span>配置答案合成参数</span>
+                  </div>
+
+                  {/* 1. 合成总数配置 */}
+                  <div className="rounded-xl bg-white/90 border border-slate-100 px-4 py-3 shadow-[0_0_0_1px_rgba(148,163,184,0.12)]">
+                    <div className="flex items-center justify-between mb-2">
+                      <div className="flex items-center gap-2">
+                        <span className="inline-flex items-center justify-center w-5 h-5 rounded-full bg-indigo-600 text-white text-[10px] font-semibold">1</span>
+                        <span className="text-[12px] font-medium text-slate-800">合成总数上限</span>
+                      </div>
+                      <span className="text-[10px] text-slate-400">控制整个任务最多生成的 QA 对数量</span>
+                    </div>
+                    <div className="flex items-center gap-3">
+                      <InputNumber
+                        className="w-40"
+                        min={1}
+                        max={100000}
+                        size="small"
+                        value={maxQaPairs}
+                        placeholder="不填则不限制"
+                        onChange={(v) => setMaxQaPairs(typeof v === "number" ? v : undefined)}
+                      />
+                      <span className="text-[11px] text-slate-400">可选项，建议在大规模合成时设置上限</span>
+                    </div>
+                  </div>
+
+                  {/* 2. 文本切片配置 */}
+                  <div className="rounded-xl bg-white/90 border border-slate-100 px-4 py-3 shadow-[0_0_0_1px_rgba(148,163,184,0.12)]">
+                    <div className="flex items-center justify-between mb-2">
+                      <div className="flex items-center gap-2">
+                        <span className="inline-flex items-center justify-center w-5 h-5 rounded-full bg-indigo-600 text-white text-[10px] font-semibold">2</span>
+                        <span className="text-[12px] font-medium text-slate-800">文本切片配置</span>
+                      </div>
+                      <span className="text-[10px] text-slate-400">影响上下文长度与召回粒度</span>
+                    </div>
                    <div className="grid grid-cols-3 gap-3">
                      <div>
-                        <span className="text-xs font-medium text-gray-600">分块策略</span>
+                        <span className="text-[11px] font-medium text-gray-600">分块策略</span>
                        <Select
+                          className="mt-1 w-full"
                          options={sliceOptions}
                          value={sliceConfig.processType}
                          onChange={(v) => setSliceConfig((p) => ({ ...p, processType: v }))}
+                          size="small"
                        />
                      </div>
                      <div>
-                        <span className="text-xs font-medium text-gray-600">分块大小</span>
+                        <span className="text-[11px] font-medium text-gray-600">分块大小</span>
                        <Input
+                          className="mt-1"
                          type="number"
                          min={1}
                          value={sliceConfig.chunkSize}
                          onChange={(e) => setSliceConfig((p) => ({ ...p, chunkSize: Number(e.target.value) }))}
+                          size="small"
                        />
                      </div>
                      <div>
-                        <span className="text-xs font-medium text-gray-600">重叠大小</span>
+                        <span className="text-[11px] font-medium text-gray-600">重叠大小</span>
                        <Input
+                          className="mt-1"
                          type="number"
                          min={0}
                          value={sliceConfig.overlapSize}
                          onChange={(e) => setSliceConfig((p) => ({ ...p, overlapSize: Number(e.target.value) }))}
+                          size="small"
                        />
                      </div>
                    </div>
                    {sliceConfig.processType === "CUSTOM_SEPARATOR_CHUNK" && (
                      <div className="mt-3">
-                        <span className="text-xs font-medium text-gray-600">自定义分隔符</span>
+                        <span className="text-[11px] font-medium text-gray-600">自定义分隔符</span>
                        <Input
+                          className="mt-1"
                          placeholder={"例如：\\n\\n 或 ###"}
                          value={sliceConfig.delimiter}
                          onChange={(e) => setSliceConfig((p) => ({ ...p, delimiter: e.target.value }))}
+                          size="small"
                        />
                      </div>
                    )}
-                  </Card>
+                  </div>

-                  {/* 模型选择 */}
-                  <Card className="shadow-sm border">
-                    <span className="text-xs font-medium text-gray-600">模型选择</span>
-                    <Select
-                      placeholder="选择模型"
-                      options={modelOptions}
-                      loading={modelsLoading}
-                      value={selectedModel}
-                      onChange={(value) => setSelectedModel(value)}
-                    />
-                  </Card>
-
-                  {/* Prompt 配置 */}
-                  <Card className="shadow-sm border">
-                    <span className="text-xs font-medium text-gray-600">Prompt 配置</span>
+                  {/* 3. 问题合成配置 */}
+                  <div className="rounded-xl bg-white/90 border border-slate-100 px-4 py-3 shadow-[0_0_0_1px_rgba(148,163,184,0.12)]">
+                    <div className="flex items-center justify-between mb-2">
+                      <div className="flex items-center gap-2">
+                        <span className="inline-flex items-center justify-center w-5 h-5 rounded-full bg-indigo-600 text-white text-[10px] font-semibold">3</span>
+                        <span className="text-[12px] font-medium text-slate-800">问题合成配置</span>
+                      </div>
+                      <span className="text-[10px] text-slate-400">控制每个 chunk 生成的问题数量与多样性</span>
+                    </div>
+                    <div className="grid grid-cols-12 gap-3 mb-3">
+                      <div className="col-span-4">
+                        <div className="flex flex-col gap-0.5">
+                          <span className="text-[11px] font-medium text-gray-600">问题生成数量</span>
+                          <span className="text-[10px] text-slate-400">每千tokens生成的问题条数</span>
+                        </div>
+                        <InputNumber
+                          className="mt-1 w-full"
+                          min={1}
+                          max={20}
+                          size="small"
+                          value={questionConfig.number}
+                          onChange={(v) =>
+                            setQuestionConfig((p) => ({ ...p, number: typeof v === "number" ? v : 1 }))
+                          }
+                        />
+                      </div>
+                      <div className="col-span-4">
+                        <div className="flex flex-col gap-0.5">
+                          <span className="text-[11px] font-medium text-gray-600">温度 (Temperature)</span>
+                          <span className="text-[10px] text-slate-400">数值越大，问题越发散、多样</span>
+                        </div>
+                        <InputNumber
+                          className="mt-1 w-full"
+                          min={0}
+                          max={2}
+                          step={0.1}
+                          size="small"
+                          value={questionConfig.temperature}
+                          onChange={(v) =>
+                            setQuestionConfig((p) => ({
+                              ...p,
+                              temperature: typeof v === "number" ? v : 0.7,
+                            }))
+                          }
+                        />
+                      </div>
+                      <div className="col-span-4">
+                        <div className="flex flex-col gap-0.5">
+                          <span className="text-[11px] font-medium text-gray-600">使用模型</span>
+                          <span className="text-[10px] text-slate-400">用于生成问题的对话模型</span>
+                        </div>
+                        <Select
+                          className="mt-1 w-full"
+                          size="small"
+                          options={modelOptions}
+                          loading={modelsLoading}
+                          value={questionModelId}
+                          onChange={(v) => setQuestionModelId(v)}
+                        />
+                      </div>
+                    </div>
+                    <span className="text-[11px] font-medium text-gray-600">问题 Prompt 模板</span>
+                    <p className="mt-0.5 text-[10px] text-slate-400">
+                      用于指导模型如何从切片文本中生成高质量问题，可在保持变量占位符不变的前提下个性化修改。
+                    </p>
                    <TextArea
-                      value={promptTemplate}
-                      onChange={(e) => setPromptTemplate(e.target.value)}
-                      rows={8}
-                      className="resize-none text-xs font-mono"
-                      placeholder={taskType === "qa" ? "正在加载 QA 提示词模板..." : "正在加载 COT 提示词模板..."}
+                      value={questionPrompt}
+                      onChange={(e) => setQuestionPrompt(e.target.value)}
+                      rows={6}
+                      className="mt-1 resize-none text-[11px] font-mono rounded-lg border-slate-200 bg-slate-50/60 hover:bg-slate-50 focus:bg-white"
+                      placeholder={
+                        taskType === "qa"
+                          ? "将根据 SFT 问答合成场景预填问题生成 Prompt，可按需微调"
+                          : "将根据 COT 推理合成场景预填问题生成 Prompt，可按需微调"
+                      }
                    />
-                  </Card>
+                  </div>
+
+                  {/* 4. 答案合成配置 */}
+                  <div className="rounded-xl bg-white/90 border border-slate-100 px-4 py-3 shadow-[0_0_0_1px_rgba(148,163,184,0.12)]">
+                    <div className="flex items-center justify-between mb-2">
+                      <div className="flex items-center gap-2">
+                        <span className="inline-flex items-center justify-center w-5 h-5 rounded-full bg-indigo-600 text-white text-[10px] font-semibold">4</span>
+                        <span className="text-[12px] font-medium text-slate-800">答案合成配置</span>
+                      </div>
+                      <span className="text-[10px] text-slate-400">控制答案生成的稳定性与风格</span>
+                    </div>
+                    <div className="grid grid-cols-12 gap-3 mb-3">
+                      <div className="col-span-4">
+                        <div className="flex flex-col gap-0.5">
+                          <span className="text-[11px] font-medium text-gray-600">温度 (Temperature)</span>
+                          <span className="text-[10px] text-slate-400">数值越小，答案越稳定、保守</span>
+                        </div>
+                        <InputNumber
+                          className="mt-1 w-full"
+                          min={0}
+                          max={2}
+                          step={0.1}
+                          size="small"
+                          value={answerConfig.temperature}
+                          onChange={(v) =>
+                            setAnswerConfig((p) => ({
+                              ...p,
+                              temperature: typeof v === "number" ? v : 0.7,
+                            }))
+                          }
+                        />
+                      </div>
+                      <div className="col-span-4">
+                        <div className="flex flex-col gap-0.5">
+                          <span className="text-[11px] font-medium text-gray-600">使用模型</span>
+                          <span className="text-[10px] text-slate-400">用于生成答案的对话模型</span>
+                        </div>
+                        <Select
+                          className="mt-1 w-full"
+                          size="small"
+                          options={modelOptions}
+                          loading={modelsLoading}
+                          value={answerModelId}
+                          onChange={(v) => setAnswerModelId(v)}
+                        />
+                      </div>
+                    </div>
+                    <span className="text-[11px] font-medium text-gray-600">答案 Prompt 模板</span>
+                    <p className="mt-0.5 text-[10px] text-slate-400">
+                      用于约束模型回答的风格与内容范围，例如是否需要分步推理、是否必须引用原文关键信息等。
+                    </p>
+                    <TextArea
+                      value={answerPrompt}
+                      onChange={(e) => setAnswerPrompt(e.target.value)}
+                      rows={6}
+                      className="mt-1 resize-none text-[11px] font-mono rounded-lg border-slate-200 bg-slate-50/60 hover:bg-slate-50 focus:bg-white"
+                      placeholder={
+                        taskType === "qa"
+                          ? "将根据 SFT 问答合成场景预填答案生成 Prompt，可按需微调"
+                          : "将根据 COT 推理合成场景预填答案生成 Prompt，可按需微调"
+                      }
+                    />
+                  </div>
                </div>

                {/* 页面底部统一操作条渲染，不在此处放置按钮 */}
@@ -384,7 +711,7 @@ export default function SynthesisTaskCreate() {
          </Link>
          <h1 className="text-xl font-bold bg-clip-text">创建合成任务</h1>
        </div>
-        <Steps current={createStep - 1} size="small" items={[{ title: "基本信息" }, { title: "算子编排" }]} style={{ width: "50%", marginLeft: "auto" }} />
+        <Steps current={createStep - 1} size="small" items={[{ title: "基本信息" }, { title: "合成编排" }]} style={{ width: "50%", marginLeft: "auto" }} />
      </div>
      <div className="border-card flex-overflow-auto">
        {renderCreateTaskPage()}
@@ -419,7 +746,8 @@ export default function SynthesisTaskCreate() {
                  !form.getFieldValue("name") ||
                  !selectedDataset ||
                  selectedFiles.length === 0 ||
-                  !selectedModel
+                  !questionModelId ||
+                  !answerModelId
                }
                loading={submitting}
                className="px-6 py-2 text-sm font-semibold bg-purple-600 hover:bg-purple-700 shadow-lg"