feat(synthesis): add functionality to archive synthesis tasks to existing datasets (#132)

This commit is contained in:
Dallas98
2025-12-04 17:11:43 +08:00
committed by GitHub
parent 7a9530c1e3
commit 31c4966608
5 changed files with 251 additions and 3 deletions

View File

@@ -20,7 +20,7 @@ QA_PROMPT="""# 角色
5. **答案质量**:答案应准确、简洁、完整。
# 输出格式
请严格按照以下JSON格式输出,确保没有额外的解释或标记:
请严格按照以下JSON格式输出,保持字段顺序,确保没有额外的解释或标记:
[
{{"instruction": "问题1","input": "参考内容1","output": "答案1"}},
{{"instruction": "问题2","input": "参考内容1","output": "答案2"}},
@@ -53,7 +53,7 @@ COT_PROMPT="""# 角色
* 请根据输入文档的主要语言进行提问和回答。
# 输出格式
请严格按照以下 JSON 格式输出,确保没有额外的解释或标记,每条 COT 数据独立成项:
请严格按照以下 JSON 格式输出,保持字段顺序,确保没有额外的解释或标记,每条 COT 数据独立成项:
[
{{"question": "具体问题","chain_of_thought": "步骤 1:明确问题核心,定位文档中相关信息范围;步骤 2:提取文档中与问题相关的关键信息 1;步骤 3:结合关键信息 1 推导中间结论 1;步骤 4:提取文档中与问题相关的关键信息 2;步骤 5:结合中间结论 1 和关键信息 2 推导中间结论 2;...(逐步推进);步骤 N:汇总所有中间结论,得出最终结论","conclusion": "简洁准确的最终结论"}},