- 添加对DOC和DOCX文件类型的常量定义和支持 - 将文件类型验证逻辑从仅PDF扩展为PDF/DOC/DOCX - 集成Docx2txtLoader用于处理Word文档解析 - 更新错误消息为中文描述以提升用户体验 - 重构文件解析方法以支持多种文档格式 - 添加解析器元数据记录以追踪使用的解析工具 - 更新文件路径验证和构建逻辑以适配新的文件类型
- 简化catch语句移除不必要的异常变量 - 删除无用的FormData条件判断代码 - 将变量声明从let改为const提升代码质量 - 移除响应拦截器中的冗余参数传递 - 在数据集模式模块中添加PDF文本提取相关的请求响应模型 - 更新模块导出列表包含新的PDF提取接口类型定义