Skip to content

数据集

1. 功能概述

数据集是存放高质量问答对(QA)的容器,也是知识库数据的核心来源。

2. 核心功能操作指南

2.1 创建数据集

操作入口:点击 数据标注 菜单下的 数据集 ,进入看板页面。

看板信息:在看板可以直观查看各数据集的 QA 总数及审核进度条。

创建数据集

点击 [创建数据集] 按钮出现新建弹窗

图标:上传数据集标识。

名称:必填项,用于区分不同的业务领域。

描述:详细说明数据集的用途。

2.2 数据录入与详情管理

数据录入有两种方式:一种是手动创建QA,另一种是智能文档导入

1、手动创建 QA

用户需指定所属数据集,并设置审核状态(已审核/待审核)。

支持添加“标准问题”及多个“相似提问”,以增强模型的泛化匹配能力。

2、智能文档导入

文件上传:支持 TXT、PDF、DOCX、MD 等多种格式,单文件上限 20MB。

参数配置:可调整分割器类型、分段长度及分割重叠度,以优化 AI 提取效果。

QA生成:系统基于文档自动提取 Q(问题)和 A(答案),可以添加相似提问。

2.3 审核与同步

审核流:在详情页中,管理员可以对“AI 提取”或“任务导入”的内容进行编辑、删除或确认审核。

同步产出:点击右上角 合并到知识库,将已录入的高质量 QA 正式应用到知识库。