Skip to content

Commit b02e1c7

Browse files
committed
add thirddataset.md
1 parent 037f4d2 commit b02e1c7

File tree

8 files changed

+161
-0
lines changed

8 files changed

+161
-0
lines changed
97.2 KB
Loading
38.9 KB
Loading
77.4 KB
Loading
95.1 KB
Loading
68.1 KB
Loading
93.5 KB
Loading
72.1 KB
Loading
Lines changed: 161 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,161 @@
1+
---
2+
title: '第三方知识库开发'
3+
description: '本节详细介绍如何在FastGPT上自己接入第三方知识库'
4+
icon: 'language'
5+
draft: false
6+
toc: true
7+
weight: 410
8+
---
9+
10+
目前,互联网上拥有各种各样的文档库,例如飞书,语雀等等。 FastGPT 的不同用户可能使用的文档库不同,然而开发人手不够,FastGPT 目前只支持飞书,语雀,api ,web 站点这几个知识库。为了满足广大用户对其他知识库需求,同时增强开源性,现在教学如何自己开发第三方知识库。
11+
12+
## 准备本地开发环境
13+
14+
想要开发 FastGPT ,首先要拥有本地开发环境,具体参考[快速开始本地开发](../../development/intro.md)
15+
16+
## 开始开发
17+
18+
为了方便讲解,这里以添加飞书知识库为例。
19+
20+
首先,要进入 FastGPT 项目路径下的`FastGPT\packages\global\core\dataset\apiDataset.d.ts`文件,添加自己的知识库 Server 类型。
21+
22+
{{% alert icon="🤖 " context="success" %}}
23+
知识库类型的字段设计是依赖于自己的知识库需要什么字段进行后续的api调用
24+
{{% /alert %}}
25+
26+
![](/imgs/thirddataset-1.png)
27+
28+
然后需要在 FastGPT 项目路径`projects\app\src\service\core\dataset\`下创建一个需要添加的文件夹,这里是`feishuKownledgeDataset`,在添加的文件夹下创建一个`api.ts`,如图:
29+
30+
![](/imgs/thirddataset-2.png)
31+
32+
## `api.ts`文件内容
33+
34+
首先,需要完成一些导入操作,例如
35+
36+
```TS
37+
import type {
38+
APIFileItem,
39+
ApiFileReadContentResponse,
40+
ApiDatasetDetailResponse,
41+
FeishuKnowledgeServer //这里是之前添加的知识库类型Server
42+
} from '@fastgpt/global/core/dataset/apiDataset';
43+
import { type ParentIdType } from '@fastgpt/global/common/parentFolder/type';
44+
import axios, { type Method } from 'axios';
45+
import { addLog } from '../../../common/system/log';
46+
```
47+
48+
之后定义一些返回体,需要根据自己要调用的 api 接口的返回类型进行设计。这里例如:
49+
```TS
50+
type ResponseDataType = {
51+
success: boolean;
52+
message: string;
53+
data: any;
54+
};
55+
56+
/**
57+
* Request
58+
*/
59+
type FeishuFileListResponse = {
60+
items: {
61+
title: string;
62+
creator: string;
63+
has_child: boolean;
64+
parent_node_token: string;
65+
owner_id: string;
66+
space_id: string;
67+
node_token: string;
68+
node_type: string;
69+
node_create_time: number;
70+
obj_edit_time: number;
71+
obj_create_time: number;
72+
obj_token: string;
73+
obj_type: string;
74+
origin_node_token: string;
75+
origin_space_id: string;
76+
}[];
77+
has_more: boolean;
78+
next_page_token: string;
79+
};
80+
```
81+
82+
需要先设计设计一个函数,函数名以`知识库类型+Request`为例,例如:
83+
84+
```TS
85+
export const useFeishuKnowledgeDatasetRequest = ({
86+
feishuKnowledgeServer
87+
}: {
88+
feishuKnowledgeServer: FeishuKnowledgeServer;
89+
}) => {}
90+
```
91+
92+
函数定义完成后,需要完成 api 方法的设计,需要以下四个方法:
93+
94+
{{% alert icon="🤖 " context="success" %}}
95+
方法的具体设计,可以参考`projects\app\src\service\core\dataset\`下的任何一个知识库的`api.ts`文件,知识库文件夹以`dataset`结尾
96+
{{% /alert %}}
97+
98+
| 方法名 | 返回体 | 说明 |
99+
| --- | --- | --- |
100+
| listFiles | id,parentId,name,type,hasChild,updateTime,createTime | 用于获取知识库的文件列表 |
101+
| getFileContent | title,rawText | 用于获取知识库文件内容 |
102+
| getFileDetail | name,parentId,id | 用于获取知识库文件详细信息 |
103+
| getFilePreviewUrl | '网址' | 用于获取知识库文件原始页面 |
104+
105+
在设计好`api.ts`文件后,需要在`projects\app\src\service\core\dataset\apidataset\index.ts`里,添加之前写好的函数,例如:
106+
107+
![](/imgs/thirddataset-3.png)
108+
109+
在完成了这些之后,现在,我们需要一些方法的支持。在`index.ts`文件里,查找函数`getApiDatasetRequest`的引用,如图:
110+
111+
![](/imgs/thirddataset-4.png)
112+
113+
{{% alert icon="🤖 " context="warning" %}}
114+
其中`getCatalog.ts``getPathNames.ts`文件是对根路径设置的支持,如果你的知识库不支持根路径设置,可以设置返回空。如图:
115+
116+
![](/imgs/thirddataset-6.png)
117+
118+
{{% /alert %}}
119+
120+
可以看到有一些文件引用这个函数,这些就是知识库的方法,现在我们需要进入这些文件添加我们的知识库类型。以`list.ts`为例,如图添加:
121+
122+
![](/imgs/thirddataset-5.png)
123+
124+
{{% alert icon="🤖 " context="success" %}}
125+
方法的具体添加,可以参考文件内的其他知识库。
126+
{{% /alert %}}
127+
128+
129+
## 数据库类型添加
130+
131+
添加新的知识库,需要在`packages/service/core/dataset/schema.ts` 中添加自己的知识库类型,如图:
132+
133+
![](/imgs/thirddataset-7.png)
134+
135+
{{% alert icon="🤖 " context="success" %}}
136+
`schema.ts`文件修改后,需要重新启动 FastGPT 项目才会生效。
137+
{{% /alert %}}
138+
139+
140+
## 添加知识库类型
141+
142+
添加完这些之后,需要添加知识库类型,需要在`projects/app/src/web/core/dataset/constants.ts`中,添加自己的知识库类型
143+
144+
```TS
145+
export const datasetTypeCourseMap: Record<`${DatasetTypeEnum}`, string> = {
146+
[DatasetTypeEnum.folder]: '',
147+
[DatasetTypeEnum.dataset]: '',
148+
[DatasetTypeEnum.apiDataset]: '/docs/guide/knowledge_base/api_dataset/',
149+
[DatasetTypeEnum.websiteDataset]: '/docs/guide/knowledge_base/websync/',
150+
[DatasetTypeEnum.feishuShare]: '/docs/guide/knowledge_base/lark_share_dataset/',
151+
[DatasetTypeEnum.feishuKnowledge]: '/docs/guide/knowledge_base/lark_knowledge_dataset/',
152+
[DatasetTypeEnum.yuque]: '/docs/guide/knowledge_base/yuque_dataset/',
153+
[DatasetTypeEnum.externalFile]: ''
154+
};
155+
```
156+
157+
{{% alert icon="🤖 " context="success" %}}
158+
在 datasetTypeCourseMap 中添加自己的知识库类型,`' '`内是相应的文档说明,如果有的话,可以添加。
159+
文档添加在`FastGPT\docSite\content\zh-cn\docs\guide\knowledge_base\`
160+
{{% /alert %}}
161+

0 commit comments

Comments
 (0)