Dify 知识库模块全解析：从基础用法到AI漫剧工作流实操

一、Dify 知识库基础说明

Dify 知识库是支撑AI应用实现“精准应答”和“场景化生成”的核心组件，本质是通过对文档进行结构化处理、建立索引，让大模型在生成内容时，能实时检索并引用知识库中的特定信息，确保输出的准确性和一致性。

其核心价值在于：打破大模型通用知识的局限性，支持自定义知识导入（如产品文档、角色设定、专业规范等），且所有Dify应用类型（聊天助手、智能体、工作流）都可关联知识库，适配不同开发场景——工作流应用中，知识库作为独立检索组件，可灵活嵌入流程，为各节点提供精准知识支撑。

补充说明：Dify 知识库支持本地部署与云端使用，兼容各类本地化模型（如Ollama）和第三方模型，同时支持从外部知识库（如AWS Bedrock、LlamaCloud）通过API接入，灵活性极强。

二、知识库导入：多方式适配，满足不同场景需求

Dify 提供了多样化的知识库导入方式，覆盖文本、文档、外部同步等多种场景，操作简单且兼容性强，具体可分为以下4类，适配不同知识来源需求：

2.1 本地文档导入（最常用）

支持批量上传多种格式的本地文档，包括TXT、Markdown、DOCX、HTML、JSON、PDF、CSV、Excel等，上传后系统会自动解析文档内容，无需手动处理格式。适合导入本地存储的角色设定文档、场景描述、规范手册等（如AI漫剧的人物风格文档、分镜要求等）。

注意：单文件建议控制在100MB以内，若文档有加密、水印，需先删除后再上传，避免解析失败；超大文件建议拆分后导入。

2.2 外部内容同步

两种核心同步方式，适配线上知识源：

Notion 同步：绑定Notion空间后，可直接将Notion中的内容同步到Dify知识库，适合团队已在Notion中管理知识的场景；
Web站点同步：支持通过Jina Reader、Firecrawl、WaterCrawl等网页提取工具，抓取指定Web站点的内容，自动导入知识库，适合需要实时同步线上公开知识的场景。

2.3 外部知识库接入

通过API和知识库ID，可连接外部知识库（如AWS Bedrock 知识库、LlamaCloud 知识库），无需将知识重复导入Dify，适合已有成熟外部知识库的企业或开发者。

2.4 导入后自动处理

无论哪种导入方式，Dify都会自动对内容进行分段（即生成Chunk），并提供多种分段策略（通用模式、父子模式、Q&A模式），可根据文档类型调整，确保后续检索的精准度——比如AI漫剧的角色设定文档，可采用父子模式，父块存储角色完整设定，子块存储细节（如发型、服装、神态），便于精准检索。

三、高精度LLM模式与经济模式：按需选择，平衡效果与成本

Dify 知识库提供两种核心运行模式，对应不同的检索精度和成本需求，本质区别在于索引方式的不同，可根据应用场景灵活选择，无需额外开发适配。

3.1 高精度LLM模式（推荐场景：精准度优先）

该模式基于嵌入模型（Embedding）将Chunk文本转换为数字向量，建立向量索引，支持向量检索、全文检索、混合检索三种检索方式，检索精度极高，能精准匹配语义相似的内容，适合对知识准确性要求高的场景（如AI漫剧的角色风格检索、专业文档问答）。

核心特点：

检索方式灵活：向量检索侧重语义匹配，全文检索侧重关键词匹配，混合检索结合两者优势，开启Rerank模型后，可对检索结果重排序，进一步优化精度；
可配置参数：支持调整TopK（返回最相似的Chunk数量）、Score阈值（筛选相似度达标的Chunk），精准控制检索结果；
成本说明：需消耗一定的Token（嵌入模型和Rerank模型的调用成本），但检索效果更优，适合核心业务场景。

3.2 经济模式（推荐场景：成本优先，简单检索）

该模式无需嵌入模型，仅为每个Chunk生成10个关键词，建立倒排索引，仅支持倒排检索（关键词匹配），检索精度略低，但完全不消耗Token，无额外成本，适合预算紧张、知识内容简洁（如FAQ、简单关键词匹配）的场景。

核心特点：

检索逻辑简单：仅通过关键词匹配Chunk，无需语义分析，速度快；
配置简单：仅支持TopK参数调整，无需复杂设置；
适用场景：如简单的角色名称检索、基础FAQ问答，不适合需要语义匹配的复杂场景（如AI漫剧的风格描述检索）。

3.3 模式选择建议

开发AI漫剧、专业文档问答等需要精准语义匹配的场景，优先选择高精度LLM模式；开发简单FAQ、关键词检索类应用，可选择经济模式，平衡成本与效率。两种模式可在知识库设置中随时切换，无需重新导入知识。

四、Chunk 编辑：核心注意点（重点强调）

Chunk 是知识库的最小知识单元，即文档导入后被系统拆分的文本片段（或手动创建的知识片段），所有检索、编辑操作都围绕Chunk展开。其中，Chunk 附加图片的规则是核心重点，很多开发者容易踩坑，具体说明如下：

4.1 Chunk 的基础编辑操作

Dify 支持对Chunk进行手动编辑，包括修改文本内容、删除无用Chunk、合并/拆分Chunk等，操作入口在知识库的“Chunk管理”页面，可视化操作，无需代码。编辑后，系统会自动更新索引，不影响知识库的整体使用。

4.2 重点：Chunk 附加图片的限制（必看）

Dify 支持为Chunk附加图片，但仅在Chunk创建时可操作，编辑模式下无法附加图片，具体细节如下：

创建时附加图片：在手动创建Chunk（或文档导入后自动生成Chunk的初始阶段），可点击“附加图片”，上传本地图片，系统会自动将图片存储，并生成对应的URL，嵌入到Chunk文本中（通常以占位符或直接URL形式存在）；
编辑时无法附加：当Chunk创建完成后，进入编辑模式（修改文本、调整Chunk范围等），“附加图片”按钮会失效，无法新增或替换图片；若需修改图片，只能删除该Chunk，重新创建新Chunk并附加图片；
图片存储逻辑：附加的图片会被存储在Dify的默认存储中（或自定义存储如MinIO），生成唯一可访问的URL，该URL会嵌入到Chunk文本中，成为Chunk内容的一部分，供后续提取使用。

补充说明：为避免LLM篡改图片URL，建议将图片URL以特殊占位符形式（如(IMG::uuid.png)）嵌入Chunk，通过Prompt工程约束LLM原样保留占位符，后续再通过代码替换为实际可访问的URL，降低“幻觉”风险。

五、知识库查询节点：检索与图片提取技巧

知识库查询节点是Dify工作流中调用知识库的核心组件，用于在工作流运行过程中，根据指定条件（如检索关键词）从知识库中检索对应的Chunk内容，为后续节点提供知识支撑。其核心用法和图片提取技巧如下：

5.1 知识库查询节点基础用法

添加节点：在Dify工作流编辑器中，找到“知识库查询”节点，拖拽到工作流中，绑定需要调用的知识库；
配置检索条件：设置检索关键词（可手动输入，也可引用前序节点的输出，如用户输入的角色名称）、检索模式（对应知识库的高精度/经济模式）、TopK、Score阈值等参数；
输出结果：节点运行后，会输出检索到的Chunk列表，包含Chunk的文本内容、相似度分数等信息，可直接传递给后续节点（如LLM节点、代码节点）使用。

5.2 关键注意点：知识库查询不支持直接获取附加图片

重要提醒：知识库查询节点仅能检索到Chunk的文本内容，无法直接获取Chunk附加的图片文件（即无法通过节点输出直接拿到图片本身）。但如前文所述，Chunk创建时附加的图片，其URL会嵌入到Chunk的文本中，因此，可通过提取Chunk文本中的图片URL，间接获取图片，这是实现图片相关工作流（如AI漫剧）的核心技巧。

5.3 图片URL提取：通过Python代码节点实现

Dify 工作流中的“Python代码节点”可接收知识库查询节点的输出（Chunk文本），通过简单的Python代码，提取文本中的图片URL，供后续节点（如图生图、文生图节点）使用。

核心代码示例（适配Dify Python节点，可直接复制使用）：

from typing import Any, Union

def main(chunk_content: str) -> dict:
    """
    从知识库查询到的Chunk文本中，提取图片URL
    :param chunk_content: 知识库查询节点输出的Chunk文本内容（包含图片URL）
    :return: 包含提取到的图片URL列表的字典
    """
    import re
    # 匹配常见的图片URL格式（http/https开头，以.png/.jpg/.jpeg/.webp结尾）
    url_pattern = r'https?://[^\s]+\.(png|jpg|jpeg|webp)'
    # 提取所有匹配的URL
    image_urls = re.findall(url_pattern, chunk_content)
    # 返回结果（供后续节点调用）
    return {"image_urls": image_urls if image_urls else []}

说明：代码可根据实际图片URL格式调整正则表达式，若Chunk中使用了占位符（如(IMG::uuid.png)），可先替换占位符为实际URL，再进行提取；若需处理嵌套数据结构，可增加递归提取逻辑，确保能精准获取所有图片URL。

六、实操：用Dify搭建AI漫剧工作流（核心案例）

结合以上知识点，我们搭建一个简单的AI漫剧工作流，核心目标：利用知识库存储人物角色风格设定，通过工作流节点联动，生成风格统一的漫剧分镜图片。整体流程：触发节点 → 知识库查询（获取角色风格）→ Python代码节点（提取参考图URL）→ 图生图节点（生成角色参考图）→ 文生图节点（生成场景+角色分镜）→ 结束节点。

6.1 前期准备

创建知识库：新建“AI漫剧角色风格知识库”，选择高精度LLM模式（确保风格检索精准），采用父子分段模式，父块存储角色完整风格，子块存储细节；
导入知识：上传漫剧角色设定文档（包含角色名称、发型、服装、神态、配色等风格描述），手动为每个角色的Chunk附加参考图（创建Chunk时操作），参考图URL嵌入Chunk文本中（建议用占位符格式）；
准备模型：在Dify中配置图生图大模型（如Stable Diffusion、硅基流动等）和文生图大模型，获取API Key并完成授权配置，确保节点能正常调用模型。

6.2 工作流搭建步骤（详细拆解）

步骤1：添加触发节点（开始节点）

拖拽“开始”节点到工作流画布，设置输入变量：角色名称（必填，用户输入需要生成的漫剧角色）、分镜场景（必填，如“校园教室”“雨天街道”），用于后续检索和生成。

步骤2：添加知识库查询节点（核心检索）

绑定“AI漫剧角色风格知识库”，设置检索关键词为“角色名称”（引用开始节点的输入变量）；
检索模式选择“混合检索”（兼顾关键词和语义匹配），TopK设为1（仅获取最匹配的角色Chunk），Score阈值设为0.8（过滤相似度低的结果）；
节点输出：检索到的角色风格Chunk（包含风格描述和参考图URL占位符），传递给下一个节点。

步骤3：添加Python代码节点（提取参考图URL）

接收知识库查询节点的输出（Chunk文本），粘贴前文的图片URL提取代码，调整正则表达式适配占位符格式（如将占位符(IMG::uuid.png)替换为实际MinIO或Dify存储的URL）；
代码输出：提取到的参考图URL列表（若有多个参考图，取第一个作为核心参考），传递给图生图节点。

步骤4：添加图生图节点（生成角色参考图）

图生图节点的核心作用：以知识库中提取的参考图为基础，生成符合角色风格的高清图，确保角色形象一致性，具体配置：

选择已配置的图生图大模型（如Stable Diffusion）；
参考图：引用Python代码节点输出的图片URL（作为角色形象参考）；
提示词：引用知识库查询节点输出的角色风格描述（如“日系动漫风格，双马尾，浅粉色头发，水手服，温柔神态”），补充细节提示（如“高清，8K，细节拉满”）；
参数设置：相似度设为0.8（确保与参考图风格一致），图片尺寸设为1080×1920（适配漫剧分镜）；
输出：生成的角色高清参考图，传递给文生图节点。

步骤5：添加文生图节点（生成分镜图片）

文生图节点的核心作用：结合角色参考图、场景描述，生成分镜图片，确保角色与场景的融合度和风格一致性，具体配置：

选择已配置的文生图大模型；
提示词：拼接3部分内容——① 场景描述（引用开始节点的“分镜场景”）；② 角色风格描述（引用知识库查询节点的输出）；③ 分镜要求（如“漫剧分镜，全景，光影柔和，角色位于画面中心，场景细节丰富，与角色风格统一”）；
参考图：引用图生图节点生成的角色参考图（确保角色形象与参考图一致）；
参数设置：图片尺寸设为1920×1080（分镜标准尺寸），风格一致性设为高；
输出：最终的漫剧分镜图片，传递给结束节点。

步骤6：添加结束节点

配置结束节点，输出文生图节点生成的分镜图片URL，供用户查看、下载，完成整个工作流搭建。

6.3 关键技巧：确保分镜风格一致性

AI漫剧的核心痛点是角色风格、场景风格的一致性，结合知识库和工作流，可通过以下3点实现：

知识库统一管理风格：将所有角色的风格设定、参考图URL集中存储在知识库中，确保每次检索都能获取到统一的风格描述和参考图，避免风格混乱；
图生图+文生图联动：以知识库中的参考图为基础，图生图节点生成标准化角色，文生图节点引用该角色图作为参考，确保角色形象在不同分镜中一致；
固定提示词模板：在文生图节点中，固定风格提示词（如“日系动漫，高清，细节拉满，光影统一”），避免因提示词变化导致风格偏差；同时，通过Prompt工程约束LLM，确保角色风格描述不被篡改。

七、总结与注意事项

Dify 知识库模块的核心价值的是“让AI应用拥有自定义知识”，其灵活的导入方式、两种运行模式、可编辑的Chunk，适配从简单问答到复杂工作流的多种场景。结合工作流节点和Python代码，可实现图片URL提取、多模型联动，轻松落地AI漫剧、专业文档问答等实用应用。

最后，梳理几个高频注意点，避免踩坑：

Chunk 附加图片仅能在创建时操作，编辑模式无法新增/替换，需提前规划好图片内容；
知识库查询节点无法直接获取图片，需通过提取Chunk文本中的URL间接获取，推荐使用占位符+代码提取的方式，降低LLM篡改风险；
高精度LLM模式和经济模式可随时切换，根据场景需求平衡精度与成本；
搭建工作流时，确保各节点的输出与输入对应，尤其是知识库查询、代码节点、生成节点的联动，避免数据传递错误。

后续可基于该基础工作流，扩展更多功能（如多角色分镜生成、分镜脚本生成、批量生成分镜等），充分发挥Dify知识库+工作流的低代码优势，快速落地AI漫剧等创意场景。