首頁手記 Spring AI與DeepSeek實(shí)戰(zhàn)三：打造企業(yè)知識(shí)庫

Spring AI與DeepSeek實(shí)戰(zhàn)三：打造企業(yè)知識(shí)庫

標(biāo)簽：

Java 人工智能 Spring

一、概述

企业应用集成大语言模型（LLM）落地的两大痛点：

知识局限性：LLM依赖静态训练数据，无法覆盖实时更新或垂直领域的知识；
幻觉：当LLM遇到训练数据外的提问时，可能生成看似合理但错误的内容。

用最低的成本解决以上问题，需要使用 RAG 技术，它是一种结合信息检索技术与 LLM 的框架，通过从外部 知识库 动态检索相关上下文信息，并将其作为 Prompt 融入生成过程，从而提升模型回答的准确性;

本文将以AI智能搜索为场景，基于 Spring AI 与 RAG 技术结合，通过构建实时知识库增强大语言模型能力，实现企业级智能搜索场景与个性化推荐，攻克 LLM 知识滞后与生成幻觉两大核心痛点。

关于 Spring AI 与 DeepSeek 的集成，以及 API-KEY 的申请等内容，可参考文章《Spring AI与DeepSeek实战一：快速打造智能对话应用》

二、RAG数据库选择

构建知识库的数据库一般有以下有两种选择：

维度	向量数据库	知识图谱
数据结构	非结构化数据（文本/图像向量）	结构化关系网络（实体-关系-实体）
查询类型	语义相似度检索	多跳关系推理
典型场景	文档模糊匹配、图像检索	供应链追溯、金融风控
性能指标	QPS>5000	复杂查询响应时间>2s
开发成本	低（API即用）	高（需构建本体模型）

搜索推荐场景更适合选择向量数据库

三、向量模型

向量模型是实现 RAG 的核心组件之一，用于将非结构化数据（如文本、图像、音频）转换为 高维向量（Embedding）的机器学习模型。这些向量能够捕捉数据的语义或结构信息，使计算机能通过数学运算处理复杂关系。

向量数据库是专门存储、索引和检索高维向量的数据库系统

spring-ai-alibaba-starter 默认的向量模型为 text-embedding-v1

可以通过 spring.ai.dashscope.embedding.options.model 进行修改。

四、核心代码

4.1. 构建向量数据

创建 resources/rag/data-resources.txt 文件，内容如下：

1. {"type":"api","name":"测试api服务01","topic":"综合政务","industry":"采矿业","remark":"获取采矿明细的API服务"}
2. {"type":"api","name":"新能源车类型","topic":"能源","industry":"制造业","remark":"获取新能源车类型的服务"}
3. {"type":"api","name":"罚款报告","topic":"交通","industry":"制造业","remark":"获取罚款报告的接口"}
4. {"type":"api","name":"光伏发电","topic":"能源","industry":"电力、热力、燃气及水生产和供应业","remark":"获取光伏发电的年度报告"}
5. {"type":"api","name":"收益明细2025","topic":"综合政务","industry":"信息传输、软件和信息技术服务业","remark":"2025年的收益明细信息表"}

创建向量数据库的 Bean

@Bean
public VectorStore vectorStore(EmbeddingModel embeddingModel
        , @Value("classpath:rag/data-resources.txt") Resource docs) {
    VectorStore vectorStore = SimpleVectorStore.builder(embeddingModel).build();
    vectorStore.write(new TokenTextSplitter().transform(new TextReader(docs).read()));
    return vectorStore;
}

SimpleVectorStore 是 Spring AI 提供的一个基于内存的向量数据库；
使用 TokenTextSplitter 来切分文档。

4.2. 创建ChatClient

private final ChatClient chatClient;

public RagController(ChatClient.Builder builder, VectorStore vectorStore) {
    String sysPrompt = """
            您是一个数据产品的智能搜索引擎，负责根据用户输入的内容进行精准匹配、模糊匹配和近义词匹配，以搜索相关的数据记录。
            您只能搜索指定的内容，不能回复其他内容或添加解释。
            您可以通过[search_content]标识符来表示需要搜索的具体内容。要求您返回匹配内容的完整记录，以JSON数组格式呈现。
            如果搜索不到内容，请返回[no_data]。
            """;
    this.chatClient = builder
            .defaultSystem(sysPrompt)
            .defaultAdvisors(
                    new QuestionAnswerAdvisor(vectorStore, new SearchRequest())
            )
            .defaultOptions(
                    DashScopeChatOptions.builder()
                            .withModel("deepseek-r1")
                            .build()
            )
            .build();
}

通过系统 Prompt 来指定智能体的能力；
通过 QuestionAnswerAdvisor 绑定向量数据库。

4.3. 搜索接口

@GetMapping(value = "/search")
public List<SearchVo> search(@RequestParam String search, HttpServletResponse response) {
    response.setCharacterEncoding("UTF-8");
    PromptTemplate promptTemplate = new PromptTemplate("[search_content]: {search}");
    Prompt prompt = promptTemplate.create(Map.of("search", search));

    return chatClient.prompt(prompt)
            .call()
            .entity(new ParameterizedTypeReference<List<SearchVo>>() {});
}

这里通过 entity 方法来实现搜索结果以结构化的方式返回。

4.4. 测试接口

4.4.1. 搜索新能源

除了模糊匹配了新能源车之外，还匹配了和新能源相关的光伏数据。

4.4.21. 搜索收入

匹配同义词的收益数据。

五、总结

本文以智能搜索引擎场景，通过 RAG 技术，实现了全文搜索、模糊搜索、同义词推荐等功能，并以结构化的方式返回搜索结果。需要注意的是，在企业应用中，要把 SimpleVectorStore 改为成熟的第三方向量数据库，例如 milvus、elasticsearch、redis 等。

六、完整代码

Gitee地址：

https://gitee.com/zlt2000/zlt-spring-ai-app

Github地址：

https://github.com/zlt2000/zlt-spring-ai-app

點(diǎn)擊查看更多內(nèi)容

為 TA 點(diǎn)贊

若覺得本文不錯(cuò)，就分享一下吧！

評(píng)論

評(píng)論

共同學(xué)習(xí)，寫下你的評(píng)論

評(píng)論加載中...

展開查看更多評(píng)論

作者其他優(yōu)質(zhì)文章

正在加載中

zlt2000

JAVA開發(fā)工程師

手記
篇

粉絲

18

獲贊與收藏

95

關(guān)注作者，訂閱最新文章

閱讀免費(fèi)教程

Java并發(fā)工具

23個(gè)小節(jié) 20021 324

Java 并發(fā)原理入門教程

26個(gè)小節(jié) 40512 584

Java 入門教程

50個(gè)小節(jié) 354534 3286

推薦

評(píng)論

收藏

共同學(xué)習(xí)，寫下你的評(píng)論



感謝您的支持，我會(huì)繼續(xù)努力的～

掃碼打賞，你說多少就多少

贊賞金額會(huì)直接到老師賬戶

支付方式

打開微信掃一掃，即可進(jìn)行掃碼打賞哦

今天注冊(cè)有機(jī)會(huì)得

100積分直接送

付費(fèi)專欄免費(fèi)學(xué)

大額優(yōu)惠券免費(fèi)領(lǐng)

立即參與放棄機(jī)會(huì)

點(diǎn)擊
抽獎(jiǎng)

慕課手記新用戶專享福利

恭喜你，你的運(yùn)氣太好了，居然抽中了 100個(gè)積分！

恭喜你，抽中了價(jià)值元的專欄！

太棒了，直接落到你賬戶里！

積分商城里的羅技鼠標(biāo)、機(jī)械鍵盤、
Kindle 閱讀器、小米平衡車
Apple iPad （10.2英寸）、大額優(yōu)惠券
在等著你去兌換了噢

作者：

免費(fèi)贈(zèng)送

兌換碼：1111222211 復(fù)制

優(yōu)惠券可用于購買實(shí)戰(zhàn)課、體系課
無門檻使用

先去看看，有什么好東西馬上兌換我愛學(xué)習(xí)，選課去


第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空