DeepSeek R1 凭借其强大的思维链能力在开发者中广受欢迎,但 Spring AI 等主流框架对其支持不足,特别是在思维链内容保留和流式输出方面存在诸多限制。deepseek4j 1.3 版本重磅发布,带来联网搜索、多渠道支持等重要更新。

deepseek4j 是什么

deepseek4j 是一个专为 Java 开发者打造的 DeepSeek 模型集成框架。通过优雅的 API 设计,只需一行代码,即可实现接入 DeepSeek,并获得以下核心能力:

  • 完整思维链保留:完美保留 DeepSeek 模型的推理过程,让 AI 的思考过程可追溯
  • 流式输出体验:基于 Reactor 实现的流式响应,带来类 ChatGPT 的打字机效果
// 流式输出,完整保留思维链
@GetMapping(value = "/chat", produces = MediaType.TEXT_EVENT_STREAM_VALUE)
public Flux<ChatCompletionResponse> chat(String prompt) {
    return deepSeekClient.chatFluxCompletion(prompt);
}

使用 deepseek4j,您可以专注于业务逻辑开发,而无需关心底层细节。

一、核心更新

1.1 联网搜索支持

新版本最重要的更新是引入了联网搜索能力,这一功能带来三个关键优势:

  1. 突破时间边界:模型不再受限于预训练数据的时间范围,可以获取和处理最新信息
  2. 实时信息获取:通过高质量信息源获取实时资讯,提供更精准的问答服务
  3. 差异化竞争:在大模型同质化严重的当下,联网搜索成为关键的差异化竞争点
@GetMapping(value = "/chat", produces = MediaType.TEXT_EVENT_STREAM_VALUE)
public Flux<ChatCompletionResponse> chat(String prompt) {
    // 指定联网搜索参数
    SearchRequest searchRequest = SearchRequest.builder()
            .enable(true)
            .freshness(FreshnessEnums.ONE_DAY)// 一天内的数据
            .summary(true) // 返回摘要
            .count(10) // 返回10条
            .page(1) // 第一页
            .build();
    return deepSeekClient.chatSearchCompletion(prompt,searchRequest);
}

1.2 智能系统提示词

系统提示词(System Prompt)是基于模型开发的应用程序内置的指令,让决定了模型在特定上下文中的表现方式、回答风格和功能范围。

为了解决部分渠道模型部署时推理能力不稳定的问题,新版本引入了与 DeepSeek R1 官方版本一致的系统提示词功能:

  • 通过精心设计的提示词模板,确保模型输出的一致性和可靠性
  • 内置多层级的提示词优化策略,显著提升推理质量

详细可参考:https://raw.githubusercontent.com/pig-mesh/deepseek4j/refs/heads/main/deepseek-spring-boot-starter/src/main/Users/lengleng/Downloads/prompts/system.pt

1.3 多渠道整合

新版本显著扩展了支持的渠道范围:

支持平台说明
Deepseek4j接入本地R1基于 Ollama 的本地部署方案
Deepseek4j接入腾讯 R1腾讯云 AI 平台
Deepseek4j接入硅基流动 R1硅基流动 AI 平台
Deepseek4j接入火山引擎 R1字节火山引擎
Deepseek4j接入GiteeAI R1Gitee AI 平台
Deepseek4j接入阿里 R1阿里云通义千问

每个平台的具体配置方式请参考官方文档

1.4 增强的 SSE 调试功能

针对非标准平台,新增了智能化的调试功能:

  • 自动处理 <think> 标签内容
  • 智能提取 reason_content
  • 优化多轮对话的token占用

二、文档页上线

详细的使用文档已上线:DeepSeek4j 官方文档

三、未来规划

在快速落地大模型应用的过程中,传统方案面临两难选择:Higress、Kong 等 AI Gateway 虽然提供了 API 网关能力,但其复杂的架构和运维成本严重阻碍了快速集成;而 LangChain、Spring AI 等框架虽定位 SDK 层,却未在稳定性保障机制上进行深度设计。

针对当前 DeepSeek-R1 在国内火爆但服务不稳定的现状,计划引入以下特性:

  • 轻量级多 API Key 轮询机制,SDK 层面自动切换可用节点
  • 基于 Resilience4j 实现请求级熔断降级,确保单用户故障隔离
  • 智能流量调度策略,结合 Token 消耗速率动态调整路由

该方案既避免了传统网关的沉重架构,又弥补了现有 AI SDK 在稳定性方面的缺失。