将 AI 注入 Java 应用程序

人工智能（AI）正变得越来越普遍。作为一名企业 Java 开发人员，你可能想知道 AI 能为业务应用程序增添什么价值，Java 提供了哪些工具可以轻松实现这一目标，以及你可能需要学习哪些技能和知识。在本文中，我们将为你提供必要的基础知识和技能，帮助你开始探索 AI 的功能，以构建智能且响应迅速的企业 Java 应用程序。

在本文中，当我们谈论 AI 时，我们指的是基于 Java 应用程序向大语言模型（LLM）发送的请求，并从 LLM 获取响应。在本文的示例中，我们创建了一个简单的聊天机器人，客户可以向其询问星际旅游目的地推荐，然后使用它预订前往这些目的地的宇宙飞船。我们展示了如何使用 LangChain4j和Quarkus等 Java 框架，高效地与 LLM 交互，并为最终用户创建令人满意的应用程序。

你好（AI）世界：让 LLM 响应提示

我们的宇宙飞船租赁应用程序的第一个版本将构建一个聊天机器人，该机器人能够使用自然语言与客户进行交互。它应该回答客户关于他们希望在太阳系中访问的行星的任何问题。如需查看完整的应用程序代码，请访问 GitHub 存储库中的“spaceship rental step-01”目录。

聊天机器人将客户的问题发送给应用程序，该应用程序与 LLM 交互，以帮助处理自然语言问题并回复客户。

应用程序中与 AI 相关的部分，我们只创建了两个文件：

一个 AI 服务， CustomerSupportAgent.java ，它构建一个提示，向 LLM 介绍我们太阳系的行星，并指示 LLM 回答客户的问题。
一个 WebSocket 端点， ChatWebSocket.java ，它接收来自聊天机器人的用户消息。

AI 服务是提供抽象层的 Java 接口。当使用 LangChain4j 时，这些接口使 LLM 交互变得更容易。AI 服务是一个集成点，因此在实际应用程序中，你需要考虑与 LLM 连接和交互的安全性、可观测性和容错性。除了处理 LLM 的连接细节（这些细节单独存储在 application.properties 配置文件中），AI 服务还构建提示并管理它发送给 LLM 的请求的聊天记忆。

提示由 AI 服务中的两条信息构建而成：系统消息和用户消息。系统消息通常由开发人员使用，用于向 LLM 提供上下文信息和处理请求的指令，通常还包括你希望 LLM 在生成响应时所遵循的示例。用户消息则是为 LLM 提供应用程序用户的请求。

CustomerSupportAgent 接口在应用程序中被注册为 AI 服务。它定义了用于构建提示的消息，并将提示发送给 LLM：

@SessionScoped@RegisterAiServicepublic interface CustomerSupportAgent {    @SystemMessage("""         You are a friendly, but terse customer service agent for Rocket"s         Cosmic Cruisers, a spaceship rental shop.        You answer questions from potential guests about the different planets        they can visit.        If asked about the planets, only use info from the fact sheet below.         """        + PlanetInfo.PLANET_FACT_SHEET)     String chat(String userMessage); }

复制代码

让我们看看这段代码在做什么。 @SessionScoped 注解在 Web 服务连接期间保持会话，并在对话期间维护聊天记忆。 @RegisterAIService 注解将接口注册为 AI 服务。LangChain4j 自动实现接口。 @SystemMessage 注解告诉 LLM 在响应提示时如何行动。

当最终用户在聊天机器人中输入消息时，WebSocket 端点将消息传递给 AI 服务中的 chat() 方法。在我们的 AI 服务接口中没有指定 @UserMessage 注解，因此 AI 服务实现自动创建一个用户消息，其值为 chat() 方法参数值（在本例中为 userMessage 参数）。AI 服务将用户的消息添加到系统消息中，以构建一个提示，并将其发送给 LLM，然后在聊天机器人界面中显示 LLM 的响应。

请注意，为了可读性，行星信息已被放置在一个单独的 PlanetInfo 类中。或者，你可以直接将行星信息放置在系统消息中。

ChatWebSocket 类为应用程序的聊天机器人 UI 定义了一个 WebSocket 端点来与之交互：

@WebSocket(path = "/chat/batch")public class ChatWebSocket {     private final CustomerSupportAgent customerSupportAgent;     public ChatWebSocket(CustomerSupportAgent customerSupportAgent) {        this.customerSupportAgent = customerSupportAgent;    }     @OnOpen    public String onOpen() {        return "Welcome to Rocket"s Cosmic Cruisers! How can I help you today?";    }     @OnTextMessage    public String onTextMessage(String message) {        return customerSupportAgent.chat(message);    }}

复制代码

CustomerSupportAgent 接口使用构造函数注入自动提供对 AI 服务的引用。当最终用户在聊天机器人中输入消息时， onTextMessage() 方法将消息传递给 AI 服务的 chat() 方法。

例如，如果用户问：“如果我想去看火山，哪个星球适合我？”应用程序会给出一个建议，并告诉用户作为一个火山迷，他可能想去那里的理由：

宇宙飞船租赁应用聊天机器人

提供记忆的错觉

随着你与聊天机器人对话的继续，它似乎意识到之前交换的消息，即对话的上下文。当你与另一个人交谈时，你理所当然地认为他们记得你（和他们）最后说了什么。然而，对 LLM 的请求是无状态的，因此每个响应仅基于请求提示中所包含的信息生成。

为了在对话中保持上下文，AI 服务使用聊天记忆，通过 LangChain4j 存储之前用户的消息和聊天机器人的响应。默认情况下，Quarkus LangChain4j 扩展将聊天存储在内存中，AI 服务根据需要管理聊天记忆（例如，通过丢弃或汇总最老的消息）以保持在内存的限制内。单独使用 LangChain4j 需要你首先配置一个记忆提供者，但使用 Quarkus LangChain4j 扩展时则不需要。这为最终用户提供了实际的记忆错觉，并改善了用户体验，使他们可以在不需要重复之前所说的一切的情况下输入后续消息。通过流式处理来自 LLM 的响应，也可以改善用户聊天机器人体验。

流式响应带来更灵敏的用户体验

你可能会注意到，对聊天消息窗口的响应需要一些时间来生成，然后一次性全部出现。为了提高聊天机器人的感知响应性，我们可以修改代码，使其在生成响应时返回每个 token。这种方法称为流式传输，允许用户在完整响应可用之前开始阅读部分响应。有关完整应用程序代码，请参阅 GitHub “spaceship rental step-02”目录。

更改我们的应用程序以实现流式传输聊天机器人响应很容易。首先，我们将更新 CustomerSupportAgent 接口，添加一个返回 SmallRye Mutiny Multi 接口实例的方法：

@SessionScoped@RegisterAiService@SystemMessage("""     You are a friendly, but terse customer service agent for Rocket"s Cosmic Cruisers, a spaceship rental shop. You answer questions from potential guests about the different planets they can visit. If asked about the planets, only use info from the fact sheet below.     """     + PlanetInfo.PLANET_FACT_SHEET) public interface CustomerSupportAgent {    String chat(String userMessage);

    Multi streamChat(String userMessage);}

复制代码

将 @SystemMessage 注解移到接口上意味着无需为接口中的每个方法都添加该注解。 streamChat() 方法每次返回一个 token 作为 LLM 对聊天窗口的响应，而不是等待一次性显示全部响应。

我们还需要从 WebSocket 端点调用新的 streamChat() 方法。为了同时保留批处理和流处理功能，我们创建了一个新的 ChatWebSocketStream 类，该类公开了 /chat/stream WebSocket 端点：

@WebSocket(path = "/chat/stream")public class ChatWebSocketStream {

    private final CustomerSupportAgent customerSupportAgent;

    public ChatWebSocketStream(CustomerSupportAgent customerSupportAgent) {        this.customerSupportAgent = customerSupportAgent;    }

    @OnOpen    public String onOpen() {        return "Welcome to Rocket"s Cosmic Cruisers! How can I help you today?";    }

    @OnTextMessage    public Multi<String> onStreamingTextMessage(String message) {        return customerSupportAgent.streamChat(message);    }}

复制代码

customerSupportAgent.streamChat() 调用会调用 AI 服务，将用户消息发送给 LLM。

在对 UI 进行了一些微调之后，我们现在可以在聊天机器人中打开和关闭流式传输功能：

启用新流式传输选项的应用程序

启用流式传输后，LLM 生成的每个 token（每个单词或词素）都会立即返回到聊天界面。

从非结构化数据中生成结构化输出

到目前为止，LLM 的输出都是针对应用程序的最终用户。但是，如果我们希望 LLM 的输出能直接被我们的应用程序使用，那该怎么办呢？当 LLM 响应请求时，负责与 LLM 交互的 AI 服务可以返回结构化输出，这些格式比 String 更结构化，如 POJO、POJO 列表和原生类型。

返回结构化输出可以显著简化 LLM 输出与 Java 代码的集成，因为它确保应用程序从 AI 服务接收到的输出能够映射到 Java 对象的预定义模式。让我们通过帮助最终用户从我们的舰队中选择一艘满足其需求的宇宙飞船来展示结构化输出的实用性。相关完整的应用程序代码，请参阅 GitHub 上的“spaceship rental step-03”目录。

我们首先创建一个简单的 Spaceship 记录，用于存储舰队中每艘飞船的信息：

record Spaceship(String name, int maxPassengers, boolean hasCargoBay, List<String> allowedDestinations) { }

复制代码

同样，为了表示用户对我们舰队中宇宙飞船的查询，我们根据用户在聊天中提供的信息创建了一个 SpaceshipQuery 记录：

@Description("A request for a compatible spaceship")public record SpaceshipQuery(int passengers, boolean hasCargo, List destinations) { }

复制代码

Fleet 类填充了多个 Spaceship 对象，并提供了一种方法来过滤掉那些与用户请求不匹配的对象。

接下来，我们更新 CustomerSupportAgent 接口，以接收用户的消息（非结构化文本），并生成 SpaceshipQuery 记录格式的结构化输出。为了实现这一目标，我们只需将 AI 服务中新方法 extractSpaceshipAttributes() 的返回类型设置为 SpaceshipQuery 即可：

SpaceshipQuery extractSpaceshipAttributes(String userMessage);

复制代码

在底层，LangChain4j 会自动生成一个请求到 LLM，其中包含一个由 JSON 模式表示的期望响应。LangChain4j 反序列化 LLM 返回的 JSON 格式响应，并使用它来按请求返回一个 SpaceshipQuery 记录。

我们还需要知道用户的输入是关于我们宇宙飞船的，还是关于其他某个话题的。这种过滤是通过使用一个更简单的结构化输出请求来实现的，该请求返回一个布尔值：

@SystemMessage("""You are a friendly, but terse customer service agent for Rocket"s Cosmic Cruisers, a spaceship rental shop. Respond with "true" if the user message is regarding spaceships in our rental fleet, and "false" otherwise.""")boolean isSpaceshipQuery(String userMessage);

复制代码

我们对 CustomerSupportAgent 接口的最后添加是，使代理能够根据我们的舰队和用户请求（无论是否包含流式传输），提供宇宙飞船的建议：

@UserMessage("""        Given the user"s query regarding available spaceships for a trip {message}, provide a well-formed, clear and concise response listing our applicable spaceships.        Only use the spaceship fleet data from {compatibleSpaceships} for your response.        """)    String suggestSpaceships(String message, List compatibleSpaceships); @UserMessage("""        Given the user"s query regarding available spaceships for a trip {message}, provide a well-formed, clear and concise response listing our applicable spaceships.        Only use the spaceship fleet data from {compatibleSpaceships} for your response.        """)Multi streamSuggestSpaceships(String message, List compatibleSpaceships);}

复制代码

我们的最后一步是更新 ChatWebSocket 和 ChatWebSocketStream 类，以便首先检查用户的查询是否是关于我们舰队中的宇宙飞船的。如果是，客户支持代理会从用户消息中提取信息，创建一个 SpaceshipQuery 记录，然后回复与用户请求兼容的建议宇宙飞船。 ChatWebSocket 和 ChatWebSocketStream 类更新的后代码是相似的，因此这里仅展示 ChatWebSocket 类：

@OnTextMessagepublic String onTextMessage(String message) {    boolean isSpaceshipQuery = customerSupportAgent.isSpaceshipQuery(message);

    if (isSpaceshipQuery) {        SpaceshipQuery userQuery = customerSupportAgent.extractSpaceshipAttributes(message);

        List<Spaceship> spaceships = Fleet.findCompatibleSpaceships(userQuery);        return customerSupportAgent.suggestSpaceships(message, spaceships);    } else         return customerSupportAgent.chat(message);}