通义万相 Agent 开发：打造智能代理的未来

Qwen-Agent 的概述

Qwen-Agent 概述

Qwen-Agent 是阿里通义推出的开源 AI Agent 开发框架，旨在帮助开发者构建具有多种智能能力的应用。该框架依托于通义千问模型，支持指令遵循、工具使用、记忆能力以及复杂的多代理框架架构。Qwen-Agent 的设计使其能够处理超大规模的文档，支持从 8K 到 100 万 tokens 的文本处理能力。因此，它在长上下文处理和智能代理应用中展现出了显著的优势。

Qwen-Agent 的功能特性

Qwen-Agent 提供了一系列强大的功能特性，使其在智能代理开发中独具优势。

指令遵循

Qwen-Agent 能够理解并执行用户的指令，通过自然语言处理技术，它能准确解析指令意图并做出相应的响应。这一能力使其在客户服务、个人助手等场景中大显身手。

工具使用

框架支持智能体调用外部工具完成任务。例如，Qwen-Agent 可以集成 API 或外部程序来扩展其功能，提供更为全面的服务。

记忆能力

Qwen-Agent 具备记忆上下文的能力，能够在对话中保持状态。这使得它在复杂的对话场景中能够提供连续性的用户体验。

技术原理与架构

Qwen-Agent 的技术基础是大型预训练语言模型（LLM），如 Qwen 模型。它集成了丰富的工具，并通过智能代理架构实现了高度的可扩展性。

大语言模型（LLM）

大语言模型是 Qwen-Agent 的核心，负责处理复杂的语言任务。通过预训练，Qwen 模型能够理解和生成丰富的文本内容。

工具集成与智能代理架构

智能代理架构允许开发者通过继承 Agent 类实现具体的应用逻辑，结合集成的各种工具，Qwen-Agent 能够高效地处理任务。

RAG 算法

RAG（检索增强生成）算法用于处理长文档，将文档分割成小块并保留最相关的部分，从而提升上下文处理能力。

Qwen-Agent 的应用场景

Qwen-Agent 广泛应用于客户服务、教育学习、内容创作和数据分析等场景。

客户服务

在客户服务中，Qwen-Agent 可用作智能客服，处理客户查询、提供即时信息。

教育与学习

在教育领域，Qwen-Agent 能够为学生提供个性化学习建议，回答问题并提供知识拓展。

内容创作与数据分析

Qwen-Agent 支持内容创作，通过生成文本内容和分析数据，为创作者和分析师提供支持。

如何运行 Qwen-Agent

安装

安装 Qwen-Agent 非常简单，可以通过 pip 命令快速完成：

pip install -U "qwen-agent[gui,rag,code_interpreter,python_executor]"

开发自定义 Agent

以下是如何创建一个自定义 Agent 的示例，该 Agent 能够读取 PDF 文件并使用工具生成图像 URL：

import pprint

import urllib.parse

import json5

from qwen_agent.agents import Assistant

from qwen_agent.tools.base import BaseTool, register_tool



@register_tool('my_image_gen')

class MyImageGen(BaseTool):

    description = 'AI 绘画（图像生成）服务，输入文本描述，返回基于文本信息绘制的图像 URL。'

    parameters = [{

        'name': 'prompt',

        'type': 'string',

        'description': '所需图像内容的详细描述，使用英文',

        'required': True

    }]



    def call(self, params: str, **kwargs) -> str:

        prompt = json5.loads(params)['prompt']

        prompt = urllib.parse.quote(prompt)

        return json5.dumps(

            {'image_url': f'https://image.pollinations.ai/prompt/{prompt}'},

            ensure_ascii=False)



llm_cfg = {

    'model': 'qwen-max',

    'model_server': 'dashscope',

    'generate_cfg': {

        'top_p': 0.8

    }

}



system_instruction = '''你是一个有用的助手。在收到用户的请求后，你应该：- 首先绘制图像并获取图像 URL，- 然后运行代码 request.get(image_url) 下载图像，- 最后从给定的文档中选择一个图像操作来处理图像。请使用 plt.show() 显示图像。'''

bot = Assistant(llm=llm_cfg, system_message=system_instruction, function_list=['my_image_gen', 'code_interpreter'], files=['./examples/resource/doc.pdf'])

messages = []
while True:
    query = input('用户查询: ')
    messages.append({'role': 'user', 'content': query})
    response = []
    for response in bot.run(messages=messages):
        print('助手响应:')
        pprint.pprint(response, indent=2)
    messages.extend(response)