LADs: Leveraging LLMs for AI-Driven DevOps

作者: Ahmad Faraz Khan, Azal Ahmad Khan, Anas Mohamed, Haider Ali, Suchithra Moolinti, Sabaat Haroon, Usman Tahir, Mattia Fazzini, Ali R. Butt, Ali Anwar

发布时间: 2025-03-03

来源: arxiv

研究方向: 人工智能驱动的DevOps自动化与云管理

主要内容

该研究提出了一种名为LADs的基于大型语言模型（LLM）的框架，旨在解决云配置和部署的自动化问题。LADs通过结合多种优化技术，如指令提示、检索增强生成、少量学习、思维链和反馈式提示链，实现自动化云管理，确保配置的准确性和效率。

主要贡献

1. 提出了一种基于LLM的统一方法，结合了指令提示、超参数调整、少量学习、检索增强生成和思维链等技术。

2. 开发了基于反馈的提示链方法，用于维护工作，通过将错误日志和阶段详细信息发送回LLM代理来提高可靠性。

3. 开发了一种方法，通过检索增强生成选择性地纳入领域特定知识，通过指令提示和思维链纳入用户意图，以降低成本并缓解上下文窗口限制。

4. 提供了第一个用于静态和动态验证自动化DevOps和评估与用户意图对齐的基准和数据集。

5. 分析了性能增益和运营成本之间的权衡，为寻求在规模上优化LLM部署的从业者提供指导。

6. 设计了一个智能和可扩展的框架，通过降低误配置风险和确保稳健的云应用程序管理来减轻DevOps团队的工作负担。

研究方法

1. 指令提示（IP）

2. 检索增强生成（RAG）

3. 少量学习（FSL）

4. 思维链（CoT）

5. 反馈式提示链

6. 静态和动态验证

7. 结构化日志分析

实验结果

实验结果表明，LADs在减少手动工作、优化资源利用和提高系统可靠性方面表现出色。在静态验证中，LADs优于所有其他优化技术。在动态验证中，LADs有效地根据用户意图对齐配置，并提高了资源利用率和成本效益。

未来工作

未来工作将包括自动化将分布式系统添加到LADs中的过程，扩展LADs以支持未见过的系统，并进一步改进LLM的推理能力。