LADs: Leveraging LLMs for AI-Driven DevOps

作者: Ahmad Faraz Khan, Azal Ahmad Khan, Anas Mohamed, Haider Ali, Suchithra Moolinti, Sabaat Haroon, Usman Tahir, Mattia Fazzini, Ali R. Butt, Ali Anwar

发布时间: 2025-03-03

来源: arxiv

研究方向: 人工智能驱动的DevOps自动化与云管理

主要内容

该研究提出了一种名为LADs的基于大型语言模型(LLM)的框架,旨在解决云配置和部署的自动化问题。LADs通过结合多种优化技术,如指令提示、检索增强生成、少量学习、思维链和反馈式提示链,实现自动化云管理,确保配置的准确性和效率。

主要贡献

1. 提出了一种基于LLM的统一方法,结合了指令提示、超参数调整、少量学习、检索增强生成和思维链等技术。

2. 开发了基于反馈的提示链方法,用于维护工作,通过将错误日志和阶段详细信息发送回LLM代理来提高可靠性。

3. 开发了一种方法,通过检索增强生成选择性地纳入领域特定知识,通过指令提示和思维链纳入用户意图,以降低成本并缓解上下文窗口限制。

4. 提供了第一个用于静态和动态验证自动化DevOps和评估与用户意图对齐的基准和数据集。

5. 分析了性能增益和运营成本之间的权衡,为寻求在规模上优化LLM部署的从业者提供指导。

6. 设计了一个智能和可扩展的框架,通过降低误配置风险和确保稳健的云应用程序管理来减轻DevOps团队的工作负担。

研究方法

1. 指令提示(IP)

2. 检索增强生成(RAG)

3. 少量学习(FSL)

4. 思维链(CoT)

5. 反馈式提示链

6. 静态和动态验证

7. 结构化日志分析

实验结果

实验结果表明,LADs在减少手动工作、优化资源利用和提高系统可靠性方面表现出色。在静态验证中,LADs优于所有其他优化技术。在动态验证中,LADs有效地根据用户意图对齐配置,并提高了资源利用率和成本效益。

未来工作

未来工作将包括自动化将分布式系统添加到LADs中的过程,扩展LADs以支持未见过的系统,并进一步改进LLM的推理能力。