Optimizing Model Selection for Compound AI Systems

作者: Lingjiao Chen, Jared Quincy Davis, Boris Hanin, Peter Bailis, Matei Zaharia, James Zou, Ion Stoica

发布时间: 2025-02-24

来源: arxiv

研究方向: 人工智能系统优化与模型选择

主要内容

本文研究了如何为复合人工智能系统中的每个模块选择最佳的LLM(大型语言模型),以提高整体性能。作者提出了一种名为LLMSelector的框架,该框架利用两个关键经验洞察:1)端到端性能通常是每个模块性能的增函数;2)每个模块的性能可以通过LLM进行准确估计。

主要贡献

1. 提出复合人工智能系统中的模型选择问题(MSP)。

2. 设计LLMSelector框架,通过迭代选择模块并为其分配具有最高模块性能的模型来优化MSP。

3. 证明LLMSelector在模型选择方面优于将相同LLM分配给所有模块。

4. 在多个实际复合人工智能系统上进行了实验,证明了LLMSelector的有效性。

5. 发布开源代码和数据,以促进对该领域的研究。

研究方法

1. 端到端性能分析

2. 模块性能估计

3. 迭代模型选择

4. 实验验证

实验结果

实验结果表明,LLMSelector与将相同LLM分配给所有模块相比,在性能上提高了5%-70%。此外,LLMSelector的性能优于专门用于提示优化的高级技术。

未来工作

未来可以进一步研究如何将LLMSelector应用于动态复合人工智能系统,以及如何提高LLM诊断器的准确性。此外,还可以探索将LLMSelector与其他优化技术相结合的方法,以进一步提高复合人工智能系统的性能。