技术报告:https://sites.google.com/view/eagle-llm 代码(支持商用 Apache 2.0):https://github.com/SafeAILab/EAGLE
比普通自回归解码(13B)快 3 倍; 比 Lookahead 解码(13B)快 2 倍; 比 Medusa 解码(13B)快 1.6 倍; 可以证明在生成文本的分布上与普通解码保持一致; 可以在 RTX 3090 上进行训练(1-2 天内)和测试; 可以与 vLLM、DeepSpeed、Mamba、FlashAttention、量化和硬件优化等其他平行技术结合使用。
![图片](https://image.jiqizhixin.com/uploads/editor/dffc3751-7873-49af-8f86-40154e5b8fe9/640.png)
![](https://image.jiqizhixin.com/uploads/editor/57a4314d-bcd4-43cb-9cb7-3adfc3269c63/1702534490142.png)