Llama 3.2 是一组多语言大语言模型(LLM),包括 1B 和 3B 参数规模的预训练及指令微调生成模型(文本输入/输出)。
Llama 3.2 的指令微调版本专为多语言对话场景优化,支持如检索增强问答(RAG)、摘要等任务。
该系列模型在多个行业通用基准测试中超越了大量开源与闭源聊天模型。
基础模型 提供 128 令牌上下文窗口和最多 1,024 个输出令牌。
支持平台:LLM630 Compute Kit、Module LLM、Module LLM Kit
apt install llm-model-llama3.2-1b-prefill-ax630c
长上下文模型 相较于基础模型提供更大的上下文处理能力,支持 256 令牌上下文窗口。
支持平台:LLM630 Compute Kit、Module LLM、Module LLM Kit
apt install llm-model-llama3.2-1b-p256-ax630c