🦾 项目名称: llama2-webui
🛠 项目功能: 在(Linux/Windows/Mac,✏️ 项目介绍: 从任何地方(Linux/Windows/Mac)在 GPU 或 CPU 上使用 gradio Web UI 运行 Llama 2。
支持8位、4位的Llama-2-7B/13B/70B。支持GPU推理(6 GB VRAM)和CPU推理。
🌟项目特征:
- 支持所有 Llama 2 模型(7B、13B、70B、GPTQ、GGML),具有 8 位、4 位模式。
- 支持至少 6 GB VRAM 的 GPU 推理和 CPU 推理。
🧩 项目地址
🔔 分享频道: @LCGFX