LLM Restricted

Falcon 180B

180B параметров · Transformer · Контекст 2k · TII · 2023

VRAM по точности

Точность VRAM Качество Рекомендация
FP16 360 ГБ Максимальное Для продакшена
FP8 180 ГБ Отличное Оптимально
INT8 180 ГБ Хорошее
INT4/Q4 90 ГБ Приемлемое Для экспериментов

Совместимые GPU

GPU VRAM Поддерживает
80 ГБ FP16, FP8, INT8, INT4 Арендовать
141 ГБ FP16, FP8, INT8, INT4 Арендовать

Рекомендуемые фреймворки

Быстрый старт

vllm
docker run --gpus all -p 8000:8000 vllm/vllm-openai:latest \
  --model falcon-180B-chat \
  --quantization fp8

Характеристики модели

Технические параметры

Разработчик
TII
Год выпуска
2023
Параметры
180B
Архитектура
Transformer
Контекстное окно
2,048 токенов
Лицензия
Restricted

Применение

Instruction following Text generation Research

Falcon 180B — крупная модель Technology Innovation Institute. На момент выхода занимала первое место в Open LLM Leaderboard. Требует значительных вычислительных ресурсов для деплоя.