1034 терминов с определениями
Квантизированная LoRA для экономии памяти
Высокопроизводительная векторная база данных
Значение делящее данные на равные части
Сжатие модели снижением точности весов
Запрос в механизме внимания трансформера
Тройка запрос-ключ-значение в внимании
Автоматический ответ на вопрос