1	# модель на Hugging Face:
2	google/diffusiongemma-26B-A4B-it
3
4	# поддерживается из коробки:
5	# - Hugging Face Transformers
6	# - vLLM(с интеграцией от Red Hat)
7	# - MLX(для Mac на Apple Silicon)
8	# llama.cpp — обещают поддержку «скоро»

DiffusionGemma — нейросеть Google, которая пишет текст из шума (и в 4 раза быстрее)

Смотрите также