Разбираю LLM, агентские инструменты и инфру, которую сам запускаю
vLLM, SGLang, llama.cpp, Codex, OpenCode, железо, бенчи и всё, что обычно всплывает, когда начинаешь это реально трогать.
Последний разбор
Спекулятивное декодирование в vLLM и SGLang: MTP, EAGLE-3 и n-gram в 2026
Разбираем speculative decoding в vLLM и SGLang: native MTP, Gemma 4 assistant-драфтеры, EAGLE-3, n-gram и DFLASH — где ускоряет, где ломается и как выбирать метод.
Raw Input
Последние разборы
Как бенчмаркать локальную LLM в 2026: TTFT, TPOT, KV cache, context length и VRAM
vLLM vs SGLang: radix tree против block-level prefix caching
Сравниваем подходы к prefix caching в vLLM и SGLang: hash-based блоки vs radix tree, бенчмарки на H100, когда какой движок выбрать для serving.
Оценка степени автономности ИИ-агентов на практике
Исследование реального использования ИИ‑агентов: как растёт автономность Claude Code, где люди доверяют больше, а где нужен строгий контроль — особенно в сферах с повышенным риском.
Что под капотом
Темы, которые тут чаще всего всплывают
Inference
vLLM, SGLang, KV cache, serving, бенчи и всё, что начинает болеть под нагрузкой.
Agents
Codex, OpenCode, Claude Code, MCP, skills и реальные workflows с агентами.
Local Inference
llama.cpp, локальные модели, кванты, контекст, VRAM и всё, что всплывает при запуске дома.
Homelab / Ops
Железо, GPU, сети, туннели, локальный инференс и всё, что работает ровно до первого reboot.
Tools From The Lab
Не каталог приложений. Просто штуки, которые живут рядом
Часть проектов работает как источник сигналов, часть как отдельные эксперименты. Таблицу убрал: статус и стек тут не главное.
GitHub Trending Dashboard
Смотрю, что растёт в open source и какие инструменты начинают всплывать чаще обычного.
AI Slop News
Поток AI-релизов, моделей и новостей. Не финальный вывод, а сырьё для следующих разборов.
Hermes Managed
Персональный Telegram-агент как живой продуктовый эксперимент. Две кнопки, изолированная среда, нормальная модель.
Держу в курсе
Основной поток всё равно в Telegram
Короткие сигналы, быстрые выводы, релизы, железо, модели и иногда очень странные новости.
