Lokale LLMs für Home Assistant: Llama 3.1 8B mit 200ms-Latency
Llama 3.1 8B läuft offline auf AMD-Ryzen unter 200ms first-token. Voice-Pipeline für Home Assistant ohne Cloud — Setup, Hardware, ehrliche Limits.
Das deutsche Lab für AI × Smart Home.
smart-home-blog.net
Llama, Voice, Vision auf eigener Hardware
4 Kategorien · 1 Beitrag
Claude / Gemini / OpenAI integrieren
4 Kategorien · 0 Beiträge
Lokal vs Cloud, Patterns, Tool-Calling
4 Kategorien · 0 Beiträge
HA, ESPHome, Matter, Hardware
5 Kategorien · 0 Beiträge
VPN, Backup, Tutorials
5 Kategorien · 0 Beiträge
Llama 3.1 8B läuft offline auf AMD-Ryzen unter 200ms first-token. Voice-Pipeline für Home Assistant ohne Cloud — Setup, Hardware, ehrliche Limits.