moondream3-preview está disponible en Hugging Face modelo de lenguaje de visión con una arquitectura de mezcla de expertos (9B parámetros totales, 2B activos) Ofrecer un razonamiento visual SOTA sin dejar de ser eficiente y fácil de implementar vibe codificó una aplicación rápida para ello en anycoder