DSR-Labs

Plan de Benchmarks

No basta con que funcione; debe ser eficiente.

Es vital medir la experiencia “Low-Cost”:

Impacto de Cuantización: Comparar Q4_K_M vs Q8_0 en CPU.
Consumo de Threads: Evaluar cuántos hilos de CPU optimizan la velocidad antes de generar overhead.
Latencia de RAM: Diferencia entre DDR4 y DDR5 para inferencia IA.

Para garantizar la integridad de los resultados en esta fase temprana (Notebook Stage):

Aislamiento Local: Se cerrarán todas las aplicaciones no esenciales y se reiniciará el servicio de inferencia antes de cada prueba.
Nodos de la Comunidad: Invitamos a quienes tengan acceso a servidores Proxmox o hardware dedicado a ejecutar estos planes y compartir sus logs. Buscamos donaciones de tiempo de cómputo para validar estos modelos en alta disponibilidad.
Versiones: Se testearán cuantizaciones Q4, Q8 y FP16 para comparar pérdida de precisión vs velocidad.