Nvidia, KVTC, IA, memória, modelos de linguagem

Nvidia Revoluciona Memória em IA com KV Cache Transform Coding

KVTC da Nvidia reduz memória em 20x para IA, acelerando o primeiro token em até 8x.

3 horas ago