TLDR: TurboQuant comprime la memoria caché KV de IA hasta cinco veces con un impacto mínimo en la calidad del modelo. La actualización permite que los portátiles y teléfonos ejecuten IA durante más tiempoTLDR: TurboQuant comprime la memoria caché KV de IA hasta cinco veces con un impacto mínimo en la calidad del modelo. La actualización permite que los portátiles y teléfonos ejecuten IA durante más tiempo

Tether lleva TurboQuant de Google a producción, desbloqueando IA de contexto largo en dispositivos cotidianos

Fuente: Blockonomi

2026/06/02 07:46

Lectura de 4 min

AI$0.03159+3.13%

LONG$0.000736-0.63%

Si tienes comentarios o inquietudes sobre este contenido, comunícate con nosotros mediante crypto.news@mexc.com

TLDR:

TurboQuant comprime la memoria caché KV de IA hasta cinco veces con un impacto mínimo en la calidad del modelo.
La actualización permite a laptops y teléfonos ejecutar sesiones de IA más largas sin dependencia de la nube.
QVAC SDK 0.12.0 integra TurboQuant en Fabric, ampliando las opciones de desarrollo de IA local.
Tether busca avanzar en la IA centrada en la privacidad acercando la inferencia eficiente a los usuarios finales.

El Grupo de Investigación de IA de Tether ha lanzado una versión de producción de código abierto de TurboQuant, un algoritmo de compresión de memoria desarrollado originalmente por Google Research.

El lanzamiento forma parte de QVAC SDK 0.12.0 y está dirigido a laptops, teléfonos, dispositivos edge y redes descentralizadas. Permite a los modelos de IA locales gestionar sesiones más largas sin depender de infraestructura en la nube.

Esto marca un cambio práctico en la forma en que la IA en dispositivos gestiona tareas con uso intensivo de memoria.

TurboQuant Comprime la Memoria de IA hasta Cinco Veces

La memoria ha sido durante mucho tiempo una barrera para ejecutar modelos de IA capaces en hardware de consumo. Cuando un asistente de IA procesa un documento largo o una conversación, almacena ese contexto en lo que se denomina caché KV.

Con aproximadamente 262.000 tokens, la caché KV de un modelo 4B puede consumir alrededor de 8 GB de memoria por sí sola. Cuatro sesiones simultáneas pueden elevar esa cifra a 32 GB antes de considerar el modelo en sí.

TurboQuant aborda esto comprimiendo la caché KV hasta cinco veces mientras mantiene la calidad de salida cercana a la de un modelo sin comprimir.

Un usuario puede ahora pedirle a un asistente en una laptop que analice un documento legal de cien páginas sin necesidad de subirlo a un servidor remoto.

Estudiantes, desarrolladores, periodistas e investigadores pueden beneficiarse de sesiones de IA más largas y con mayor conciencia del contexto en dispositivos que ya poseen.

Al hablar sobre el razonamiento más amplio detrás del lanzamiento, el CEO de Tether, Paolo Ardoino, señaló la brecha entre la investigación y el software práctico.

"La investigación de Google mostró que la memoria de IA podía comprimirse de manera mucho más eficiente de lo que la mayoría de la gente suponía," dijo. "Nuestro trabajo lleva ese avance al software de producción con el que desarrolladores, startups y usuarios pueden realmente construir."

La versión de producción incluye un pipeline completo de cuantización, adaptadores de framework, documentación para desarrolladores y perfiles ajustados a la carga de trabajo.

Estos componentes están diseñados para entornos reales fuera de los centros de datos a hiperescala, cubriendo memoria limitada, hardware mixto y despliegues sensibles a la latencia.

QVAC SDK 0.12.0 Amplía las Opciones de Desarrollo de IA Local

TurboQuant se incluye como parte de QVAC SDK 0.12.0, integrado directamente en Fabric, un componente central del stack de QVAC.

Fabric comenzó como un fork de llama.cpp y desde entonces ha crecido para incorporar múltiples avances de investigación. El SDK ofrece a los desarrolladores un conjunto unificado de herramientas, bibliotecas y componentes de tiempo de ejecución para crear aplicaciones de IA locales.

Para startups y desarrolladores independientes, esto elimina la suposición de que los grandes productos de IA requieren costosos clústeres de GPU.

Los equipos pueden ahora diseñar para ventanas de contexto más largas, cargas de trabajo de archivos más grandes y despliegue flexible en hardware de consumo y edge. Eso abre caminos prácticos para crear productos de IA sin arquitectura exclusiva en la nube.

Ante las preocupaciones sobre la privacidad de los datos y la dependencia de la nube, Ardoino defendió mantener las tareas de IA en dispositivos locales.

"Las personas deberían poder pedirle a un asistente de IA que lea un documento largo o trabaje con información privada sin que cada tarea sea forzada a través de un centro de datos remoto," dijo. TurboQuant, en ese sentido, otorga a la IA local más margen operativo.

La estrategia de Tether se centra en una IA que funcione más cerca de los usuarios, en dispositivos personales y redes descentralizadas. La empresa considera la eficiencia del software y la portabilidad como factores determinantes en la próxima fase del desarrollo de la IA, junto con la infraestructura de cómputo a gran escala.

La publicación Tether lleva TurboQuant de Google a producción, desbloqueando la IA de contexto largo en dispositivos cotidianos apareció primero en Blockonomi.

Oportunidad de mercado

Precio de Gensyn(AI)

$0.03159

$0.03159$0.03159

-1.74%

USD

Gráfico de precios en vivo de Gensyn (AI)

Launchpad de SPACEX(PRE)

Regístrate para ganar un sorteo gratis

Aviso legal: Los artículos republicados en este sitio provienen de plataformas públicas y se ofrecen únicamente con fines informativos. No reflejan necesariamente la opinión de MEXC. Todos los derechos pertenecen a los autores originales. Si consideras que algún contenido infringe derechos de terceros, comunícate a la dirección crypto.news@mexc.com para solicitar su eliminación. MEXC no garantiza la exactitud, la integridad ni la actualidad del contenido y no se responsabiliza por acciones tomadas en función de la información proporcionada. El contenido no constituye asesoría financiera, legal ni profesional, ni debe interpretarse como recomendación o respaldo por parte de MEXC.

Noticias en tendencia

Más

Noticias en vivo 24/7

Más

La alta volatilidad en el mercado cripto afecta a las posiciones grandes.

Autor: DEG10:36

HYPE superó a la mayor parte del mercado cripto en más de un 100% el año pasado.

Autor: bolivian07:35

TAO figura entre las principales apuestas alcistas para el primer trimestre en el debate sobre el mercado cripto.

Autor: CRYPTO THRO06:55

CME lanzó operaciones de futuros y opciones de criptomonedas, impactando a BTC.

Autor: Rockerfeller04:25

Posible suelo formándose en Ethereum; los toros necesitan confirmación por encima de 2157.

Autor: CRG03:45

Precios de criptos

Bitcoin

BTC

$70,753.21

$70,753.21$70,753.21

-0.52%

Ethereum

ETH

$1,998.12

$1,998.12$1,998.12

+1.51%

USDCoin

USDC

$1.00113

$1.00113$1.00113

0.00%

Solana

SOL

$80.45

$80.45$80.45

+1.06%

Binance Coin

BNB

$688.06

$688.06$688.06

+1.54%

Stocks (Beta) ya disponible

Opera acciones de EE. UU. con un corredor regulado

Tether lleva TurboQuant de Google a producción, desbloqueando IA de contexto largo en dispositivos cotidianos

TLDR:

TurboQuant Comprime la Memoria de IA hasta Cinco Veces

QVAC SDK 0.12.0 Amplía las Opciones de Desarrollo de IA Local

También te puede interesar

Perspectivas de precio de Internet Computer (ICP) 2026-2030: ¿Puede alcanzar los $25?

Weiss Crypto dice que la mejor oportunidad de compra de Bitcoin en años puede estar cerca

Estampida de traders de Altcoins comienza: APEMARS alcanza $500K recaudados con LAUNCH350 entre las 9 mejores monedas en la carrera 100x

Noticias en tendencia

Una startup china de robótica logra un acuerdo con Nvidia y la aprobación de una OPV de 616 millones de dólares

ENI integra DODO en el proyecto Super Node para impulsar el crecimiento del Ecosistema

El suelo de $2,000 del precio de Ethereum cede ante la persistente presión vendedora

EdgeX atribuye la caída del 70% del token EDGE a la manipulación del mercado, no a una brecha de seguridad

El Precio de la Plata Sube a Cerca de $75.70 a Medida que Resurgen las Esperanzas de un Acuerdo entre EE.UU. e Irán

Noticias en vivo 24/7

Precios de criptos