خلاصه: TurboQuant حافظه کش KV هوش مصنوعی را تا پنج برابر فشرده می‌کند و تأثیر حداقلی بر کیفیت مدل دارد. این ارتقاء به لپ‌تاپ‌ها و تلفن‌های همراه امکان می‌دهد تا هوش مصنوعی را برای مدت طولانی‌تری اجرا کنندخلاصه: TurboQuant حافظه کش KV هوش مصنوعی را تا پنج برابر فشرده می‌کند و تأثیر حداقلی بر کیفیت مدل دارد. این ارتقاء به لپ‌تاپ‌ها و تلفن‌های همراه امکان می‌دهد تا هوش مصنوعی را برای مدت طولانی‌تری اجرا کنند

تتر فناوری TurboQuant گوگل را به مرحله تولید می‌رساند و هوش مصنوعی با بافت طولانی را در دستگاه‌های روزمره فعال می‌کند

2026/06/02 07:46
مدت مطالعه: 4 دقیقه
برای ارائه بازخورد یا طرح هرگونه نگرانی درباره این محتوا، لطفاً با ما از طریق crypto.news@mexc.com تماس بگیرید.

TLDR:

  • TurboQuant حافظه KV cache هوش مصنوعی را تا پنج برابر فشرده می‌کند با حداقل تأثیر بر کیفیت مدل.
  • این ارتقا به لپ‌تاپ‌ها و گوشی‌ها امکان می‌دهد بدون وابستگی به فضای ابری، جلسات طولانی‌تر هوش مصنوعی را اجرا کنند.
  • QVAC SDK 0.12.0 با ادغام TurboQuant در Fabric، گزینه‌های توسعه هوش مصنوعی محلی را گسترش می‌دهد.
  • Tether با هدف پیشبرد هوش مصنوعی متمرکز بر حریم خصوصی، استنتاج کارآمد را به کاربران نهایی نزدیک‌تر می‌کند.

گروه تحقیقات هوش مصنوعی Tether نسخه تولیدی متن‌باز TurboQuant را منتشر کرده است، الگوریتم فشرده‌سازی حافظه‌ای که در اصل توسط Google Research توسعه یافته بود.

این انتشار بخشی از QVAC SDK 0.12.0 است و لپ‌تاپ‌ها، گوشی‌ها، دستگاه‌های لبه و شبکه‌های غیرمتمرکز را هدف قرار می‌دهد. این ابزار به مدل‌های هوش مصنوعی محلی امکان می‌دهد بدون تکیه بر زیرساخت ابری، جلسات طولانی‌تری را مدیریت کنند.

این رویداد تحولی عملی در نحوه مدیریت وظایف حافظه‌بر توسط هوش مصنوعی روی دستگاه را نشان می‌دهد.

TurboQuant حافظه هوش مصنوعی را تا پنج برابر فشرده می‌کند

حافظه از دیرباز مانعی برای اجرای مدل‌های هوش مصنوعی کارآمد روی سخت‌افزار مصرف‌کننده بوده است. هنگامی که یک دستیار هوش مصنوعی یک سند یا مکالمه طولانی را پردازش می‌کند، آن متن را در چیزی به نام KV cache ذخیره می‌کند.

در حدود ۲۶۲٬۰۰۰ توکن، KV cache برای یک مدل ۴B می‌تواند به تنهایی حدود ۸ گیگابایت حافظه مصرف کند. چهار جلسه همزمان می‌توانند این رقم را پیش از احتساب خود مدل به ۳۲ گیگابایت برسانند.

TurboQuant این مشکل را با فشرده‌سازی KV cache تا پنج برابر برطرف می‌کند و در عین حال کیفیت خروجی را نزدیک به مدل فشرده‌نشده حفظ می‌کند.

اکنون یک کاربر می‌تواند از دستیار مبتنی بر لپ‌تاپ بخواهد یک سند حقوقی صد صفحه‌ای را بدون آپلود آن به سرور راه دور تحلیل کند.

دانشجویان، توسعه‌دهندگان، روزنامه‌نگاران و پژوهشگران همگی می‌توانند از جلسات هوش مصنوعی طولانی‌تر و آگاه‌تر از زمینه روی دستگاه‌هایی که از قبل دارند بهره‌مند شوند.

در سخن گفتن درباره دلایل گسترده‌تر پشت این انتشار، مدیرعامل Tether، Paolo Ardoino، به شکاف بین تحقیقات و نرم‌افزار عملی اشاره کرد.

"تحقیقات Google نشان داد که حافظه هوش مصنوعی می‌تواند بسیار کارآمدتر از آنچه اکثر مردم فرض می‌کردند فشرده شود،" او گفت. "کار ما این پیشرفت را به نرم‌افزار تولیدی می‌آورد که توسعه‌دهندگان، استارتاپ‌ها و کاربران واقعاً می‌توانند با آن بسازند."

نسخه تولیدی شامل یک خط لوله کوانتیزاسیون کامل، آداپتورهای چارچوب، مستندات توسعه‌دهنده و پروفایل‌های تنظیم‌شده برای بار کاری است.

این اجزا برای محیط‌های واقعی خارج از مراکز داده فوق‌بزرگ طراحی شده‌اند و حافظه محدود، سخت‌افزار مختلط و استقرارهای حساس به تأخیر را پوشش می‌دهند.

QVAC SDK 0.12.0 گزینه‌های توسعه هوش مصنوعی محلی را گسترش می‌دهد

TurboQuant به عنوان بخشی از QVAC SDK 0.12.0 عرضه می‌شود و مستقیماً در Fabric، یک مؤلفه اصلی پشته QVAC، ادغام شده است.

Fabric به عنوان یک فورک llama.cpp آغاز شد و از آن زمان به تدریج پیشرفت‌های تحقیقاتی متعددی را در بر گرفته است. این SDK به توسعه‌دهندگان مجموعه‌ای یکپارچه از ابزارها، کتابخانه‌ها و اجزای زمان اجرا برای ساختن برنامه‌های هوش مصنوعی محلی ارائه می‌دهد.

برای استارتاپ‌ها و توسعه‌دهندگان مستقل، این امر این فرض را که محصولات بزرگ هوش مصنوعی نیاز به خوشه‌های GPU گران‌قیمت دارند از بین می‌برد.

تیم‌ها اکنون می‌توانند برای پنجره‌های زمینه طولانی‌تر، بار کاری فایل‌های بزرگ‌تر و استقرار انعطاف‌پذیر در سخت‌افزار مصرف‌کننده و لبه طراحی کنند. این مسیرهای عملی برای ساختن محصولات هوش مصنوعی بدون معماری صرفاً ابری را باز می‌کند.

در پاسخ به نگرانی‌های مربوط به حریم خصوصی داده و وابستگی به فضای ابری، Ardoino برای نگه داشتن وظایف هوش مصنوعی روی دستگاه‌های محلی استدلال کرد.

"مردم باید بتوانند از یک دستیار هوش مصنوعی بخواهند یک سند طولانی را بخواند یا اطلاعات خصوصی را پردازش کند بدون اینکه هر وظیفه‌ای مجبور باشد از یک مرکز داده راه دور عبور کند،" او گفت. TurboQuant، در این معنا، به هوش مصنوعی محلی فضای عملیاتی بیشتری می‌دهد.

استراتژی Tether بر هوش مصنوعی‌ای متمرکز است که به کاربران نزدیک‌تر اجرا می‌شود، در دستگاه‌های شخصی و شبکه‌های غیرمتمرکز. این شرکت کارایی و قابلیت حمل نرم‌افزار را به عنوان عوامل تعیین‌کننده در مرحله بعدی توسعه هوش مصنوعی می‌بیند، در کنار زیرساخت محاسباتی در مقیاس بزرگ.

این مطلب با عنوان Tether Brings Google's TurboQuant to Production, Unlocking Long-Context AI on Everyday Devices برای اولین بار در Blockonomi منتشر شد.

فرصت‌ های بازار
لوگو Gensyn
قیمت لحظه ای Gensyn(AI)
$0.03166
$0.03166$0.03166
-1.52%
USD
نمودار قیمت لحظه ای Gensyn (AI)

لانچ‌پد SPACEX(PRE)

لانچ‌پد SPACEX(PRE)لانچ‌پد SPACEX(PRE)

ثبت‌نام کنید و شانس قرعه‌کشی رایگان ببرید

سلب مسئولیت: مطالب بازنشرشده در این وب‌ سایت از منابع عمومی گردآوری شده‌ اند و صرفاً به‌ منظور اطلاع‌ رسانی ارائه می‌ شوند. این مطالب لزوماً بازتاب‌ دهنده دیدگاه‌ ها یا مواضع MEXC نیستند. کلیه حقوق مادی و معنوی آثار متعلق به نویسندگان اصلی است. در صورت مشاهده هرگونه محتوای ناقض حقوق اشخاص ثالث، لطفاً از طریق آدرس ایمیل crypto.news@mexc.com با ما تماس بگیرید تا مورد بررسی و حذف قرار گیرد.MEXC هیچ‌ گونه تضمینی نسبت به دقت، جامعیت یا به‌ روزبودن اطلاعات ارائه‌ شده ندارد و مسئولیتی در قبال هرگونه اقدام یا تصمیم‌ گیری مبتنی بر این اطلاعات نمی‌ پذیرد. همچنین، محتوای منتشرشده نباید به‌عنوان توصیه مالی، حقوقی یا حرفه‌ ای تلقی شود و به منزله پیشنهاد یا تأیید رسمی از سوی MEXC نیست.

محتوای پیشنهادی

گری‌اسکیل به راه‌اندازی ETF‌های Hyperliquid نزدیک می‌شود در حالی که رقابت کارمزدها تشدید می‌شود

گری‌اسکیل به راه‌اندازی ETF‌های Hyperliquid نزدیک می‌شود در حالی که رقابت کارمزدها تشدید می‌شود

شرکت و صندوق سرمایه گذاری گری اسکیل با افزودن کارمزد اسپانسر ۰.۲۹٪ و نماد HYPG به پرونده ثبت اصلاح‌شده خود، به راه‌اندازی صندوق قابل معامله در بورس Hyperliquid نزدیک‌تر شده است
اشتراک
Crypto.news2026/06/02 04:46
طلا کاهش یافت؛ آتش‌بس شکننده آمریکا و ایران دلار آمریکا و بازارهای نفت را تکان داد

طلا کاهش یافت؛ آتش‌بس شکننده آمریکا و ایران دلار آمریکا و بازارهای نفت را تکان داد

بیتکوین‌ورلد: طلا کاهش یافت زیرا آتش‌بس شکننده آمریکا-ایران بازارهای دلار آمریکا و نفت را تکان داد قیمت طلا در روز سه‌شنبه با کاهش شدیدی مواجه شد زیرا یک توافق آتش‌بس شکننده
اشتراک
bitcoinworld2026/06/02 03:50
معامله‌گران هوشمند برای قفل کردن BlockDAG در قیمت ۰.۰۰۰۰۰۰۱۲ دلار هجوم می‌برند در حالی که Solana و Pi Network توجه‌ها را از دست می‌دهند

معامله‌گران هوشمند برای قفل کردن BlockDAG در قیمت ۰.۰۰۰۰۰۰۱۲ دلار هجوم می‌برند در حالی که Solana و Pi Network توجه‌ها را از دست می‌دهند

بازارهای دیجیتال شاهد یک سازماندهی مجدد گسترده هستند، زیرا پول از غول‌های قدیمی شبکه به سیستم‌های جدید با استفاده بالا در حال جابجایی است. این تغییر بزرگ به شدت در حال حرکت دادن عمده
اشتراک
CryptoReporter2026/06/02 03:56

معاملات سهام (نسخه بتا) فعال شد

معاملات سهام (نسخه بتا) فعال شدمعاملات سهام (نسخه بتا) فعال شد

سهام آمریکا را از طریق کارگزاری مجاز معامله کنید