Το TurboQuant συμπιέζει τη μνήμη KV cache της AI έως και πέντε φορές με ελάχιστη επίπτωση στην ποιότητα του μοντέλου. Η αναβάθμιση επιτρέπει σε φορητούς υπολογιστές και τηλέφωνα να εκτελούν πιο εκτεταμένες εφαρμογές AIΤο TurboQuant συμπιέζει τη μνήμη KV cache της AI έως και πέντε φορές με ελάχιστη επίπτωση στην ποιότητα του μοντέλου. Η αναβάθμιση επιτρέπει σε φορητούς υπολογιστές και τηλέφωνα να εκτελούν πιο εκτεταμένες εφαρμογές AI

Το Tether Φέρνει το TurboQuant της Google στην Παραγωγή, Ξεκλειδώνοντας AI Μεγάλου Πλαισίου σε Καθημερινές Συσκευές

2026/06/02 07:46
Ανάγνωση 4 λεπτών
Για feedback ή ανησυχίες σας σχετικά με αυτό το περιεχόμενο, επικοινωνήστε μαζί μας στη διεύθυνση crypto.news@mexc.com

TLDR:

  • Το TurboQuant συμπιέζει τη μνήμη KV cache της τεχνητής νοημοσύνης έως πέντε φορές με ελάχιστη επίδραση στην ποιότητα του μοντέλου.
  • Η αναβάθμιση επιτρέπει σε φορητούς υπολογιστές και τηλέφωνα να εκτελούν μεγαλύτερες συνεδρίες τεχνητής νοημοσύνης χωρίς εξάρτηση από το cloud.
  • Το QVAC SDK 0.12.0 ενσωματώνει το TurboQuant στο Fabric, διευρύνοντας τις επιλογές τοπικής ανάπτυξης τεχνητής νοημοσύνης.
  • Η Tether στοχεύει στην προώθηση τεχνητής νοημοσύνης με επίκεντρο την προστασία της ιδιωτικότητας, φέρνοντας την αποδοτική επεξεργασία πιο κοντά στους τελικούς χρήστες.

Η Ομάδα Έρευνας Τεχνητής Νοημοσύνης της Tether κυκλοφόρησε μια ανοιχτού κώδικα έκδοση παραγωγής του TurboQuant, ενός αλγορίθμου συμπίεσης μνήμης που αναπτύχθηκε αρχικά από την Google Research.

Η κυκλοφορία αποτελεί μέρος του QVAC SDK 0.12.0 και απευθύνεται σε φορητούς υπολογιστές, τηλέφωνα, συσκευές edge και αποκεντρωμένα δίκτυα. Επιτρέπει στα τοπικά μοντέλα τεχνητής νοημοσύνης να διαχειρίζονται μεγαλύτερες συνεδρίες χωρίς να βασίζονται σε υποδομή cloud.

Αυτό σηματοδοτεί μια πρακτική αλλαγή στον τρόπο που η τεχνητή νοημοσύνη on-device διαχειρίζεται εργασίες εντατικής χρήσης μνήμης.

Το TurboQuant Συμπιέζει τη Μνήμη Τεχνητής Νοημοσύνης έως Πέντε Φορές

Η μνήμη αποτελούσε εδώ και καιρό εμπόδιο για την εκτέλεση ικανών μοντέλων τεχνητής νοημοσύνης σε καταναλωτικό υλικό. Όταν ένας βοηθός τεχνητής νοημοσύνης επεξεργάζεται ένα μακρύ έγγραφο ή συνομιλία, αποθηκεύει αυτό το πλαίσιο σε αυτό που ονομάζεται KV cache.

Σε περίπου 262.000 tokens, το KV cache για ένα μοντέλο 4B μπορεί να καταναλώσει περίπου 8 GB μνήμης μόνο του. Τέσσερις ταυτόχρονες συνεδρίες μπορούν να ωθήσουν αυτό το νούμερο στα 32 GB πριν ακόμα υπολογιστεί το ίδιο το μοντέλο.

Το TurboQuant αντιμετωπίζει αυτό συμπιέζοντας το KV cache έως πέντε φορές, διατηρώντας παράλληλα την ποιότητα εξόδου κοντά σε ένα ασυμπίεστο μοντέλο.

Ένας χρήστης μπορεί πλέον να ζητήσει από έναν βοηθό σε φορητό υπολογιστή να αναλύσει ένα νομικό έγγραφο εκατό σελίδων χωρίς να το ανεβάσει σε απομακρυσμένο διακομιστή.

Φοιτητές, προγραμματιστές, δημοσιογράφοι και ερευνητές μπορούν όλοι να επωφεληθούν από μεγαλύτερες, πιο context-aware συνεδρίες τεχνητής νοημοσύνης σε συσκευές που ήδη διαθέτουν.

Μιλώντας για τους ευρύτερους λόγους πίσω από την κυκλοφορία, ο CEO της Tether, Paolo Ardoino, επεσήμανε το χάσμα μεταξύ έρευνας και πρακτικού λογισμικού.

"Η έρευνα της Google έδειξε ότι η μνήμη τεχνητής νοημοσύνης μπορούσε να συμπιεστεί πολύ πιο αποδοτικά από ό,τι υπέθεταν οι περισσότεροι," είπε. "Η δουλειά μας φέρνει αυτή την ανακάλυψη σε λογισμικό παραγωγής που προγραμματιστές, startups και χρήστες μπορούν πραγματικά να αξιοποιήσουν."

Η έκδοση παραγωγής περιλαμβάνει μια πλήρη διοχέτευση κβαντοποίησης, προσαρμογείς πλαισίου, τεκμηρίωση για προγραμματιστές και προφίλ βελτιστοποιημένα για φόρτο εργασίας.

Αυτά τα στοιχεία έχουν σχεδιαστεί για πραγματικά περιβάλλοντα εκτός κέντρων δεδομένων υπερκλίμακας, καλύπτοντας περιορισμένη μνήμη, μικτό υλικό και αναπτύξεις ευαίσθητες στην καθυστέρηση.

Το QVAC SDK 0.12.0 Διευρύνει τις Επιλογές Τοπικής Ανάπτυξης Τεχνητής Νοημοσύνης

Το TurboQuant διατίθεται ως μέρος του QVAC SDK 0.12.0, ενσωματωμένο απευθείας στο Fabric, ένα βασικό στοιχείο της στοίβας QVAC.

Το Fabric ξεκίνησε ως fork του llama.cpp και έχει από τότε εξελιχθεί ώστε να ενσωματώνει πολλαπλές ερευνητικές εξελίξεις. Το SDK παρέχει στους προγραμματιστές ένα ενοποιημένο σύνολο εργαλείων, βιβλιοθηκών και στοιχείων runtime για τη δημιουργία τοπικών εφαρμογών τεχνητής νοημοσύνης.

Για startups και ανεξάρτητους προγραμματιστές, αυτό εξαλείφει την παραδοχή ότι τα μεγάλα προϊόντα τεχνητής νοημοσύνης απαιτούν ακριβά clusters GPU.

Οι ομάδες μπορούν πλέον να σχεδιάζουν για μεγαλύτερα παράθυρα πλαισίου, μεγαλύτερους φόρτους εργασίας αρχείων και ευέλικτη ανάπτυξη σε καταναλωτικό και edge υλικό. Αυτό ανοίγει πρακτικές διαδρομές για τη δημιουργία προϊόντων τεχνητής νοημοσύνης χωρίς αρχιτεκτονική αποκλειστικά cloud.

Αντιμετωπίζοντας ανησυχίες σχετικά με την προστασία δεδομένων και την εξάρτηση από το cloud, ο Ardoino υποστήριξε τη διατήρηση των εργασιών τεχνητής νοημοσύνης σε τοπικές συσκευές.

"Οι άνθρωποι πρέπει να μπορούν να ζητούν από έναν βοηθό τεχνητής νοημοσύνης να διαβάσει ένα μακρύ έγγραφο ή να επεξεργαστεί ιδιωτικές πληροφορίες χωρίς κάθε εργασία να αναγκάζεται να περνά από ένα απομακρυσμένο κέντρο δεδομένων," είπε. Το TurboQuant, με αυτή την έννοια, δίνει στην τοπική τεχνητή νοημοσύνη περισσότερο επιχειρησιακό χώρο.

Η στρατηγική της Tether επικεντρώνεται σε τεχνητή νοημοσύνη που λειτουργεί πιο κοντά στους χρήστες, σε προσωπικές συσκευές και αποκεντρωμένα δίκτυα. Η εταιρεία βλέπει την αποδοτικότητα και φορητότητα λογισμικού ως καθοριστικούς παράγοντες στην επόμενη φάση ανάπτυξης της τεχνητής νοημοσύνης, παράλληλα με την υποδομή υπολογισμού μεγάλης κλίμακας.

Το άρθρο Tether Brings Google's TurboQuant to Production, Unlocking Long-Context AI on Everyday Devices εμφανίστηκε πρώτα στο Blockonomi.

Ευκαιρία της αγοράς
Gensyn Λογότ.
Τιμή Gensyn(AI)
$0.03239
$0.03239$0.03239
+0.74%
USD
Gensyn (AI) Ζωντανό Διάγραμμα Τιμών

SPACEX(PRE) Launchpad

SPACEX(PRE) LaunchpadSPACEX(PRE) Launchpad

Register for a chance to win a free lucky draw

Αποποίηση ευθύνης: Τα άρθρα που αναδημοσιεύονται σε αυτόν τον ιστότοπο προέρχονται από δημόσιες πλατφόρμες και παρέχονται μόνο για ενημερωτικούς σκοπούς. Δεν αντικατοπτρίζουν απαραίτητα τις απόψεις της MEXC. Όλα τα πνευματικά δικαιώματα ανήκουν στους αρχικούς συγγραφείς. Εάν πιστεύετε ότι οποιοδήποτε περιεχόμενο παραβιάζει τα δικαιώματα τρίτου μέρους, επικοινωνήστε με τη διεύθυνση crypto.news@mexc.com για την αφαίρεσή του. Η MEXC δεν παρέχει εγγυήσεις σχετικά με την ακρίβεια, την πληρότητα ή την επικαιρότητα του περιεχομένου και δεν ευθύνεται για οποιεσδήποτε ενέργειες που γίνονται με βάση τις παρεχόμενες πληροφορίες. Το περιεχόμενο δεν αποτελεί οικονομική, νομική ή άλλη επαγγελματική συμβουλή, ούτε θα πρέπει να θεωρηθεί σύσταση ή προώθηση της MEXC.

Μπορεί επίσης να σας αρέσει

Η Εκκίνηση των Altcoin Traders Ξεκινά: Το APEMARS Φτάνει τα $500K που Συγκεντρώθηκαν με το LAUNCH350 Ανάμεσα στον Αγώνα των 9 Καλύτερων Νομισμάτων 100x

Η Εκκίνηση των Altcoin Traders Ξεκινά: Το APEMARS Φτάνει τα $500K που Συγκεντρώθηκαν με το LAUNCH350 Ανάμεσα στον Αγώνα των 9 Καλύτερων Νομισμάτων 100x

Το ενδιαφέρον των traders σε altcoin αυξάνεται καθώς το APEMARS ξεπερνά τα $500K που συγκεντρώθηκαν, πουλά 30,5 δισεκατομμύρια tokens και εισέρχεται στη συζήτηση για τα καλύτερα νομίσματα 100x με το LAUNCH350.
Κοινοποίηση
CoinLive2026/06/02 09:15
Επαρχίες αμφισβητούν τις ενημερώσεις του Καναδικού Νόμου Σαφήνειας 2026 εν μέσω ώθησης για σαφέστερους κανόνες δημοψηφίσματος

Επαρχίες αμφισβητούν τις ενημερώσεις του Καναδικού Νόμου Σαφήνειας 2026 εν μέσω ώθησης για σαφέστερους κανόνες δημοψηφίσματος

Ο νόμος Canada Clarity Act 2026 με τις ενημερώσεις του έχει επαναφέρει έναν από τους πιο αμφισβητούμενους συνταγματικούς νόμους της χώρας στο επίκεντρο. Περισσότερα από 25 χρόνια μετά τη Βουλή
Κοινοποίηση
The Cryptonomist2026/06/02 07:29
Η Nvidia Στοχεύει την Αγορά CPU των $200 Δισ. με Νέους AI Agent PCs από τη Microsoft, Dell και HP

Η Nvidia Στοχεύει την Αγορά CPU των $200 Δισ. με Νέους AI Agent PCs από τη Microsoft, Dell και HP

BitcoinWorld Η Nvidia Στοχεύει στην Αγορά CPU των 200 Δισ. Δολαρίων με Νέους AI Agent PCs από τη Microsoft, την Dell και την HP Η Nvidia άνοιξε την έκθεση Computex στην Ταϊπέι την Κυριακή με
Κοινοποίηση
bitcoinworld2026/06/02 06:15

RealStocks Now Live

RealStocks Now LiveRealStocks Now Live

Trade real U.S. stock via regulated brokerage