Firma Cohere, specjalizująca się w AI dla przedsiębiorstw, ogłosiła premierę Command A+ – modelu językowego typu open-source opartego na architekturze mixture-of-experts, zaprojektowanego do zadań agentowych klasy enterprise przy stosunkowo niskich wymaganiach obliczeniowych.
Firma poinformowała, że model jest efektem roku pracy w ramach platformy North – korporacyjnego środowiska roboczego Cohere do tworzenia i wdrażania agentowych systemów AI – i łączy w sobie możliwości całej rodziny Command w jednym modelu przeznaczonym do skalowalnego zastosowania w środowiskach eksperymentowania, wdrażania i produkcji.
Command A+ jest teraz dostępny na licencji Apache 2.0, co daje programistom szeroki dostęp do modelu, który według Cohere ma wspierać suwerenne wdrożenia AI, w tym środowiska, w których organizacje chcą mieć bezpośrednią kontrolę nad infrastrukturą i zachowaniem modelu. Wydanie obejmuje możliwe do pobrania wagi na Hugging Face, a także wskazówki dotyczące implementacji i opcje wdrożenia za pośrednictwem Model Vault firmy Cohere.
Zgodnie z opublikowanymi specyfikacjami firmy model wykorzystuje rzadką architekturę MoE, posiada 218 miliardów parametrów ogółem i 25 miliardów aktywnych parametrów, obsługuje kontekst wejściowy o długości 128 000 tokenów i może generować do 64 000 tokenów. Jest zaprojektowany do obsługi danych wejściowych w postaci tekstu, obrazów i wywołań narzędzi, a dane wyjściowe może generować w formie tekstu, rozumowania i wywołań narzędzi w 48 językach.
Cohere poinformował, że Command A+ jest zoptymalizowany pod kątem rozumowania, generowania wspomaganego wyszukiwaniem, zadań wielojęzycznych, multimodalnego przetwarzania dokumentów oraz przepływów pracy agentowych. Firma podkreśliła również jego wydajność sprzętową, wskazując, że model jest dostępny w wielu formatach kwantyzacji, w tym BF16, FP8 i W4A4, i może działać na niewielkiej liczbie wysokiej klasy procesorów GPU. Model jest również prezentowany jako najszybsze dotychczasowe wydanie Cohere – firma powołuje się na poprawę szybkości generowania danych wyjściowych, mniejsze opóźnienia i lepszą wydajność tokenów w porównaniu z poprzednimi modelami Command. Cohere poinformował, że spekulatywne dekodowanie zostało dostosowane do architektury modelu w celu dalszej poprawy szybkości wnioskowania bez wpływu na jakość danych wyjściowych.
Firma opisała Command A+ jako skonsolidowanego następcę wcześniejszych wariantów Command A, stwierdzając, że przewyższa poprzednie generacje w zadaniach zorientowanych na przedsiębiorstwa, takich jak rozumowanie w długim kontekście, rozumienie multimodalne, wyszukiwanie i generowanie kodu. Cohere podkreśliło również wzrost wyników benchmarków w stosunku do Command A Reasoning, w tym lepsze wyniki w zakresie agentowej oceny związanej z telekomunikacją, zadań kodowania w terminalu i wewnętrznych miar stosowanych w platformie North. Poinformowano również, że model poprawia wydajność w analizie arkuszy kalkulacyjnych, agentowym odpowiadaniu na pytania i przepływach pracy opartych na pamięci.
Możliwości wielojęzyczne to kolejny kluczowy element wydania. Cohere poinformował, że Command A+ rozszerza obsługę z 23 do 48 języków, jednocześnie poprawiając wydajność tłumaczeń i wielojęzycznego rozumowania. Firma poinformowała również o postępach w językach spoza europejskich, w tym o poprawie wydajności tokenizacji dla języka arabskiego, koreańskiego i japońskiego. W benchmarkach multimodalnych model miał wykazywać lepsze wyniki w zadaniach rozumowania dokumentów i obrazów, w tym w ocenach związanych z MathVista, MMMU i CharXiv.
Zainteresowanie branży tym wydaniem znalazło odzwierciedlenie w komentarzach firmy Fujitsu, która stwierdziła, że architektura modelu i wydajność agentowa są zgodne z jej własną strategią suwerennej AI. Cohere przedstawiło premierę jako część szerszych wysiłków na rzecz jednoczesnego rozwiązania trzech priorytetów w AI dla przedsiębiorstw: możliwości, bezpieczeństwa i kosztów. Firma poinformowała, że przyszły rozwój będzie nadal koncentrował się na rozumowaniu, wydajności multimodalnej i kodowaniu, przy jednoczesnym utrzymaniu modeli odpowiednich do wdrożenia w środowiskach kontrolowanych przez klientów.
Command A+ jest dostępny za pośrednictwem Hugging Face, Model Vault, API Cohere i bezpłatnej przestrzeni demonstracyjnej online. Cohere poinformował, że dokumentacja i materiały dotyczące wdrożenia są również dostępne dla organizacji, które chcą przetestować lub zintegrować model z przepływami pracy przedsiębiorstw.
Wpis Cohere prezentuje Command A+, rozwijając suwerenne i wydajne wdrożenie AI dla przedsiębiorstw pojawił się po raz pierwszy w Metaverse Post.

