Cerebras Systems стартира най-мощната платформа за изкуствен интелект, която конкурира NVIDIA

г. 12:32 ч.
Cerebras Systems стартира най-мощната платформа за изкуствен интелект, която конкурира NVIDIA

Американският стартъп Cerebras Systems, известен със своите иновации в областта на чиповете за машинно обучение, представи новата си платформа Cerebras Inference, която е обявена за най-мощната в света за изводи в изкуствения интелект. Тази платформа, базирана в облака, се стреми да предложи сериозна конкуренция на решенията на NVIDIA, които доминират в момента на пазара.

Cerebras Inference използва ускорителите WSE-3, изработени по 5 nm процес на TSMC. Тези чипове са истински чудовища в света на полупроводниците, съдържайки 4 трилиона транзистора, 900 000 ядра и 44 GB SRAM памет. Това води до впечатляваща обща пропускателна способност на вградената памет от 21 байта/сек и вътрешна междусистемна връзка със скорост от 214 байта/сек. В сравнение, NVIDIA H200 предлага „само“ 4,8 байта/сек, което подчертава значителното предимство на Cerebras.

Според Cerebras, тяхната нова платформа за изводи осигурява до 20 пъти по-висока производителност в сравнение с конкурентните решения, базирани на NVIDIA чипове, в хиперскалерни услуги. В случай на работа с модела за изкуствен интелект Llama3.1 8B, Cerebras Inference осигурява производителност до 1800 токена в секунда на потребител, докато при Llama3.1 70B скоростта достига до 450 токена в секунда. За сравнение, тези стойности при AWS са съответно 93 и 50 токена в секунда, а най-добрият резултат за NVIDIA H100 е 128 токена в секунда за Llama3.1 70B.

Cerebras също така подчертава, че тяхната платформа поддържа 16-битово ниво на точност за целия процес на извод, без да жертва производителността. Това прави Cerebras Inference изключително привлекателно решение за приложения, които изискват висока точност и производителност.

Ценовата политика на Cerebras също е изключително конкурентна, като услугите за извеждане на изводи струват значително по-малко от тези на конкурентите. Например, таксата за обработка на 1 милион токена при Llama3.1 8B е 0,1 долара, а за Llama3.1 70B – 0,6 долара. Таксите се изчисляват на база използваните услуги, което прави платформата достъпна за широк кръг потребители.

Cerebras планира да предоставя услуги за изводи чрез API, съвместим с OpenAI, което означава, че разработчиците, които вече използват модели като GPT-4, Claude или Mistral, могат лесно да мигрират към Cerebras Inference без значителни промени в кода си.

Платформата предлага различни нива на обслужване, включително Enterprise план с персонализирани модели и специализирана поддръжка, както и стандартен Developer Tier с абонаменти от 0,1 USD за 1 милион токена. Наличен е и безплатен достъп на начално ниво с ограничения.

Cerebras Systems вярва, че стартирането на тази платформа ще открие нови възможности за прилагане на генеративен изкуствен интелект в разнообразни индустрии и приложения.
    
Споделете тази новина:



Подобни новини

Изпълнителният директор на Nvidia смята, че изкуственият интелект ще генерира текстури, обекти и герои в игрите

Изпълнителният директор на Nvidia смята, че изкуственият интелект ще генерира текстури, обекти и герои в игрите
Технологията RTX Remix на Nvidia наистина помага за подобряване на качеството на игровите обекти...
 

Asus представи първите графични карти от серията Prime - те отговарят на изискванията на Nvidia за SFF-Ready

Asus представи първите графични карти от серията Prime - те отговарят на изискванията на Nvidia за SFF-Ready
Представените от Asus графични карти GeForce RTX 4060 Ti Prime, RTX 4070 Prime и RTX 4070 Super Prime са оборудвани със системи за охлаждане, които включват по три вентилатора...
 

AMD и Intel се надяват да се конкурират с Nvidia на новия етап от развитието на системите с изкуствен интелект

AMD и Intel се надяват да се конкурират с Nvidia на новия етап от развитието на системите с изкуствен интелект
От друга страна, Nvidia също не бездейства и нейните ускорители все по-често се използват в системите за изкуствен интелект, които включват правене на логически заключения...
 

Технологичните акции отбелязаха спадове - Nvidia загуби 10 процента

Технологичните акции отбелязаха спадове - Nvidia загуби 10 процента
Фондовите пазари в САЩ претърпяха най-големия си спад от октомври 2022 г. насам...
 


 
SetCombG.com новини

Още Новини

Sandberg представи нови ръчни фенери от серията Active Survivor
Датският производител на висококачествена периферия и други технологични продукти обяви разширяване на своята линия фенери Active Survivor с три нови модела Още

Телефонните измамници във Великобритания се сблъскват с "Дейзи" – роботизираната баба с изкуствен интелект
Освен че предпазва потребителите, проектът "Дейзи" предоставя ценна информация за начина, по който измамниците действат Още

YouTube on Quest стартира функция за съвместно сърфиране - до 7 приятели в една VR кинозала
Ако потребителите искат да гледат платено съдържание, всеки от тях ще трябва да го закупи поотделно Още

YouTube тества нов формат за гледане на дълги видеоклипове като в Shorts
Въпреки възможните ползи за зрителите, тази трансформация, според мнозина, може да доведе до загуба на уникалността на YouTube като платформа Още

Xiaomi пусна 100 000-ия си електрически автомобил само 230 дни след началото на производството
След като в края на март започна доставките на серийни електромобили от дебютния си модел SU7 Още