xAI-ը թողարկել է Grok 4 մոդելը, որն անկախ թեստերում գերազանցել է OpenAI-ի o3-ին, Gemini 2.5 Pro-ին եւ Claude Opus-ին։
Այն հասանելի է միայն բաժանորդագրությամբ։ Ընկերությունը մեկնարկել է նաեւ նոր պլան՝ ամսական 300 դոլար արժողությամբ։
Մշակողները ներկայացրել են «տրամաբանող» մոդելի երկու տարբերակ՝ Grok 4-ը եւ xAI-ի չաթբոտի համար նախատեսված «առաջադեմ» Grok Heavy-ն։
Իլոն Մասկը երկրորդն անվանել է «պատմության մեջ ամենախելացին»։ Այն առաջին անգամ 100%-ով լուծել է AIME 2025 թեստի մաթեմատիկական խնդիրները։ Grok Heavy-ն գրեթե երկու անգամ գերազանցել է մյուս մոդելներին OpenAI-ի «Humanity's Last Exam» թեստում։
photo © xAI
Artificial Analysis-ի անկախ հետազոտողների կողմից ծրագրավորման, մաթեմատիկայի եւ գիտական խնդիրների լուծման թեստերում Grok 4-ը գերազանցել է OpenAI-ի o3-ին, Google-ի Gemini 2.5 Pro-ին եւ Anthropic-ի Claude 4 Opus-ին։ Իլոն Մասկը նշել է, որ Grok 4-ը «ավելի լավ է աշխատում, քան Cursor-ը» եւ կարող է վերլուծել եւ խմբագրել ամբողջ ֆայլը մշակողի կոդով։
Grok 4-ը փորձարկվել է նաեւ Vending Bench բիզնես «սիմուլյացիայի» մեջ։ Այն վաճառել է ավելի քան 4500 ապրանք եւ «վաստակել» երկու անգամ ավելի, քան Claude 4 Opus-ը՝ 4690 դոլար։
photo © xAI
Grok 4-ի հիմնական մոդելը հասանելի է SuperGrok բաժանորդագրությամբ՝ ամսական 30 դոլարով, իսկ առաջադեմ մոդելը՝ նոր SuperGrok Heavy պլանում՝ ամսական 300 դոլարով։
Ընկերությունը Grok 4-ին հասանելիություն է բացել API-ի միջոցով։ Մինչեւ 1 միլիոն մուտքային տոկենը կարժենա 3 դոլար, իսկ 1 միլիոն ելքայինը՝ 15 դոլար։ Եթե ավելի շատ է, գինը կրկնապատկվում է։ Համատեքստի առավելագույն երկարությունը 256 հազար տոկեն է։
xAI-ը նաեւ թարմացրել է ձայնային ռեժիմը եւ ավելացրել երկու նոր «ավելի հուզական» ձայն։ Շնորհանդեսում ձայնային օգնականը շշնջում եւ երգում էր։ Ընկերությունը հայտարարել է, որ 2025 թվականի օգոստոսին կթողարկի ծրագրավորման համար օպտիմիզացված նոր մոդել, սեպտեմբերին՝ բազմամոդալ AI գործակալ, իսկ հոկտեմբերին՝ տեսանյութերի ստեղծման մոդել։