Opus 4.6-ի համեմատությունը նախորդ տարբերակի եւ այլ ընկերությունների մոդելների հետ
12:40 | 06.02.26 | Նորություններ | 115
Anthropic-ը ներկայացրել է Claude Opus 4.6 մոդելը, որն ընկերության առաջին մոդելն է Opus շարքում 1 միլիոն տոկեն համատեքստային պատուհանով։
Ըստ Anthropic-ի՝ մոդելը գերազանցում է նախորդ տարբերակին ծրագրավորման մեջ. այն աջակցում է գործակալային առաջադրանքների կատարումն ավելի երկար ժամանակահատվածում, ավելի հուսալի է գործում մեծ կոդային բազաներում եւ ավելի լավ է ստուգում ու ուղղում կոդը:
Ընկերության թեստերում Opus 4.6-ը գերազանցել է մյուս մոդելներին BrowseComp չափանիշում (որը չափում է մոդելի՝ համացանցում դժվար հասանելի տեղեկատվություն գտնելու ունակությունը), «մարդկության վերջնական քննության» (ակադեմիական ընդունակությունների գնահատում) եւ Terminal-Bench 2.0-ում (գործակալների վրա հիմնված կոդավորման գնահատում)։ Բարդ խնդիրների լուծման GDPval-AA թեստում մոդելը գերազանցել է OpenAI-ի GPT-5.2-ին եւ Claude Opus 4.5-ին։
Opus 4.6-ի համեմատությունը նախորդ տարբերակի եւ այլ ընկերությունների մոդելների հետ