Google-ը թողարկել է Gemini 2.5 Flash մոդելի հիբրիդային «պատճառաբանության» դեմո տարբերակը։ Այն մի քանի անգամ ավելի էժան է, քան Claude Sonnet 3.7-ը եւ Grok 3 Beta-ն։
Gemini 2.5 Flash-ը Google-ի առաջին լիովին հիբրիդային «պատճառաբանման» մոդելն է: Մշակողները կարող են անջատել «պատճառաբանությունը» եւ դրա համար սահմանել «բյուջե»՝ սահմանելով այն թոքենները, որոնք մոդելը կարող է ծախսել. առավելագույնը՝ 24,576 նշան:
Որքան լայն է սահմանը, այնքան ավելի լավ կլինի պատասխանը, եթե հարցումը բարդ է եւ պահանջում է «մտքերի» երկար շղթա։ Gemini 2.5 Flash-ին սովորեցրել են նաեւ ինքնուրույն որոշել, թե որքան ժամանակ է պահանջվում առաջադրանքի մասին «մտածելու» համար:
1 միլիոն մուտքային թոքենը կարժենա 0,15 դոլար, ելքայինը՝ 0,60 դոլար առանց «պատճառաբանության» եւ 3,50 դոլար՝ դրա հետ միասին։
Համեմատության համար՝
• Claude Sonnet 3.7-ը եւ Grok 3 Beta-ն պահանջում են համապատասխանաբար $3 եւ $15։
• OpenAI o4-mini-ն՝ $1,1 եւ $4,4։
• DeepSeek R1 - $0,55 եւ $2,19:
Միեւնույն ժամանակ, մի շարք արդյունաբերական թեստերում Google-ի մոդելն իրեն ավելի լավ է ցույց տվել, քան երեք մրցակիցները:
Gemini 2.5 Flash-ը հասանելի է չատբոտում եւ API-ի միջոցով Google AI Studio-ում եւ Vertex AI-ում: