Anthropic poráža OpenAI, Google aj Metu. Má najvýkonnejší model umelej inteligencie súčasnosti

27. mája 2025 o 10:49

Anthropic prichádza na scénu s najvýkonnejším modelom AI
Dokáže riešiť aj naozaj zložité úlohy

Ilustračné foto Unsplash.com/Gabriele Malaspina

Anthropic prichádza na scénu s najvýkonnejším modelom AI
Dokáže riešiť aj naozaj zložité úlohy

ČLÁNOK POKRAČUJE POD REKLAMOU

Anthropic je nový model umelej inteligencie založený bývalými výskumníkmi z OpenAI. Spoločnosť aktuálne predstavila najnovší prírastok do svojej rodiny AI modelov – Claude 4. Tento jazykový model je v súčasnosti dostupný v troch variantoch: Claude 4 Opus, Sonnet a Haiku. Najvýkonnejšia z nich je verzia Opus, ktorá podľa prvej vlny testov a recenzií prekonáva konkurenciu od OpenAI, Google aj Meta.

Claude 4 Opus je navrhnutý tak, aby dosahoval vysoký výkon v komplexných úlohách, ako je logické uvažovanie, riešenie zložitých problémov, kódovanie či analýza veľkých dokumentov, píše CNBC.

Anthropic poráža konkurenciu

Model sa výrazne zlepšil v chápaní dlhších textových vstupov a v schopnosti udržať kontext v rámci rozsiahleho rozhovoru. To umožňuje lepšiu konzistenciu výstupov a presnejšie odpovede na komplikované otázky. A to je podstatný upgrade v prípade doteraz dostupných modelov.

Introducing the next generation: Claude Opus 4 and Claude Sonnet 4.

Claude Opus 4 is our most powerful model yet, and the world’s best coding model.

Claude Sonnet 4 is a significant upgrade from its predecessor, delivering superior coding and reasoning. pic.twitter.com/MJtczIvGE9

— Anthropic (@AnthropicAI) May 22, 2025

Anthropic tvrdí, že Opus je najvýkonnejší verejne dostupný jazykový model na trhu. V benchmarkoch, ako MMLU (Massive Multitask Language Understanding), GSM8K (matematika na úrovni základnej školy), HumanEval (kódovanie) a GPQA (biomedicína) dosahuje Opus najvyššie skóre zo všetkých modelov v komerčnom nasadení.

Model sa tak profiluje ako nástroj vhodný nielen pre bežné použitie, ale aj pre profesionálne nasadenie v oblastiach ako výskum, vývoj softvéru či právne analýzy.

Rýchlejší, lacnejší, menší: Sonnet a Haiku

Popri vlajkovej lodi Opus predstavila spoločnosť Anthropic aj dva ďalšie modely. Claude 4 Sonnet je stredná trieda – výkonný, ale lacnejší a dostupnejší pre podnikové použitie. Je optimalizovaný na rýchle reakcie a zvláda širokú škálu úloh v reálnom čase. Najmenší model Claude 4 Haiku je extrémne rýchly a cenovo efektívny – určený pre aplikácie s vysokou frekvenciou dotazov a minimálnym oneskorením. Hoci výkonom zaostáva za Opusom, stále prekonáva staršie modely konkurencie z predchádzajúcej generácie.

Claude 4 vývojári trénovali s dôrazom na tzv. „constitutional AI“. Je to prístup, v ktorom model funguje na základe vopred definovaných etických a bezpečnostných princípov. Tento prístup má zvýšiť predvídateľnosť a bezpečnosť modelu pri jeho praktickom použití, čím sa odlišuje od mnohých iných jazykových systémov.

Mnohí Slováci by odišli do 10 minút. Do tejto krajiny sa ľudia sťahujú pre nezdanené platy a benzín za pár centov

Porovnanie modelov

Podľa porovnania od dotData sa Claude 4 Opus zaraďuje medzi najpresnejšie a najspoľahlivejšie modely súčasnosti. V niektorých úlohách prekonáva aj GPT-4 od OpenAI, ktorý bol doteraz považovaný za zlatý štandard v oblasti veľkých jazykových modelov. Hoci GPT-4 vyniká v kreativite a generovaní prirodzeného jazyka, Claude 4 má výhodu v konzistentnosti, dôslednosti a zvládaní dlhodobého kontextu.

What’s the best model for building AI agents?

Hard to tell without careful experimentation, and it will also depend on the domain and requirements.

I often check this Agent Leaderboard built by @nlpguy_ and the @rungalileo team.

Observations:

– A few new models have been… pic.twitter.com/sPmXitdvey

— elvis (@omarsar0) May 1, 2025

K výkonu Claude 4 sa blíži napríklad model Gemini od Googlu (najmä Gemini 1.5 Pro). Zaostáva však v oblasti bezpečnosti a transparentnosti výstupov. Meta s LLaMA 3 predstavuje výkonný open-source prístup, no ten je určený skôr pre vývojárov a výskumníkov než pre bežných používateľov. Claude 4 Opus tak v súčasnosti predstavuje ideálnu kombináciu výkonu, bezpečnosti a dostupnosti v rámci komerčne nasadených modelov.

Čítaj viac z kategórie: Biznis a startupy

Zdroje: CNBC, dotData

Technológie a internet

Viac k téme: ai, Anthropic, openai, umelá inteligencia