Anthropic poráža OpenAI, Google aj Metu. Má najvýkonnejší model umelej inteligencie súčasnosti
- Anthropic prichádza na scénu s najvýkonnejším modelom AI
- Dokáže riešiť aj naozaj zložité úlohy
- Anthropic prichádza na scénu s najvýkonnejším modelom AI
- Dokáže riešiť aj naozaj zložité úlohy
Anthropic je nový model umelej inteligencie založený bývalými výskumníkmi z OpenAI. Spoločnosť aktuálne predstavila najnovší prírastok do svojej rodiny AI modelov – Claude 4. Tento jazykový model je v súčasnosti dostupný v troch variantoch: Claude 4 Opus, Sonnet a Haiku. Najvýkonnejšia z nich je verzia Opus, ktorá podľa prvej vlny testov a recenzií prekonáva konkurenciu od OpenAI, Google aj Meta.
Claude 4 Opus je navrhnutý tak, aby dosahoval vysoký výkon v komplexných úlohách, ako je logické uvažovanie, riešenie zložitých problémov, kódovanie či analýza veľkých dokumentov, píše CNBC.
Anthropic poráža konkurenciu
Model sa výrazne zlepšil v chápaní dlhších textových vstupov a v schopnosti udržať kontext v rámci rozsiahleho rozhovoru. To umožňuje lepšiu konzistenciu výstupov a presnejšie odpovede na komplikované otázky. A to je podstatný upgrade v prípade doteraz dostupných modelov.
Introducing the next generation: Claude Opus 4 and Claude Sonnet 4.
Claude Opus 4 is our most powerful model yet, and the world’s best coding model.
Claude Sonnet 4 is a significant upgrade from its predecessor, delivering superior coding and reasoning. pic.twitter.com/MJtczIvGE9
— Anthropic (@AnthropicAI) May 22, 2025
Anthropic tvrdí, že Opus je najvýkonnejší verejne dostupný jazykový model na trhu. V benchmarkoch, ako MMLU (Massive Multitask Language Understanding), GSM8K (matematika na úrovni základnej školy), HumanEval (kódovanie) a GPQA (biomedicína) dosahuje Opus najvyššie skóre zo všetkých modelov v komerčnom nasadení.
Model sa tak profiluje ako nástroj vhodný nielen pre bežné použitie, ale aj pre profesionálne nasadenie v oblastiach ako výskum, vývoj softvéru či právne analýzy.
Rýchlejší, lacnejší, menší: Sonnet a Haiku
Popri vlajkovej lodi Opus predstavila spoločnosť Anthropic aj dva ďalšie modely. Claude 4 Sonnet je stredná trieda – výkonný, ale lacnejší a dostupnejší pre podnikové použitie. Je optimalizovaný na rýchle reakcie a zvláda širokú škálu úloh v reálnom čase. Najmenší model Claude 4 Haiku je extrémne rýchly a cenovo efektívny – určený pre aplikácie s vysokou frekvenciou dotazov a minimálnym oneskorením. Hoci výkonom zaostáva za Opusom, stále prekonáva staršie modely konkurencie z predchádzajúcej generácie.
Claude 4 vývojári trénovali s dôrazom na tzv. „constitutional AI“. Je to prístup, v ktorom model funguje na základe vopred definovaných etických a bezpečnostných princípov. Tento prístup má zvýšiť predvídateľnosť a bezpečnosť modelu pri jeho praktickom použití, čím sa odlišuje od mnohých iných jazykových systémov.
Porovnanie modelov
Podľa porovnania od dotData sa Claude 4 Opus zaraďuje medzi najpresnejšie a najspoľahlivejšie modely súčasnosti. V niektorých úlohách prekonáva aj GPT-4 od OpenAI, ktorý bol doteraz považovaný za zlatý štandard v oblasti veľkých jazykových modelov. Hoci GPT-4 vyniká v kreativite a generovaní prirodzeného jazyka, Claude 4 má výhodu v konzistentnosti, dôslednosti a zvládaní dlhodobého kontextu.
What’s the best model for building AI agents?
Hard to tell without careful experimentation, and it will also depend on the domain and requirements.
I often check this Agent Leaderboard built by @nlpguy_ and the @rungalileo team.
Observations:
– A few new models have been… pic.twitter.com/sPmXitdvey
— elvis (@omarsar0) May 1, 2025
K výkonu Claude 4 sa blíži napríklad model Gemini od Googlu (najmä Gemini 1.5 Pro). Zaostáva však v oblasti bezpečnosti a transparentnosti výstupov. Meta s LLaMA 3 predstavuje výkonný open-source prístup, no ten je určený skôr pre vývojárov a výskumníkov než pre bežných používateľov. Claude 4 Opus tak v súčasnosti predstavuje ideálnu kombináciu výkonu, bezpečnosti a dostupnosti v rámci komerčne nasadených modelov.
Čítaj viac z kategórie: Biznis a startupy
Zdroje: CNBC, dotData