GPT-4o: Rýchlosť a emócie v jednom modeli
AI 14. Máj 2024 4 min čítania

GPT-4o: Rýchlosť a emócie v jednom modeli

Latencia je minulosť

Okamžitá odozva modelu umožňuje plynulý rozhovor. Otvára to dvere pre nové typy aplikácií v zákazníckej podpore. GPT-4o ("o" ako omni) bol predstavený v máji a šokoval schopnosťou meniť intonáciu hlasu a dokonca spievať.

Emocionálna AI

Model dokáže detekovať emócie v hlase používateľa a prispôsobiť tomu svoju odpoveď. Ak ste nahnevaný, AI sa vás snaží upokojiť. Ak ste smutný, je empatická. Toto otvára etické otázky o antropomorfizácii strojov.

Koniec jazykovej bariéry

Live translation (živý preklad) dosiahol úroveň, kde sa môžete rozprávať s cudzincom bez toho, aby ste vnímali technológiu medzi vami. Pre globálny biznis je to game-changer. Meetings môžu prebiehať v rodných jazykoch s real-time dabingom.

Desktopové aplikácie

OpenAI vydalo natívnu aplikáciu pre Mac. Integrácia do workflowu je kľúčová. Stlačením Option + Space máte okamžitý prístup k inteligencii, ktorá "vidí" vašu obrazovku.

Kľúčové zistenia

  • Rýchlosť: Latencia 320ms je porovnateľná s ľudskou reakciou.
  • Multimodalita: Audio nie je len transkripcia, ale natívny vstup so zachovaním tónu.
  • Cena: 4o je 2x rýchlejší a o 50% lacnejší ako GPT-4 Turbo.