OpenAI rozšiřuje své hlasové technologie a míří dál než jen k přepisu řeči. Firma představila tři nové modely, které zvládnou překlad, přepis i reakce v reálném čase. Novinky mají vývojářům pomoci vytvářet přirozenější hlasové asistenty.
Nové modely nesou názvy GPT-Realtime-2, GPT-Realtime-Translate a GPT-Realtime-Whisper. OpenAI je zpřístupnila přes své vývojářské rozhraní API a zatím je nabízí k testování v takzvaném playgroundu.
Modely zvládnou překlad i přepis během hovoru
Nejvýkonnější novinkou je GPT-Realtime-2. OpenAI ho popisuje jako první hlasový model s „uvažováním na úrovni GPT-5“. Má zvládat složitější požadavky, přerušení během hovoru i práci s delším kontextem.
Firma uvádí, že model dokáže „udržet konverzaci v chodu a zároveň přemýšlet nad požadavkem“. Současně umí pracovat s externími nástroji a reagovat přirozeněji podle situace.
OpenAI introduced three audio models for its developer platform on Thursday, aiming to make voice-based software agents more conversational and capable of completing tasks in real time.
— The Manila Times (@TheManilaTimes) May 7, 2026
READ: https://t.co/x8IqGsc5iv pic.twitter.com/tDvPiV9XKB
Druhý model se zaměřuje na živý překlad. GPT-Realtime-Translate podporuje více než sedmdesát vstupních jazyků a převádí je do třinácti výstupních jazyků. OpenAI cílí hlavně na zákaznickou podporu nebo vzdělávání.
Třetí novinka GPT-Realtime-Whisper funguje jako průběžný přepis řeči. Přepisuje mluvené slovo okamžitě během hovoru. Technologie má pomoci například s titulky, zápisy z porad nebo živými poznámkami.
Firmy už nové nástroje testují
Mezi prvními testujícími jsou například realitní platforma Zillow, cestovní agentura Priceline nebo Deutsche Telekom. OpenAI tvrdí, že nové modely mají otevřít „novou generaci hlasových aplikací“.
Firma zároveň zveřejnila ceny jednotlivých služeb. GPT-Realtime-2 začíná na 32 dolarech za milion audio vstupních tokenů. Překladový model stojí 0,034 dolaru za minutu a přepis řeči polovinu.
OpenAI pokračuje v rychlém rozšiřování svých produktů mimo klasický chatbot ChatGPT. Nové hlasové modely ukazují, že firma chce posílit hlavně oblast digitálních asistentů schopných reagovat okamžitě během živé komunikace.

