**OpenAI выпустила альфа-версию продвинутого голосового помощника**
OpenAI представила альфа-версию продвинутого голосового режима GPT-4o для ограниченной группы пользователей ChatGPT Plus. Ожидается, что для всех владельцев подписки этот режим станет доступен осенью.
Согласно официальному заявлению компании, новый голосовой режим предлагает более естественные, реалистичные разговоры в реальном времени, позволяет пользователям перебивать искусственный интеллект в любой момент и распознает эмоциональные интонации в голосе собеседника.
Участники альфа-группы получат уведомления в приложении и электронные письма с инструкциями по использованию нового режима. Пользователи смогут общаться с ChatGPT голосом и получать ответы без задержек, что значительно улучшит взаимодействие с ИИ.
В мае OpenAI представила последнюю модель чат-бота GPT-4o и анонсировала добавление специального режима Voice Mode для голосового общения. Запуск альфа-версии планировался на конец июня, но был перенесен на месяц.
Некоторые из продемонстрированных в мае возможностей ИИ не вошли в запущенную альфа-версию, включая совместное использование экрана и поддержку видео. Эти функции будут представлены позже.
**Расширенный голосовой режим**
Стандартный голосовой режим ChatGPT использует три отдельные модели: одну для преобразования голоса в текст, другую для обработки запроса и третью для конвертации текста в голос. Новое решение мультимодального GPT-4o отличается тем, что не использует вспомогательные модели, что позволяет вести разговор с меньшей задержкой. По словам OpenAI, чат-бот может улавливать эмоциональные интонации в голосе, такие как грусть или волнение.
ChatGPT может общаться на четырех голосах, записанных в сотрудничестве с актерами озвучивания. Он не будет имитировать речь других людей. Дополнительно добавлены фильтры для отклонения некоторых запросов на создание музыки или других форм защищенного авторским правом контента.
**Реакции и мнения**
Реакции на новость о запуске альфа-версии были разнообразными. Технологический аналитик Алексей Иванов отметил: “Это значительный шаг вперед для OpenAI. Возможность распознавания эмоций и реалистичные разговоры могут изменить наше взаимодействие с ИИ”.
Пользователь ChatGPT Plus, Мария Петрова, поделилась своими впечатлениями: “Я была одной из первых, кто получил доступ к новому режиму. Это действительно впечатляет, как ИИ может распознавать мои эмоции и реагировать на них. Это делает общение более человечным”.
**Заключение**
Запуск альфа-версии продвинутого голосового режима GPT-4o от OpenAI является важным шагом в развитии технологий искусственного интеллекта. В будущем это может привести к более естественным и эмоционально осведомленным взаимодействиям с ИИ, что откроет новые возможности для использования в различных сферах, от личных помощников до профессиональных приложений. Ожидается, что с дальнейшим развитием и добавлением новых функций, таких как совместное использование экрана и поддержка видео, этот инструмент станет еще более мощным и универсальным.