OpenAI установила заоблачную планку для цифровых помощников!
На мероприятии Spring Update, организованном OpenAI, компания продемонстрировала в реальном времени взаимодействие искусственного интеллекта с ChatGPT4o, что привело к превосходству над голосовыми помощниками Siri, Alexa и Google.
Сегодня на мероприятии Spring Update, проведенном OpenAI, был сделан шаг включения OpenAI в деятельность технологических гигантов, известных как GAFAM. На этом мероприятии OpenAI продемонстрировала впечатляющую технологию - GPT-4o, обладающую возможностями работы с текстом, изображениями, звуком и непрерывным потоком данных. На протяжении события было продемонстрировано впечатляющее взаимодействие этой технологии с участниками. Это не просто записанные видеоролики, как у Apple и других крупных производителей телефонов. Речь идет о реальном взаимодействии, аналогичном прямым трансляциям спортивных мероприятий.
Примечательно, что OpenAI смогла представить GPT-4o в прямом эфире, что подтверждает его превосходство над голосовыми помощниками Siri, Alexa и Google. Во время мероприятия совершалась прямая трансляция, в ходе которой технический директор OpenAI Миро Мурати даже ответил на вопросы на итальянском языке из Twitter. Показано было, что ChatGPT4o работает гораздо быстрее и успешнее в голосовых обсуждениях в реальном времени. Он имеет возможность мгновенной реакции и даже способен распознавать эмоции и дыхание.
Это важный шаг для OpenAI, который уже проявил себя с проектами, такими как DALL-E и Sora, и смог внедрить искусственный интеллект в повседневную жизнь с помощью ChatGPT. После сегодняшнего дня технологические гиганты, кроме Microsoft, вероятно, будут стремиться включить OpenAI в свои проекты, поскольку невозможно будет игнорировать его превосходство.
Каковы функции GPT-4o?
GPT-4o значительно улучшает работу ChatGPT. Хотя ChatGPT уже давно предлагает голосовой режим, который преобразует текст в речь с помощью модели преобразования текста в речь, GPT-4o расширяет его возможности, позволяя пользователям взаимодействовать с ChatGPT более естественно, похоже на общение с помощником. Это достигается за счет внедрения функции цифрового помощника в ChatGPT, которая анализирует текст, голос и изображения, привлекая больше внимания пользователя.
OpenAI утверждает, что модель обеспечивает реагирование "в реальном времени" и способна распознавать эмоции в голосе пользователя, воспроизводя звук в "различных эмоциональных стилях". Кроме того, GPT-4o расширяет возможности видения ChatGPT. Теперь ChatGPT может анализировать фотографии или экраны рабочего стола и задавать вопросы типа: "Что изображено на этом программном коде?" или "Какая марка рубашки у этого человека?". Он способен быстро реагировать на актуальные вопросы.
GPT-4o доступен сегодня. Его можно использовать бесплатно или с более широкими возможностями запросов с подпиской Plus. Также выпущено приложение-помощник для рабочего стола GPT-4o для MacOS, а версия для Windows ожидается к концу года.