Итак, что такое GPT-4o?
GPT-4o — это новейшая модель искусственного интеллекта OpenAI, разработчика ChatGPT, представленная на мероприятии «Весеннее обновление» в начале мая 2024 года. Он будет сосуществовать со своей предыдущей высокопроизводительной моделью GPT-4 Turbo, по крайней мере на данный момент, и принесет огромное количество обновлений для инструмента.
В отличие от своих предшественников, GPT-4o с момента запуска полностью мультимодален (буква «o» в названии модели означает «омнимодальный»). На мероприятии OpenAI Spring Update было продемонстрировано, как GPT-4o свободно общается с организаторами мероприятия, прерывая и меняя взаимодействия, демонстрируя «индивидуальность» и иллюстрируя, как он может стать виртуальным помощником, о котором мечтали пользователи.
Он может принимать комбинации аудио, текста, изображений и видео в качестве входных и выходных данных в виде текста, аудио и изображения (поддержки видео пока нет, но ожидайте, что это изменится, как только инструмент преобразования текста в видео OpenAI Sora запусков — по крайней мере, я предполагаю, что именно это и произойдет).
По исходным данным, предоставленным OpenAI, GPT-4o превосходит все свои предыдущие модели, а также своих ближайших конкурентов, таких как Claude 3 Opus, Gemini Pro 1.5 и Ultra 1.0 и Llama 3 400B.
Итак, цифры — это очень хорошо, но что это на самом деле означает? Что ж, опять же, исходя из цифр OpenAI, GPT-4o «соответствует производительности GPT-4 Turbo» для написания и кодирования на английском языке, значительно быстрее на «неанглийских языках» и, что наиболее важно, быстрее и дешевле с точки зрения API. использовать.
Я долгое время работал в сфере технологий и видел, как появлялось и уходило множество блестящих новинок, «меняющих правила игры». А вот разговорная речь GPT-4o поистине блестящая. GPT-4o может поддерживать с вами правильные разговоры, даже позволяя вам прерывать разговор, менять фокус разговора, менять темы и многое другое, почти не пропуская ни секунды.
Его способность быстро общаться дает ему целый ряд новых приложений. Хотя в ChatGPT уже была голосовая функция, она была ограничена, поскольку сначала нужно было написать ответ, который затем можно было бы произнести вам. Вы также можете взаимодействовать с ChatGPT с помощью голоса, но обработка вашего запроса займет время.
Теперь голос GPT-4o в реальном времени практически безупречен. Более того, он может выражать эмоции и особые стили, что было невозможно до этого обновления.
Это также применимо к прямой трансляции, в которой GPT-4o продемонстрировал огромное улучшение. Я не очень хорошо знаю какой-либо другой язык, но живой перевод с английского на итальянский и обратно был принят хорошо; все, что облегчает общение, когда вы находитесь за границей, будет огромным благом, особенно с учетом скорости перевода.
Недавно я был в Марокко, и даже несмотря на то, что Google Translate помогает передать некоторое значение арабского языка, полный контекст перевода никогда не бывает полностью точным. Живой перевод GPT-4o был бы невероятно полезен!
GPT-4o также обеспечивает значительные улучшения в интерпретации кода и помощи, используя свои мультимодальные возможности. Да, как и другие инструменты, ChatGPT уже может работать с некоторыми данными, но его новая модель значительно расширяет возможности.
Возможность отлаживать код, используя только свой голос, замечательна. Однако его реальная польза станет ясна только тогда, когда настоящие программисты и разработчики начнут использовать этот инструмент. Хотя возможности кодирования ChatGPT полезны, они полезны лишь настолько, насколько полезны знания пользователя, как и большинство инструментов генеративного искусственного интеллекта.
GPT-4o был запущен немедленно для подписчиков ChatGPT Plus, уплативших ежемесячную плату в размере 20 долларов США. Но в еще один важный момент для генеративного ИИ OpenAI сообщила, что GPT-4o будет запущен для всех пользователей, включая бесплатных пользователей, в свое время.
Конкретной даты выхода GPT-4o на бесплатные учетные записи ChatGPT нет, но, учитывая скорость других развертываний, это не должно занять слишком много времени.
Другие аспекты новой модели также пока недоступны. Например, я хотел сделать для этой статьи короткий видеоролик о новой функции живого голоса, но эта функция еще не запущена (я являюсь постоянным подписчиком ChatGPT Plus) и не нашла своего пути ни к одному коллеге. счета.
GPT-4o также представит долгожданную версию ChatGPT для настольных компьютеров, начиная с macOS, но, опять же, она еще не запущена.
Отказ от ответственности: Все предоставленные ресурсы частично взяты из Интернета. В случае нарушения ваших авторских прав или других прав и интересов, пожалуйста, объясните подробные причины и предоставьте доказательства авторских прав или прав и интересов, а затем отправьте их по электронной почте: [email protected]. Мы сделаем это за вас как можно скорее.
Copyright© 2022 湘ICP备2022001581号-3