„Wenn ein Arbeiter seine Arbeit gut machen will, muss er zuerst seine Werkzeuge schärfen.“ – Konfuzius, „Die Gespräche des Konfuzius. Lu Linggong“
Titelseite > KI > GPT-4o bringt GPT-4 zu jedem, und so funktioniert es

GPT-4o bringt GPT-4 zu jedem, und so funktioniert es

Veröffentlicht am 02.11.2024
Durchsuche:960

Was ist also GPT-4o?

Was ist GPT-4o?

GPT-4o ist das neueste KI-Modell des ChatGPT-Entwicklers OpenAI, das auf seiner „Spring Update“-Veranstaltung Anfang Mai 2024 vorgestellt wurde. Es wird zumindest vorerst mit seinem bisherigen Spitzenmodell GPT-4 Turbo koexistieren und bringt eine Vielzahl von Updates für das Tool mit sich.

Im Gegensatz zu seinen Vorgängern ist GPT-4o vom Start an vollständig multimodal (das „o“ im Modellnamen steht für „omnimodal“). Bei der Frühlingsaktualisierungsveranstaltung von OpenAI wurde GPT-4o vorgestellt, der sich fließend mit den Veranstaltungsveranstaltern unterhielt, zwischen Interaktionen hin und her wechselte, „Persönlichkeit“ zur Schau stellte und veranschaulichte, wie er zu dem virtuellen Assistenten werden könnte, von dem Benutzer geträumt haben.

Es kann Kombinationen aus Audio, Text, Bild und Video als Ein- und Ausgabe in Text, Audio und Bild akzeptieren (noch keine Videounterstützung, aber das wird sich voraussichtlich ändern, sobald das Text-zu-Video-Tool Sora von OpenAI verfügbar ist startet – zumindest gehe ich davon aus, dass dies passieren wird).

In Bezug auf die von OpenAI bereitgestellten Rohzahlen übertrifft GPT-4o alle seine Vorgängermodelle sowie seine nächsten Konkurrenten wie Claude 3 Opus, Gemini Pro 1.5 und Ultra 1.0 und Llama 3 400B.

GPT-4o Brings GPT-4 to Everyone, and This Is How It Works

Nun, Zahlen sind alle schön und gut, aber was bedeutet das eigentlich? Nun, noch einmal: Basierend auf den Zahlen von OpenAI erreicht GPT-4o beim Schreiben und Codieren in Englisch „die Turbo-Leistung von GPT-4“, ist in „nicht-englischen Sprachen“ deutlich schneller und, was am wichtigsten ist, in Bezug auf die API schneller und günstiger verwenden.

Die Live-Funktionen von GPT-4o sind erstaunlich.

Ich arbeite schon lange im Technologiebereich und habe viele glänzende neue „Game-Changer“ kommen und gehen sehen. Aber die Konversationssprache des GPT-4o ist wirklich brillant. GPT-4o kann richtige Gespräche mit Ihnen führen und ermöglicht Ihnen sogar, zu unterbrechen, den Gesprächsschwerpunkt zu ändern, das Thema zu wechseln und vieles mehr, fast ohne einen Takt auszusetzen.

Seine Fähigkeit, sich schnell zu unterhalten, eröffnet eine ganze Reihe neuer Anwendungsmöglichkeiten. Während ChatGPT bereits über eine Sprachfunktion verfügte, war diese eingeschränkt, da zunächst eine Antwort geschrieben werden musste, die dann mit Ihnen gesprochen werden konnte. Sie könnten mit ChatGPT auch über Ihre Stimme interagieren, die Bearbeitung Ihrer Anfrage würde jedoch einige Zeit in Anspruch nehmen.

Jetzt ist die Echtzeitstimme von GPT-4o nahezu nahtlos. Darüber hinaus kann es Emotionen und spezifische Stile ausdrücken, was vor diesem Update wiederum unmöglich war.

Dies gilt auch für die Live-Übersetzung, bei der GPT-4o eine enorme Verbesserung zeigte. Nun, ich kenne mich in keiner anderen Sprache gut aus, aber die Live-Übersetzung vom Englischen ins Italienische und zurück kam gut an; Alles, was die Kommunikation im Ausland erleichtert, ist ein enormer Segen, insbesondere angesichts der Geschwindigkeit der Übersetzung.

Ich war kürzlich in Marokko, und obwohl Google Translate dabei hilft, etwas Bedeutung ins Arabische zu bringen, ist der vollständige Kontext der Übersetzung nie ganz korrekt. Die Live-Übersetzung von GPT-4o wäre unglaublich nützlich gewesen!

Codierung und Tutoring

GPT-4o bringt dank seiner multimodalen Funktionen auch erhebliche Verbesserungen bei der Codeinterpretation und -unterstützung. Ähnlich wie die anderen Tools könnte ChatGPT bereits mit einigen Daten arbeiten, aber sein neues Modell steigert dies drastisch.

Die Möglichkeit, Code nur mit Ihrer Stimme zu debuggen, ist bemerkenswert. Sein tatsächlicher Nutzen wird jedoch erst klar, wenn tatsächliche Programmierer und Entwickler beginnen, das Tool zu nutzen. Die Codierungsfähigkeiten von ChatGPT sind zwar nützlich, aber wie bei den meisten generativen KI-Tools sind sie nur so nützlich wie das Wissen des Benutzers.

Wann startet GPT-4o? Ist GPT-4o kostenlos?

GPT-4o wurde sofort für ChatGPT Plus-Abonnenten eingeführt, die die monatliche Gebühr von 20 US-Dollar zahlen. Aber in einem weiteren großen Moment für generative KI gab OpenAI bekannt, dass GPT-4o zu gegebener Zeit für alle Benutzer – einschließlich kostenloser Benutzer – verfügbar sein würde.

Es gibt kein konkretes Datum für die Einführung von GPT-4o bei kostenlosen ChatGPT-Konten, aber angesichts der Geschwindigkeit anderer Einführungen sollte es nicht allzu lange dauern.

Auch andere Aspekte des neuen Modells sind noch nicht verfügbar. Ich wollte zum Beispiel einen kurzen Clip der neuen Live-Voice-Funktion für diesen Artikel machen, aber die Funktion wurde noch nicht gestartet (ich bin ein langjähriger ChatGPT Plus-Abonnent) und hat auch noch nicht den Weg zu irgendeinem Kollegen gefunden Konten.

GPT-4o wird auch eine lang erwartete ChatGPT-Desktop-Version bringen, beginnend mit macOS, aber auch diese ist noch nicht gestartet.

Freigabeerklärung Dieser Artikel ist abgedruckt unter: https://www.makeuseof.com/how-gpt-4o-works-is-it-free/. Bei Verstößen wenden Sie sich bitte an [email protected], um ihn zu löschen
Neuestes Tutorial Mehr>

Haftungsausschluss: Alle bereitgestellten Ressourcen stammen teilweise aus dem Internet. Wenn eine Verletzung Ihres Urheberrechts oder anderer Rechte und Interessen vorliegt, erläutern Sie bitte die detaillierten Gründe und legen Sie einen Nachweis des Urheberrechts oder Ihrer Rechte und Interessen vor und senden Sie ihn dann an die E-Mail-Adresse: [email protected] Wir werden die Angelegenheit so schnell wie möglich für Sie erledigen.

Copyright© 2022 湘ICP备2022001581号-3