OpenAI ChatGPT GPT-4 Turbo ottiene una spinta di mezza età, ecco cosa dovresti sapere

Quando GPT-4 di OpenAI arrivò su Internet, era praticamente il miglior modello LLM (Large Language) in circolazione. Molti dei concorrenti di OpenAI hanno da tempo superato l'originale GPT-4 in vari parametri, dall'enorme finestra di contesto di Claude alle eccellenti prestazioni di Gemini 1.5 con complessi set di dati multimodali. Naturalmente, OpenAI non si è riposata sugli allori per tutto questo tempo. L'azienda ha presentato GPT-4 Turbo a novembre e ora ha appena annunciato un aggiornamento di quel modello con alcune modifiche piuttosto significative.
Tweet di aggiornamento di sam altman gp4 turbo

Nell'aggiornamento più recente, che non ha un nome di fantasia, GPT4 Turbo è ora “significativamente più intelligente e piacevole da usare”, secondo il fondatore di OpenAI Sam Altman. Anche se non ha approfondito, sembra che Altman stia parlando principalmente delle modifiche al modello che hanno reso le sue risposte quando utilizzato come chatbot “più diretto, meno verboso e più colloquiale”, per il quale OpenAI fornisce il seguente esempio come prova:

Esempio di miglioramenti gpt4turbo

Immagine: OpenAI

Il modello aggiornato ottiene inoltre punteggi più alti nei benchmark IA più comuni, incluso il benchmark di domande e risposte a prova di Google a livello di laurea. Questo impegnativo set di dati è stato progettato per testare le capacità dei LLM e comprende un test a scelta multipla di 448 domande con domande distribuite in ogni dominio scientifico. Le domande sono progettate da esperti nei rispettivi campi per giudicare non solo quanto bene i LLM possano rispondere alle domande, ma anche quanto bene possano essere supervisionati dagli esseri umani. Questo test è il benchmark più debole di GPT-4, e la nuova versione migliora il suo punteggio in questo test da circa il 35% a poco meno del 50%, il che è un risultato eccellente per questo difficile benchmark.

Altri benchmark che vedono miglioramenti includono il test MATH incentrato sul ragionamento, il benchmark Multilingual Grade School Math (MGSM) e il benchmark Discrete Reasoning Over Paragraphs (DROP). DROP in particolare è uno dei benchmark AI più impegnativi e GPT-4 Turbo era già uno dei migliori modelli in questo test, ma la nuova versione migliora il suo punteggio in questo difficile test fino a poco più dell'80%, inserendolo nella categoria esclusiva di modelli per raggiungere tali altezze che include se stessa. (Il miglior risultato successivo è quello del Gemini 1.5 Turbo di Google al 78,9%.)

Gli sviluppatori di openai twittano gpt4 turbo con visione

Oltre al nuovo modello che aggiorna le conoscenze di GPT-4 all'aprile 2024, OpenAI rileva anche che GPT-4 Turbo con Vision, il modello che integra funzionalità di analisi delle immagini, è ora generalmente disponibile utilizzando la sua API. Le richieste di visione ora possono anche utilizzare la modalità JSON e la chiamata di funzioni, rendendole notevolmente più versatili rispetto a prima. Nel thread Twitter collegato sopra, gli sviluppatori hanno pubblicato molti esempi impressionanti di app create utilizzando questa API. Se sei interessato a iniziare, vai su Il sito web di OpenAI e controlla i prezzi per le richieste API al GPT-4 Turbo aggiornato.

Advertisement

Advertisement