GPT-4o を試してみましたが、これは無料の ChatGPT ユーザーにとって大変革でした

カルビン・ワンケデ / Android 権威

OpenAI が次世代 GPT-5 言語モデルを積極的に開発していることは以前から知られていました。 しかし今週初め、同社は GPT-4 Turbo の増分アップデートを発表して私たちを驚かせました。 GPT-4o と呼ばれるこの新しいモデルは、リアルタイムの音声対話、ビデオ機能、より高速で正確な応答をもたらす大規模なアップデートです。 しかし、派手なデモはさておき、GPT-4o は無料の ChatGPT ユーザーにとって 1 年以上ぶりの最大のアップデートでもあります。 これがなぜそれほど大きな問題なのかを説明します。

Advertisement

ChatGPT-4oとは何ですか?

スマートフォンのウェブサイト上の OpenAI 写真素材 (1)

エドガー・セルバンテス / Android 権威

ChatGPT-4o または GPT-4o は、オーディオ、ビデオ、テキストをリアルタイムで推論できる OpenAI の最新かつ最先端の言語モデルです。 このモデルは、平均わずか 320 ミリ秒以内に音声入力に応答でき、これは人間の応答時間とほぼ同じ速さであり、自然な会話が可能です。

昨年、私は ChatGPT の音声会話機能と、それがすでに現実の会話をほぼ完璧に模倣していることについて書きました。 GPT-4o はその体験をさらに高めます。 以前の機能では音声認識と応答生成に異なるモデルが使用されていましたが、GPT-4o はプロセス全体をエンドツーエンドで処理できるようにトレーニングされています。 GPT-4 のような大規模な言語モデルの機能を備えた OpenAI は、AI が音声の中の感情を検出することもできると述べています。

GPT-4o はより高速かつ正確で、声の中の感情を検出することもできます。

Advertisement

GPT-4o の音声機能の向上はそれだけでも大きな問題ですが、OpenAI が披露した新機能はそれだけではありません。 新しい言語モデルでは、新しいトークナイザーのおかげで、応答が大幅に高速化されています。 英語以外の言語、特にラテン文字を使用しない言語では、新しいモデルは以前の GPT-4 Turbo モデルの 2 倍速く感じるだろうと OpenAI は述べています。

イベントの衝撃的な発表は、GPT-4o がすべての ChatGPT ユーザーに提供されるということでした。 そうです。チャットボットの最新かつ最も機能的なバージョンに無料でアクセスでき、ChatGPT Plus サブスクリプションは必要ありません。 これは、2022 年後半にチャットボットがリリースされて以来、無料ユーザーにとって初めての精度と速度のアップデートとなります。

無料ユーザーにとっての朗報はそれだけではありません。 GPT-4o は OpenAI の GPT-4 言語モデルの拡張であるため、インターネットを検索し、その応答を事実確認することもできます。 これまで、無料ユーザーは、インテリジェント性が大幅に低く、2022 年 1 月に知識が終了する GPT-3.5 モデルを使用する必要がありました。

GPT-4o の動作: その使用方法

しばらく ChatGPT にログインしていない場合は、今が変更する時期です。 OpenAIは、GPT-4oへのアクセスを段階的にすべてのユーザーに開放しており、即時有効になると述べている。 私は GPT-4 への無料アクセスを提供する Microsoft Copilot を約 1 年間使用してきましたが、そのため、その間 ChatGPT を使用することはほとんどありませんでした。 それでも、ログインするとすぐに「制限された容量」で GPT-4o にアクセスできるようになりました。

GPT-4o の音声会話機能はまだ利用できないことに注意してください。 OpenAI CEOのサム・アルトマン氏は、今後数週間以内に展開を開始すると述べた。 音声会話も、少なくとも当面の間は、ChatGPT Plus ユーザーのみが利用できるようになります。

この免責事項を除いても、GPT-4o はそれ自体で、特に無課金ユーザーにとっては印象的なアップデートであることに変わりはありません。 プロンプトを入力すると、GPT-4 と比較してモデルの応答が驚くほど速いことがわかります。 ただし、4 年前の最初のリリース以来、絶え間なく微調整と最適化が行われてきた従来の GPT-3.5 モデルほど高速であるとは限りません。

GPT-4o のテスト: 本当に正確ですか?

速度はさておき、GPT-4o の大きなハイライトは、応答が大幅に正確になったことです。 また、GPT-3.5 とは異なり、厳密な知識の期限もありません。 これは、チャットボットが幻覚を見せたり、誤った応答を吐き出したりすることを心配することなく、最終的にチャットボットに事実に基づいた質問をできることを意味します。 GPT-4o はどの程度のアップグレードですか? 私のテストではかなり大きなものでした。 ここでは、GPT-3.5 と GPT-4o の両方に簡単な事実に基づく質問を並べて比較しています。

この比較的単純な例からわかるように、どちらの言語モデルも正しい応答を返します。 ただし、GPT-4o は応答にかなり自信を持っており、詳細な回答を提供しました。 古い GPT-3.5 モデル (これまで無料の ChatGPT ユーザーが利用できる唯一のモデルでした) は代わりにメモリから応答しました。これが、公式情報源による情報の確認を求められた理由の説明になります。

興味深いことに、この特定の質問では、オプションが「このモデルはツールの使用をサポートしていません」というメッセージとともにグレー表示されていたため、GPT-4o から GPT-3.5 に切り替えることができませんでした。 そのため、ChatGPT に事実に基づく質問をすると、自動的にインターネットを参照して最新モデルを使用するようになります。 これは、英国で購入するという条件で、Galaxy S24 Ultra にどのチップが搭載されているかを ChatGPT に尋ねた別の例です。

GPT-4o のインターネット検索機能のおかげで、S24 Ultra には世界中で Snapdragon 8 Gen 3 が搭載されていることが正確にわかりました。 ヨーロッパでは通常の S24 と Plus S24 のバリエーションが Exynos 2400 に付属することも明らかにしました。 私は過去に他のチャットボットに同じ質問をしましたが、自信に満ちたように聞こえるが不正確な回答しか得られませんでした。 上記の GPT-3.5 からの応答を見てください。

Advertisement


GPT-4o の可能性、つまり音声機能を最大限に体験するにはまだ数週間かかりますが、ベースライン エクスペリエンスはそれ自体で依然として印象的です。 さらに良いことに、誰でも無料で普遍的にアクセスできます。 したがって、ChatGPT の代わりに Microsoft Copilot または Google Gemini を使用している場合は、今が元に戻す時期かもしれません。

よろしければ

Advertisement