Co to jest Google Gemini 1.5? Najnowszy model AI jest niesamowicie potężny

Co to jest Google Gemini 1.5? Google jest podekscytowany najnowszymi ulepszeniami platformy Google Gemini AI o nazwie Gemini 1.5, które pojawiają się tuż po premierze platformy Gemini w grudniu.

Jeśli nie znasz Google Gemini, nowej nazwy początkowych wypraw pod pseudonimem Bard, mamy tutaj naprawdę dobre wyjaśnienie od naszego redaktora komputerowego Adama Speighta.

Istnieje wiele różnych iteracji Gemini, w tym Nano (najbardziej wydajny model do zadań na urządzeniu), Pro (najlepszy model do skalowania w szerokim zakresie zadań) i Ultra (największy i najbardziej wydajny model do bardzo złożonych zadań) . Dzisiaj Google umożliwia wybranym grupom testowanie Gemini 1.5 Pro przed wprowadzeniem go na rynek konsumencki w późniejszym terminie.

Po tym, jak wersja 1.0 nie pozostawiła wątpliwości, że Google jest na dobrej drodze do przejęcia wczesnej przewagi OpenAI i Microsoftu dzięki narzędziom opartym na ChatGPT, ogłoszona dzisiaj przez Google aktualizacja 1.5 radykalnie zwiększa tę wydajność.

Oto, czym naprawdę zachwyca się Google.

Inteligentna wtyczka Kasa (KS105) kosztuje zaledwie 8,99 GBP

Inteligentna wtyczka TP-Link Kasa ma niewielkie rozmiary i niewielką cenę. Te przydatne wtyczki do podłączenia Wi-Fi możesz kupić za 55% zniżki.

Amazonka
Kosztowało 19,99 GBP
Teraz 8,99 GBP

Zobacz ofertę

Co to jest Google Gemini 1.5?

Google twierdzi, że Gemini 1.5 „znacznie zwiększyło wydajność i stanowiło przełom w rozumieniu długiego kontekstu w różnych modalnościach”. Ogólnie rzecz biorąc, Gemini 1.5 Pro przewyższa 1.0 Pro o 87%, a w testach porównawczych wypada równie dobrze jak 1.0 Ultra.

Kluczem jest to, co Google nazywa architekturą mieszaną ekspertów (MoE), co oznacza, że przy każdym zapytaniu nie jest konsultowany cały model. Google twierdzi, że Gemini 1.5 może „selektywnie aktywować tylko najbardziej odpowiednie ścieżki eksperckie w swojej sieci neuronowej”, co oznacza szybsze i wydajniejsze działanie.

„Nasze najnowsze innowacje w architekturze modeli pozwalają Gemini 1.5 szybciej uczyć się złożonych zadań i utrzymywać jakość, a jednocześnie efektywniej szkolić i służyć” – twierdzi Google.

Firma jest również całkiem zadowolona z dłuższego „okna kontekstowego” dostępnego w Gemini 1.5, co jest najbardziej widoczne w liczbie tokenów (fragmentów słów, obrazów, filmów, dźwięku lub kodu), które model może obsłużyć na każde żądanie.

Podczas gdy Gemini 1.0 Pro ma pojemność 32 000 tokenów, Gemini 1.5 Pro może teraz obsłużyć milion na raz.

Co to znaczy? Cóż, ogromne ilości informacji można teraz szybko przetworzyć. Google twierdzi, że milion tokenów odpowiada „1 godzinie wideo, 11 godzinom dźwięku, bazom kodu zawierającym ponad 30 000 linii kodu lub ponad 700 000 słów”.

Oto demonstracja tego „zrozumienia długiego kontekstu” oparta na 402-stronicowym transkrypcie misji księżycowej Apollo 11.