Najważniejsze informacje:
- Google udostępnia za darmo testową wersję swojego najnowszego modelu AI
- Model oferuje zaawansowaną komunikację głosową i multimodalną
- Dostępne są różne warianty modelu z rozsądnymi limitami użytkowania
- Występują problemy z wyszukiwaniem i przetwarzaniem informacji online
Gemini 2.0 Flash – przyszłość AI w rękach Google
Google zrobiło kolejny krok w kierunku rozwoju sztucznej inteligencji, udostępniając za darmo testową wersję swojego najnowszego modelu – Gemini 2.0 Flash. Jedną z najbardziej imponujących funkcji jest multimodalność, pozwalająca na jednoczesne streamowanie obrazu i prowadzenie konwersacji na temat obserwowanej treści. Jedną z najbardziej intrygujących funkcji jest możliwość prowadzenia rozmowy podczas oglądania streamowanego obrazu – coś, co jeszcze niedawno wydawało się science fiction.
Nie trzeba płacić ani złotówki, żeby sprawdzić, co potrafi ich najnowsze dziecko.
Model radzi sobie całkiem nieźle z komunikacją głosową, choć ma swoje ograniczenia. Możesz mówić do niego po polsku ile chcesz, ale odpowie ci tylko po angielsku. Co prawda istnieje opcja polskiego głosu, ale brzmi jak robot z mocnym wschodnim akcentem – lepiej sobie odpuścić. Mimo to sama rozmowa jest zaskakująco naturalna. Nie ma tych niezręcznych pauz czy przeskoków typowych dla starszych asystentów głosowych.
Wyzwania i ograniczenia
Warto wspomnieć o funkcji „Grounding”, którą można włączyć w ustawieniach. Dzięki niej model zyskuje możliwość podawania konkretnych linków do źródeł. To pokazuje, że Google pracuje nad usprawnieniem wyszukiwania, choć droga do perfekcji jest jeszcze daleka.
Gdzie Gemini 2.0 naprawdę kuleje, to wyszukiwanie informacji online. Niby ma dostęp do internetu, ale porusza się po nim jak słoń w składzie porcelany. Podczas testów próbowałem znaleźć recenzje laptopa Acer Swift 14 AI na polskich stronach. Model kompletnie zignorował istniejący artykuł na androidowy.pl, nawet gdy wprost poprosiłem o sprawdzenie tej strony. Co ciekawe, AI upierało się, że pominięto stronę ze względu na brak dokładnej frazy w tytule – co było nieprawdą. Podobnie było z próbą znalezienia artykułu o mapach migracji ptaków – Gemini po prostu stwierdziło, że blog jest technologiczny i takich treści tam nie ma. Koniec, kropka.


Dostępne warianty i limity
Google udostępnia różne warianty modelu, w tym:
- Gemini Experimental 1206 – obecnie najbardziej zaawansowana wersja
- LearnLM 1.5 PRO Experimental – zoptymalizowany pod kątem wspólnej nauki
Limity użytkowania:
- 15 zapytań na minutę
- 1500 zapytań dziennie
- Dostęp do internetu poprzez funkcję „Grounding”
Patrząc na całość, widać wyraźnie kierunek, w którym zmierza Google. Multimodalność i naturalna komunikacja to przyszłość AI, ale obecna wersja Gemini 2.0 Flash to wciąż work in progress. Szczególnie zastanawiające są problemy z wyszukiwaniem informacji – w końcu mówimy o firmie, która zbudowała swoje imperium właśnie na tej technologii. Może kolejne aktualizacje przyniosą poprawę w tym zakresie.



