epoint

Podczas tegorocznej konferencji I/O Google zaprezentował szereg aktualizacji w całej rodzinie modeli Gemini, w tym nową wersję 1.5 Flash, najszybszy i najbardziej ekonomiczny model AI od Google. Ponadto Gemini 1.5 Pro jest teraz bezpośrednio dostępne dla użytkowników Gemini Advanced w 35 językach – w tym po polsku! Kolejne nowości będą wprowadzone w najbliższym czasie, zwiększając możliwości sztucznej inteligencji od Google i czyniąc ją jeszcze bardziej przydatnym narzędziem dla wszystkich.

Gemini wkracza na nowy poziom dzięki szybszemu modelowi, dłuższemu kontekstowi i agentom AI

1.5 Flash jest najnowszym modelem w rodzinie Gemini i najszybszym modelem Gemini obsługiwanym w API. Został zaprojektowany z myślą o skalowalnej obsłudze zadań o dużej objętości i wysokiej częstotliwości, jego eksploatacja jest bardziej opłacalna, a jednocześnie model ten oferuje przełomowo długie okno kontekstowe.

Chociaż jest to model lżejszy niż 1.5 Pro, dysponuje zaawansowanymi multimodalnymi zdolnościami w zakresie wyciągania wniosków na podstawie ogromnych ilości informacji i zapewnia imponującą jakość w stosunku do swojego rozmiaru.

1.5 Pro rozumie teraz coraz bardziej złożone i zniuansowane instrukcje, w tym te, które określają cechy na poziomie produktu, takie jak rola, format i styl. Poprawiliśmy kontrolę nad odpowiedziami modelu w konkretnych przypadkach użycia, takich jak kształtowanie persony i stylu odpowiedzi agenta czatu lub automatyzacja procesów poprzez wielokrotne wywołania funkcji. Umożliwiliśmy także użytkownikom kierowanie zachowaniem modelu poprzez ustawienie instrukcji systemowych.

Dodano również rozumienie dźwięku w interfejsie Gemini API i Google AI Studio, dzięki czemu 1.5 Pro może teraz analizować zarówno obrazy, jak i dźwięki w wideo przesłanych do Google AI Studio. Teraz trwa integracja 1.5 Pro z uslugami Google, w tym Gemini Advanced i aplikacjami Workspace.

Nowe modele i narzędzia generatywne stworzone z myślą o twórcach

Veo tworzy wysokiej jakości wideo w rozdzielczości 1080p, które mogą trwać ponad minutę, w różnych stylach filmowych i wizualnych. Dzięki zaawansowanemu rozumieniu języka naturalnego i semantyki wizualnej Veo może tworzyć filmy wideo, które dokładnie odzwierciedlą kreatywną wizję twórcy oraz precyzyjnie oddadzą szczegóły z dłuższych promptów i zamierzony klimat filmu.

Model rozumie również terminy filmowe, takie jak „film poklatkowy” lub „ujęcia z lotu ptaka”, zapewniając niespotykany dotąd poziom kontroli twórczej. Tworzy spójny materiał filmowy, w którym ludzie, zwierzęta i przedmioty poruszają się w realistyczny sposób.

Generatywna AI w wyszukiwarce: pozwólcie Google wyszukiwać za Was

W ramach eksperymentu w Search Labs użytkownicy korzystali już ze streszczeń wygenerowanych przez AI miliardy razy. Spodobało im się, że mogą uzyskać zarówno szybkie podsumowanie tematu, jak i linki pozwalające zdobyć dodatkowe informacje. Eksperyment pokazał, że dzięki streszczeniom wygenerowanym przez AI użytkownicy częściej korzystają z wyszukiwarki i są bardziej zadowoleni z uzyskiwanych wyników.

Dzisiaj udostępniono streszczenia wygenerowane przez AI wszystkim użytkownikom w Stanach Zjednoczonych, a wkrótce w kolejnych krajach. [W ciągu tygodnia setki milionów użytkowników uzyskają dostęp do streszczeń wygenerowanych przez AI, a do końca roku liczba ta powinna osiągnąć miliard].

Dzięki streszczeniom wygenerowanym przez AI użytkownicy odwiedzają bardziej zróżnicowane witryny. Widzimy też, że linki zawarte w przeglądach AI uzyskują więcej kliknięć, niż gdyby strona pojawiła się jako tradycyjny wpis internetowy dla tego zapytania. Rozszerzając to doświadczenie, będziemy nadal koncentrować się na wysyłaniu wartościowego ruchu do wydawców i twórców. Reklamy będą jak zawsze pojawiać się w przeznaczonych na nie miejscach na całej stronie, z wyraźnym oznakowaniem umożliwiającym odróżnienie wyników bezpłatnych od sponsorowanych.

Róbcie więcej dzięki Gemini: wypróbujcie model 1.5 Pro oraz nowe inteligentne funkcje

Udostępniono subskrybentom Gemini Advanced najnowocześniejszy model – Gemini 1.5 Pro. Gemini 1.5 Pro obejmuje najnowsze osiągnięcia techniczne, w tym znacznie rozszerzone okno kontekstowe rozpoczynające się od 1 miliona tokenów. Jest ono dłuższe niż w przypadku wszystkich innych chatbotów konsumenckich na świecie. Tak długie okno kontekstowe oznacza, że Gemini Advanced może zrozumieć ogromne dokumenty, takie jak pliki PDF o długości 1500 stron, lub podsumować 100 wiadomości e-mail w kilka sekund. Wkrótce będzie w stanie przetworzyć godzinę treści wideo lub bazy kodu z ponad 30 tysiącami linii.

Aby zoptymalizować korzystanie z tak długiego okna kontekstowego, dodano możliwość przesyłania plików do Gemini Advanced za pośrednictwem Dysku Google lub bezpośrednio z urządzenia. Teraz możecie szybko uzyskać odpowiedzi i informacje z obszernych dokumentów, na przykład wydobyć zapisy dotyczące zwierząt domowych z umowy najmu lub porównać kluczowe argumenty wielu długich artykułów naukowych. Wkrótce Gemini Advanced będzie działać jak analityk danych i szybko wyciągnie wnioski oraz stworzy wykresy z przesłanych plików danych, takich jak arkusze kalkulacyjne.

Gemini dba o prywatność przechowywanych plików i rozmów na ich temat. Są one niedostępne dla innych i nie są wykorzystywane do trenowania naszych modeli.

Gemini jest natywnie multimodalny, a model 1.5 Pro wprowadza duże ulepszenia w zakresie rozumienia obrazów. Możecie na przykład zrobić zdjęcie dania w swojej ulubionej restauracji i poprosić o przepis lub zrobić zdjęcie zadania matematycznego, a Gemini wyjaśni krok po kroku, jak je rozwiązać – a wszystko to na podstawie jednego obrazu.

Gemini 1.5 Pro będzie dostępny dla subskrybentów Gemini Advanced w ponad 150 krajach i w ponad 35 językach.

Poznajcie jeszcze lepiej AI od Google na Androidzie

Gemini na Androidzie to nowy rodzaj asystenta, który pomaga zwiększać kreatywność i wydajność za pomocą generatywnej AI. Narzędzie to zostało zintegrowane z systemem operacyjnym i coraz lepiej rozumie to, z jakiej aplikacji korzystacie, oraz kontekst tego, co znajduje się na Waszych ekranach.

Wkrótce zostanie udostępniona użytkownikom nakładka Gemini, która będzie widoczna na górze ekranu dowolnej aplikacji, aby móc korzystać z Gemini na jeszcze więcej sposobów. Na przykład będzie można przeciągnąć i upuścić wygenerowane obrazy w Gmailu, Wiadomościach Google i innych aplikacjach lub „zapytać ten film”, by znaleźć dokładne informacje w filmie na YouTube. Użytkownicy wersji Gemini Advanced będą mogli także użyć funkcji „Zapytaj ten PDF”, żeby szybko otrzymać odpowiedzi bez konieczności przewijania wielu stron dokumentu. Ta aktualizacja w ciągu kilku kolejnych miesięcy zostanie udostępniona na setkach milionów urządzeń.

Zapytaj Zdjęć z Gemini: nowy sposób wyszukiwania Waszych zdjęć

Codziennie do Zdjęć Google jest przesyłanych ponad 6 miliardów obrazów. Coraz większa liczba zdjęć i filmów w galeriach sprawia, że wyszukiwanie konkretnych treści sprowadza się do wielokrotnego przewijania ekranu, nawet jeśli dysponujemy właściwą kombinacją słów kluczowych. Dzięki funkcji Zapytaj Zdjęć możecie poprosić o coś, czego akurat potrzebujecie, w naturalny sposób, na przykład: „Pokaż mi najlepsze zdjęcie z każdego odwiedzonego przeze mnie parku narodowego”. Zdjęcia Google pokażą Wam to, czego szukacie, i przewijanie będzie już zbędne.

Fotografie, niezależnie od tego, czy uchwyciliśmy w nich radosne wspomnienia, czy zrobiliśmy je, by zachować istotne szczegóły, zawierają wiele przydatnych informacji, które mogą umknąć naszej uwadze. Funkcja Zapytaj Zdjęć pomoże Wam odkryć te informacje, gdy zadacie odpowiednie pytania, na przykład o miejsce spędzania zeszłorocznych wakacji czy datę ważności paszportu. Gemini, dzięki swoim zaawansowanym multimodalnym zdolnościom, potrafi wychwycić nawet najdrobniejsze szczegóły na zdjęciu i sprosta pytaniom takim jak „Jaki motyw miało przyjęcie urodzinowe Zosi?”. A to za sprawą analizy – w tym przypadku: dekoracji w tle albo na torcie.

Dzięki modelom Gemini realizacja zadań stała się prostsza także w Zdjęciach Google. Na przykład wybranie najlepszych zdjęć z rodziną i znajomymi po długiej podróży może być nie lada wyzwaniem. Zdjęcia Google pomogą Wam z łatwością stworzyć kompilację wszystkich najciekawszych ujęć. Wystarczy, że o to poprosicie, a Zdjęcia zasugerują Wam najfajniejsze fotografie, a nawet dodadzą do nich indywidualny podpis, by można je udostępnić w mediach społecznościowych.

Subscribe
Powiadom o
guest
0 komentarzy
najstarszy
najnowszy oceniany
Inline Feedbacks
View all comments