Тестируем Gemini 1.5 Pro — гордость Google

Google открыла доступ к бета-версии языковой модели Gemini 1.5 Pro. Это лучшая из нейросетей компании, способная работать с большими массивами текста, кода и визуальных данных. Мы опробовали возможности ИИ и делимся результатами.

Gemini 1.5 Pro

Значительный прорыв

Объём информации, который Gemini 1.5 Pro может принять на вход, составляет 1 млн токенов. Это эквивалентно 700 000 слов или свыше 30 тысяч строчек кода. Для сравнения, у передового аналога GPT-4 контекст в 8,2 раза меньше — 128 тысяч. Модель поискового гиганта также умеет распознавать картинки и считывать содержимое роликов длительностью до 1 часа, правда без аудиодорожки. Есть функция анализа нескольких файлов за раз — достаточно предоставить доступ к папке на «Google Диске». Впечатляет и точность, с которой ИИ извлекает сведения — в 99% случаев Gemini 1.5 Pro правильно указывает отдельные факты из длинных текстов. То есть нейронка не находит нужный фрагмент лишь в трёх из 1125 запросов.

Для теста мы загрузили первые два тома романа Льва Толстого «Война и мир». Они заняли 445 224 токена. На создание краткого содержания всех глав модели понадобилось 310 cекунд. Следовательно, за секунду обрабатываются 739 слов. Ещё на анализ предоставили 30-секундное видео с субтитрами. У Gemini не возникло проблем с тем, чтобы правильно пересказать сюжет и посыл ролика. В качестве изображения отправили простой визуальный ребус — от ИИ требовалось сказать, что произойдёт, когда перчатка упадёт на рычаг. Искусственный интеллект ответил корректно. Это говорит не только о способности видеть объекты, но и моделировать будущее по входным данным.

1 / 3
Миллионный контекст и распознавание видео. Тестируем Gemini 1.5 Pro
Миллионный контекст и распознавание видео. Тестируем Gemini 1.5 Pro
Миллионный контекст и распознавание видео. Тестируем Gemini 1.5 Pro

Как опробовать Gemini 1.5 Pro в РФ?

Модель доступна бесплатно на сайте Google AI Studio, который официально представлен в ряде стран. Оптимально подходят американский либо сингапурский IP-aдреса. С ними достаточно войти в свой Google-аккаунт и выбрать необходимую версию Gemini. Сейчас предоставляются 20 запросов в день. Русский и другие языки поддерживаются, но быстрее и качественнее ответы генерируются на английском.

  • Aliari Perodsacki
    Разницу с ChatGPT обыватель не заметит!
    • dragon1020
      Aliari Perodsacki,
      да, такой же хлам. Придумывает факты, не может решить хоть сколько-то сложную задачу (к примеру вычислить длину намотанной на бобину ленты, если известна ее толщина, диаметр бобины, и общий диаметр рулона.
      • stiimen
        я эти чат-боты всегда одним запросом тестирую: "составь список смартфонов с диагональю от 4" до 5,5" и все чат-боты одинаково тупят, добавляют и меньше 4" и больше 5,5", и всегда почему-то в списке отсутствуют айфоны мини, хотя более ранние айфоны присутствуют, гемини тоже не справился, вот когда справятся, думаю, тогда прогресс и будет очевиден
        • AdeptMasterAgusha
          stiimen,
          gemini advanced составил список из Apple iPhone SE (2020 & 2022), iPhone 12 mini & 13 mini, Sony Xperia XZ2 Compact (запрос делал на англ)
          • stiimen
            AdeptMasterAgusha,
            это весь список? просто устройств куда больше, включая японский sharp aquos r2 compact, китайский xiaomi qin 3 ultra и другие
            • edmschick
              stiimen,
              так этот список огромен, нахрена все модели писать, если телефонов с такой диагональю куда больше, чем парочка штук?
              • stiimen
                edmschick,
                да не такой уж и огромный, 10-15 максимум, да и хоть 500 пусть будет, разве бот не должен конкретно на запрос полноценно ответить, а раз отвечает некорректно, значит проблемы с пониманием простого запроса, а если список неполный, значит некорректная работа с базой знаний, или сама база попросту неполная, хотя когда вторым запросом пишешь "а как же айфоны мини 12 и 13", бот отвечает типа "да, вы правы, вот обновлённый список" или "почему ты добавил смартфон 5,8", ведь он больше чем 5,5", отвечает "вы правы, убираю из списка" и там уже добавлены и убраны лишние, значит знание об этих смартфонах есть, но почему сразу с первого запроса не добавляет, непонятно

                (отредактирован)

                • Levsha_2011
                  edmschick,
                  Г - логика, бот перетрудится, если выдаст весь список. Нахрена писать всё? Для того, чтобы при использовании в реальной работе, н-р, статификация, он выдал всю требуемую информацию, а не что захотел. Если он сделал запрос от вашей логики, то это не ИИ, а з.....а.
            • водочник
              stiimen,
              что так сложно то,я проще: вспомнил кино москва -кассиопея-отроки вовселенной : а и б сидели на трубе,а упало б пропало,чтоосталось на трубе и почему антошка не копает картошку 😁
              • Termich
                stiimen, ну ты видимо колода опус не юзал)
              • @Knox0x1
                dragon1020,
                Gemini решил
                • dragon1020
                  @Knox0x1,
                  решил. Только неправильно. :D Мне его три раза пришлось поправлять, чтобы он верно посчитал. Первое решение вообще "гениально" - он просто посчитал, сколько слоев у намотки, и умножил длину окружности первого слоя на количество слоев. :D
                  • dragon1020,
                    В справочнике Детлафа и Фаворского есть готовая формула ,и даже таблицы, как мне помнится.
                    • Kireels
                      N.Nik,
                      надо будет на туалетной бумаге проверить
              • Illiryel
                Aliari Perodsacki, разница огромна... начиная с отсутствия у gemini целой кучи функций, доступных у gpt (что называется) "из коробки" и заканчивая совершенно разным характером содержимого результатов анализа текстов. Имхо - единственное, чем gemini "выигрывает" - это (неожиданно) скорость ответов... но не их точность. А, да! Глючит gemini ГОРААААЗДО сильнее чем gpt.
                • Ultraviolet75
                  Aliari Perodsacki,
                  "Разницу с ChatGPT обыватель не заметит!" - заметит если попросит нарисовать немецкого солдата! )))))))))
                • ЗлойБобр
                  Зачем в России? У нас ж своя Алиса есть, Маруся, или что-то типо того. А это всё для них, для «наивысших».
                  • dimixxvv
                    ЗлойБобр,
                    Учи матчасть!
                    • Kireels
                      dimixxvv,
                      проблема в прокладке между сиденьем и рулем
                      от слова совсем
                      имхо

                      какие еще дурацкие фразочки бы вспомнить ))
                    • 451859443
                      ЗлойБобр,
                      куда чтоб отправить данные нужна привязка к документам, а если данные будут неверны - проверять их отправителя приедет весь омон района?
                      • PIKreal
                        451859443,
                        А если ещё и спросить что-то, что не понравится, то и вовсе....
                    • fantiк
                      Что за шум вокруг пустышки?
                      • dezmen3
                        Хз, месяц использую модель Ultra. Ни о чем. Если выбирать для работы что-то то или GPT-4 или Claude 3 Opus, последний впечатлил по коду
                        • Atris
                          dezmen3,
                          в моих задачах справляется получше, чем GPT-4. Например создать быстренько форму авторизации по описанию на material ui, а затем обработать её на next.js - за секунды.
                          • dezmen3
                            Atris,
                            по кодингу - только Claude 3 Opus, уделывает обе ИИ.
                        • LockMyClock
                          Не помогают твои сингапурские и американские айпи...
                        • Захожу с американского IP, ввожу гуглоаккаунт - и снова на Дерибасовской!
                          • SV_13,
                            А на Брайтон-бич опять идут дожди😉🤣
                          • lawgun
                            Узконаправленные модели с общим доступом все ещё лучше, но как в плане прикладного ума ничего лучше базовой 4ки нет.

                            Разработчики альтернативного файлового менеджера Files выпустили новую версию приложения с рядом полезных функций и доработок. Они поделились списком изменений и опубликовали ссылки на бесплатное скачивание оригинальной замены стандартного «Проводника».

                             
                            <div></div><div></div><a href='/2024/06/19/1963973/' target='_blank'><img src='https://i.4pda.ws/s/as6ywue3S4wsjFGg0z2I2iyY7kHEE0EmiXkPLY783uK3Miqm98HafRECC.jpg' title='' /></a><div ><img src='https://4pda.to/s/as6yu42hlyXjD7kQLqbvVMOGid.gif' /></div><div></div>

                            В своё время Samsung выпустила веб-приложение Try Galaxy, которое имитирует прошивку One UI на iPhone, позволяя ознакомиться с её преимуществами. Теперь оно стало доступно и на платформе Android — компания рассказала, где его найти и как запустить.

                             

                            Через пять лет после релиза Light Phone 2 разработчики гаджета выпустили третью модель серии. Она сменила экран E-Ink на OLED-панель, но во многом стала лучше и сохранила основную направленность — помогать пользователю с повседневными задачами, не давая отвлекаться на бесконечные ленты соцсетей.

                             

                            Миф о человеческом глазе, который не различает больше 30 кадров в секунду, когда-то воспринимался всерьёз, но сейчас закрепился в массовом сознании как шутка. А вот и не совсем: учёные доказали, что некоторые люди действительно не способны воспринимать высокую частоту кадров.

                             

                            В Windows 11 уже есть несколько ограничений для пользователей, которые ещё не активировали ОС: водяной знак, урезанная персонализация и частые уведомления с напоминаниями. Вскоре к этому «санкционному» списку может добавиться ещё один пункт — его обнаружили инсайдеры в свежей сборке браузера Edge.

                             

                            Anthropic представила семейство больших языковых моделей Claude 3. ИИ научились распознавать картинки, и во многих бенчмарках демонстрируют превосходство над лидером отрасли — GPT-4 от OpenAI. Что примечательно, при тестировании новинок вскрылись нестандартные случаи проявления «самосознания». Рассказываем подробности.

                             

                            «Безопасники» компании F.A.C.C.T. сообщили, что раскрыли новую схему «угона» аккаунтов в Telegram. Она напоминает некоторые уже известные методы мошенничества, но, по мнению экспертов, опасна даже для опытных пользователей. Издание РБК рассказало всё, что об этом известно.

                             

                            В тестовой сборке Windows 11 появилось полезное нововведение, улучшающее спорный интерфейс меню «Пуск». Оно сочетает в себе классический прокручиваемый список приложений с новым дизайном иконок — портал Neowin показал, как это выглядит.

                             

                            Автопроизводитель SAIC GM представил Chevrolet Equinox Plus — гибридный кроссовер с огромным запасом хода и крайне экономичным расходом топлива. Дебют автомобиля состоялся в рамках Пекинского автосалона, а его продажи начнутся в Китае.

                             

                            Спустя всего пару дней после поручения президента РФ по созданию отечественной консоли стали известны её характеристики. Железо новинки вызывает вопросы такого масштаба, что новость уважаемого издания «Известия» впору считать за утку.

                             

                            В этом выпуске Инсайдов: будущие флагманы на Snapdragon 8 Gen 4 не получат революционных изменений; Meizu анонсировала выход Flyme AIOS и смартфона 21 Note; прошивка POCO F6 Pro подтвердила его сходство с Redmi K70.

                             

                            В свежей сборке клиента Google Play для Android (40.6.31) появилось полезное нововведение. Оно убирает печально известный лимит на скачивание не более одного приложения за раз из фирменного магазина — правда, пока лишь частично.

                             

                            Компания объявила о выпуске «премиальной» версии фирменного браузера, распространяемой по модели платной подписки. Она ориентирована на корпоративное использование, и отличается от базовой сборки с приставкой Enterprise расширенным набором функций. В блоге Google появилось подробное описание приложения и данные о новом тарифе.

                             

                            Несколько дней назад Гейб Ньюэлл, основатель Valve и де-факто крёстный отец PC-гейминга, вложился в стартап Starfish — компании, занимающейся разработкой нейроинтерфейсов. Новость сама по себе всколыхнула сообщество, однако многих удивил не сам анонс, а фотография Ньюэлла. 

                             

                            Команда разработчиков Microsoft рассказала о важном изменении, которое избавляет популярнейший офисный редактор от раздражающей функции. Речь идёт об одном из параметров вставки по умолчанию в Word для Windows.

                             
                            Новая версия Google Play замедлила смартфоны Samsung. Как это исправить? Популярное

                            После майского обновления клиента Google Play пользователи смартфонов Samsung начали сообщать, что их смартфоны стали работать медленнее. Вскоре компания признала проблему на своём официальном форуме и рассказала, как её исправить без каких-либо манипуляций с прошивкой.

                             
                            Больше не Eternal. DOOM: The Dark Ages вернётся к олдскульной традиции Популярное

                            В конце прошлой недели id Software явила миру DOOM: The Dark Ages — приквел DOOM (2016) и DOOM Eternal. Фанаты восторженно приняли анонс и принялись гадать, каким образом разработчики превзойдут экшен-механики Eternal. Автор проекта решил объяснить своё видение.

                             
                            Российские операторы активно взялись за отключение 3G Популярное

                            По информации издания Forbes, российские сотовые операторы продолжают отключать сети третьего поколения (3G). Связано это с низким спросом на данную технологию, поскольку большинство активных смартфонов в стране уже поддерживают 4G. В перспективе это позволит заметно повысить скорость мобильного интернета.

                             

                            Не успели первые владельцы Cybertruck получить свои долгожданные авто, как некоторые из них тут же столкнулись с неисправностями и даже поломками, не успев проехать и пары километров. На форуме владельцев электропикапа уже появилась масса сообщений от недовольных пользователей.

                             
                            Экс-сотрудник OpenAI: ИИ погубит человечество с вероятностью 70%  Популярное

                            Термин p(doom) обозначает вероятность того, что искусственный интеллект приведёт человечество к гибели. Дискуссии подобного формата стали предметом постоянных разногласий среди специалистов в сфере машинного обучения. Бывший сотрудник OpenAI Дэниэль Кокотайло прогнозирует, что с вероятностью 70% ИИ может привести к краху человечества.

                             

                            Гаджет стартапа Rabbit, анонсированный на СES 2024, протестировали зарубежные СМИ. Новинка привлекла внимание ярким дизайном и интересной концепцией ИИ-ассистента. Но на практике выяснилось, что устройство пока приносит больше раздражения, чем пользы. Приводим отзывы прессы.

                             

                            Сегодня, 29 февраля, на нашем форуме начало появляться огромное количество сообщений от владельцев смартфонов Xiaomi, POCO и Redmi о неожиданном «окирпичивании». Гаджеты самостоятельно перезагружаются в рекавери без возможности зайти в систему.

                             

                            Более 200 экземпляров Apple Watch были найдены в озере Иллинойса одним из дайверов. С помощью металлоискателя Дарик Лангос нашёл целые залежи умных часов во время заплывов в районе Чейн О'Лейкс на северо-востоке штата. Многие из них всё ещё функционируют.

                             

                            Взломанные консоли и пиратские игры давно стали частью истории видеоигровой индустрии в России и продолжают ей быть, однако это всё ещё незаконная деятельность. В чём пришлось убедиться пенсионеру из Липецка.

                             

                            В сеть попала сервисная инструкция к Tesla Cybertruck, в которой производитель показывает, как устранить неисправность с педалью газа. Именно из-за неё компания ранее отозвала все проданные пикапы. Судя по брошюре, решение похоже на «гаражное».

                             
                            Астрофотограф крупным планом запечатлел гигантское Солнечное пятно Популярное

                            Астрофотограф Мигель Кларо поделился завораживающей фотографией Солнца. Мужчина из Португалии на профессиональном уровне создаёт впечатляющие изображения ночного неба. Недавно ему удалось получить снимки корональных выбросов Солнечной массы.

                             

                            Три месяца назад компания Neuralink впервые в истории вживила чип 29-летнему пациенту по имени Ноланд Арбо. Спустя ровно сто дней стартап Илона Маска сообщил, что часть мозгового импланта вышла из строя. Из-за этого компании пришлось срочно обновлять программное обеспечение.

                             

                            Сериал по мотивам Fallout можно назвать безоговорочно успешным — он не просто «пришёл и ушёл», о нём говорят, его тщательно исследуют в поисках намёков на оригинальные игры и различных «пасхалок» от съёмочной группы. На днях, к примеру, фанаты заметили на вид рабочий номер телефона и решили его проверить.

                             

                            Когда в конце 2022 года Netflix объявила, что Генри Кавилл покинет сериал «Ведьмак» и образ Геральта из Ривии достанется Лиаму Хемсворту, фанаты приняли новость в штыки. С тех пор публика более-менее успокоилась, поняв, что без подобных замен в шоу-бизнесе не обойтись. Но один вопрос не даёт людям покоя: как авторы шоу обыграют «пластическую операцию» главного героя? Инсайдеры нашли ответ, подтвердив слух.

                             

                            Компания снова расширила список фирменных устройств, для которых официально прекратилась программная поддержка. На этот раз «под раздачу» попали по два устройства брендов Xiaomi и POCO, представленных три года назад.

                             
                            «Снимать с зумом хочется даже чаще, чем на основную камеру». Тестируем Honor Magic6 Pro
                            60
                            3.05.24News

                            Редакция досконально изучила флагманский Honor Magic6 Pro. Настало время пользователей проверить аппарат в разных условиях. Приглашённый эксперт и по совместительству постоянный читатель 4PDA делится своими впечатлениями от смартфона.

                             

                            Представители Сбербанка рассказали об обновлённой схеме, которой пользуются злоумышленники для оформления займов в микрофинансовых организациях. Теперь в ход идут мессенджеры и портал «Госуслуги».