Тестируем Gemini 1.5 Pro — гордость Google

Google открыла доступ к бета-версии языковой модели Gemini 1.5 Pro. Это лучшая из нейросетей компании, способная работать с большими массивами текста, кода и визуальных данных. Мы опробовали возможности ИИ и делимся результатами.

Gemini 1.5 Pro

Значительный прорыв

Объём информации, который Gemini 1.5 Pro может принять на вход, составляет 1 млн токенов. Это эквивалентно 700 000 слов или свыше 30 тысяч строчек кода. Для сравнения, у передового аналога GPT-4 контекст в 8,2 раза меньше — 128 тысяч. Модель поискового гиганта также умеет распознавать картинки и считывать содержимое роликов длительностью до 1 часа, правда без аудиодорожки. Есть функция анализа нескольких файлов за раз — достаточно предоставить доступ к папке на «Google Диске». Впечатляет и точность, с которой ИИ извлекает сведения — в 99% случаев Gemini 1.5 Pro правильно указывает отдельные факты из длинных текстов. То есть нейронка не находит нужный фрагмент лишь в трёх из 1125 запросов.

Для теста мы загрузили первые два тома романа Льва Толстого «Война и мир». Они заняли 445 224 токена. На создание краткого содержания всех глав модели понадобилось 310 cекунд. Следовательно, за секунду обрабатываются 739 слов. Ещё на анализ предоставили 30-секундное видео с субтитрами. У Gemini не возникло проблем с тем, чтобы правильно пересказать сюжет и посыл ролика. В качестве изображения отправили простой визуальный ребус — от ИИ требовалось сказать, что произойдёт, когда перчатка упадёт на рычаг. Искусственный интеллект ответил корректно. Это говорит не только о способности видеть объекты, но и моделировать будущее по входным данным.

1 / 3
Миллионный контекст и распознавание видео. Тестируем Gemini 1.5 Pro
Миллионный контекст и распознавание видео. Тестируем Gemini 1.5 Pro
Миллионный контекст и распознавание видео. Тестируем Gemini 1.5 Pro

Как опробовать Gemini 1.5 Pro в РФ?

Модель доступна бесплатно на сайте Google AI Studio, который официально представлен в ряде стран. Оптимально подходят американский либо сингапурский IP-aдреса. С ними достаточно войти в свой Google-аккаунт и выбрать необходимую версию Gemini. Сейчас предоставляются 20 запросов в день. Русский и другие языки поддерживаются, но быстрее и качественнее ответы генерируются на английском.

  • Aliari Perodsacki
    Разницу с ChatGPT обыватель не заметит!
    • dragon1020
      Aliari Perodsacki,
      да, такой же хлам. Придумывает факты, не может решить хоть сколько-то сложную задачу (к примеру вычислить длину намотанной на бобину ленты, если известна ее толщина, диаметр бобины, и общий диаметр рулона.
      • stiimen
        я эти чат-боты всегда одним запросом тестирую: "составь список смартфонов с диагональю от 4" до 5,5" и все чат-боты одинаково тупят, добавляют и меньше 4" и больше 5,5", и всегда почему-то в списке отсутствуют айфоны мини, хотя более ранние айфоны присутствуют, гемини тоже не справился, вот когда справятся, думаю, тогда прогресс и будет очевиден
        • AdeptMasterAgusha
          stiimen,
          gemini advanced составил список из Apple iPhone SE (2020 & 2022), iPhone 12 mini & 13 mini, Sony Xperia XZ2 Compact (запрос делал на англ)
          • stiimen
            AdeptMasterAgusha,
            это весь список? просто устройств куда больше, включая японский sharp aquos r2 compact, китайский xiaomi qin 3 ultra и другие
            • edmschick
              stiimen,
              так этот список огромен, нахрена все модели писать, если телефонов с такой диагональю куда больше, чем парочка штук?
              • stiimen
                edmschick,
                да не такой уж и огромный, 10-15 максимум, да и хоть 500 пусть будет, разве бот не должен конкретно на запрос полноценно ответить, а раз отвечает некорректно, значит проблемы с пониманием простого запроса, а если список неполный, значит некорректная работа с базой знаний, или сама база попросту неполная, хотя когда вторым запросом пишешь "а как же айфоны мини 12 и 13", бот отвечает типа "да, вы правы, вот обновлённый список" или "почему ты добавил смартфон 5,8", ведь он больше чем 5,5", отвечает "вы правы, убираю из списка" и там уже добавлены и убраны лишние, значит знание об этих смартфонах есть, но почему сразу с первого запроса не добавляет, непонятно

                (отредактирован)

                • Levsha_2011
                  edmschick,
                  Г - логика, бот перетрудится, если выдаст весь список. Нахрена писать всё? Для того, чтобы при использовании в реальной работе, н-р, статификация, он выдал всю требуемую информацию, а не что захотел. Если он сделал запрос от вашей логики, то это не ИИ, а з.....а.
            • водочник
              stiimen,
              что так сложно то,я проще: вспомнил кино москва -кассиопея-отроки вовселенной : а и б сидели на трубе,а упало б пропало,чтоосталось на трубе и почему антошка не копает картошку 😁
              • Termich
                stiimen, ну ты видимо колода опус не юзал)
              • @Knox0x1
                dragon1020,
                Gemini решил
                • dragon1020
                  @Knox0x1,
                  решил. Только неправильно. :D Мне его три раза пришлось поправлять, чтобы он верно посчитал. Первое решение вообще "гениально" - он просто посчитал, сколько слоев у намотки, и умножил длину окружности первого слоя на количество слоев. :D
                  • dragon1020,
                    В справочнике Детлафа и Фаворского есть готовая формула ,и даже таблицы, как мне помнится.
                    • Kireels
                      N.Nik,
                      надо будет на туалетной бумаге проверить
              • Illiryel
                Aliari Perodsacki, разница огромна... начиная с отсутствия у gemini целой кучи функций, доступных у gpt (что называется) "из коробки" и заканчивая совершенно разным характером содержимого результатов анализа текстов. Имхо - единственное, чем gemini "выигрывает" - это (неожиданно) скорость ответов... но не их точность. А, да! Глючит gemini ГОРААААЗДО сильнее чем gpt.
                • Ultraviolet75
                  Aliari Perodsacki,
                  "Разницу с ChatGPT обыватель не заметит!" - заметит если попросит нарисовать немецкого солдата! )))))))))
                • ЗлойБобр
                  Зачем в России? У нас ж своя Алиса есть, Маруся, или что-то типо того. А это всё для них, для «наивысших».
                  • dimixxvv
                    ЗлойБобр,
                    Учи матчасть!
                    • Kireels
                      dimixxvv,
                      проблема в прокладке между сиденьем и рулем
                      от слова совсем
                      имхо

                      какие еще дурацкие фразочки бы вспомнить ))
                    • 451859443
                      ЗлойБобр,
                      куда чтоб отправить данные нужна привязка к документам, а если данные будут неверны - проверять их отправителя приедет весь омон района?
                      • PIKreal
                        451859443,
                        А если ещё и спросить что-то, что не понравится, то и вовсе....
                    • fantiк
                      Что за шум вокруг пустышки?
                      • dezmen3
                        Хз, месяц использую модель Ultra. Ни о чем. Если выбирать для работы что-то то или GPT-4 или Claude 3 Opus, последний впечатлил по коду
                        • Atris
                          dezmen3,
                          в моих задачах справляется получше, чем GPT-4. Например создать быстренько форму авторизации по описанию на material ui, а затем обработать её на next.js - за секунды.
                          • dezmen3
                            Atris,
                            по кодингу - только Claude 3 Opus, уделывает обе ИИ.
                        • LockMyClock
                          Не помогают твои сингапурские и американские айпи...
                        • Захожу с американского IP, ввожу гуглоаккаунт - и снова на Дерибасовской!
                          • SV_13,
                            А на Брайтон-бич опять идут дожди😉🤣
                          • lawgun
                            Узконаправленные модели с общим доступом все ещё лучше, но как в плане прикладного ума ничего лучше базовой 4ки нет.

                            Автопроизводитель SAIC GM представил Chevrolet Equinox Plus — гибридный кроссовер с огромным запасом хода и крайне экономичным расходом топлива. Дебют автомобиля состоялся в рамках Пекинского автосалона, а его продажи начнутся в Китае.

                             

                            Калифорнийский стартап Infinity Power заявил об успешном создании ядерной батареи, использующей электрохимическое преобразование энергии. Разработка выполнена в форм-факторе «таблетки», гарантирующем безопасное использование.

                             
                            <div></div><div></div><a href='/2024/06/23/7307307/' target='_blank'><img src='https://i.4pda.ws/s/as6ywue3S4wsjFGg0z2I2iyY7kHEE0EmiXkPLY783uK3Miqm98HafRECC.jpg' title='' /></a><div ><img src='https://4pda.to/s/as6yu42hlyXjD7kQLqbvVMOGid.gif' /></div><div></div><div></div><div></div>

                            Надёжный инсайдер Роланд Квандт рассказал о ещё одном кнопочном телефоне, который выйдет под брендом Nokia. Он опубликовал подробные характеристики и серию качественных рендеров Nokia 3210 (2024) незадолго до премьеры новой «звонилки».

                             

                            На Reddit развернулось активное обсуждение крайне странной работы нейросети Stable Diffusion 3 Medium после очередного апдейта. Пользователи размещают в сети изображения, созданные ИИ — почти все люди на них показаны с ужасающими «мутациями». Виной всему, как утверждают завсегдатаи интернета, — жёсткая цензура контента для взрослых.

                             

                            Как и предполагалось, Евразийская экономическая комиссия всё же не стала продлевать решение по увеличению порога беспошлинного ввоза посылок с 1 апреля 2024 года. Об этом официально сообщили в Федеральной таможенной службе РФ.

                             

                            Компания MSI представила бюджетную материнскую плату PRO A620M-C EX с процессорным разъёмом AM5. Её главная особенность — сочетание старых и новых технологий. Например, она поддерживает память DDR5-7800 и одновременно оснащена портами D-Sub и RS-232.

                             

                            Компания Anker пополнила ассортимент аудиотехники, выпустив новую портативную Bluetooth-колонку Soundcore Boom 2 Plus. Она создана для использования на открытом воздухе, поэтому обладает водозащитой по стандарту IPX7, мощным звуком и удобным корпусом с ручкой для переноски.

                             

                            Люди стали реже менять смартфоны — это подтверждает статистика в разных странах мира, в том числе и в России. На это влияет множество факторов: минимальное различие между поколениями, повышение цен и увеличение срока поддержки даже для моделей среднего и начального уровней. А раз всё хорошо работает и получает обновление, то зачем что-то менять? Но есть и пользователи, которые меняют смартфоны каждый год или даже чаще. Зачастую это те, кто хочет постоянно пользоваться самыми передовыми технологиями или продавать старый аппарат по максимальной цене. А какой подход практикуете вы? Расскажите, сколько лет вашему нынешнему смартфону и когда вы планируете его обновлять?

                             

                            Издание Escape from Tarkov за 11 тысяч рублей стало поводом для драмы в социальных сетях — и перчинки ситуации добавило слитое интервью с главой Battlestate Games Никитой Буяновым.

                             

                            Google не стала дожидаться конференции I/O 2024, объявив о выпуске нового смартфона Pixel 8a сразу после презентации новых iPad. Аппарат многое унаследовал от старших моделей серии и получил целый ряд значительных улучшений в сравнении с предшественником.

                             

                            В рамках специальной презентации компания «Яндекс» анонсировала большое обновление виртуального помощника «Алиса» нового поколения на основе нейросети YandexGPT. Разработчики утверждают, что «Алиса» теперь умеет предлагать идеи и удерживать контекст беседы, а для решения творческих задач была добавлена опция «Про».

                             
                            Разработчики Banana: «Наша игра не скам, а чит-код на деньги в реальной жизни» Популярное

                            Двадцать лет назад будущее игровой индустрии представлялось не таким, но в 2024 году одним из самых популярных релизов Steam за всю историю стала игра про банан. Разработчики уверяют: их проект не скам, а буквально чит-код на деньги.

                             

                            Новинку среднего класса от Sony протестировали зарубежные СМИ. В этой модели компания сохранила вытянутый дисплей, миниатюрный корпус и другие фирменные особенности. Стоит ли гаджет внимания массового потребителя? Приводим результаты тестирования и отзывы прессы.

                             

                            ФГУП «ГРЧЦ» (дочерняя структура Роскомнадзора) опубликовало утилиту для измерения скорости интернета под названием «ПроСеть». Пресс-служба регулятора рассказала СМИ первые подробности о новом мобильном приложении и уточнила, чем оно отличается от популярного иностранного аналога.

                             

                            Эксперты DxOMark протестировали основную камеру флагманского смартфона Honor Magic6 Pro. Новинка не только установила три рекорда лаборатории, но и стала лидером глобального рейтинга. В DxOMark рассказали, за какие качества смартфон занял первое место.

                             
                            В России стартовали продажи пяти новых долгоиграющих телефонов Xenium Популярное

                            Компания «Сангфей» представила в России новую линейку телефонов под брендом Xenium. Они отличаются простотой использования, надёжностью и продолжительным временем автономной работы за счёт фирменной энергосберегающей технологии.

                             
                            Больше не Eternal. DOOM: The Dark Ages вернётся к олдскульной традиции Популярное

                            В конце прошлой недели id Software явила миру DOOM: The Dark Ages — приквел DOOM (2016) и DOOM Eternal. Фанаты восторженно приняли анонс и принялись гадать, каким образом разработчики превзойдут экшен-механики Eternal. Автор проекта решил объяснить своё видение.

                             

                            Компания объявила о выпуске «премиальной» версии фирменного браузера, распространяемой по модели платной подписки. Она ориентирована на корпоративное использование, и отличается от базовой сборки с приставкой Enterprise расширенным набором функций. В блоге Google появилось подробное описание приложения и данные о новом тарифе.

                             

                            Более 200 экземпляров Apple Watch были найдены в озере Иллинойса одним из дайверов. С помощью металлоискателя Дарик Лангос нашёл целые залежи умных часов во время заплывов в районе Чейн О'Лейкс на северо-востоке штата. Многие из них всё ещё функционируют.

                             
                            Приложение «Сбербанк Онлайн» снова доступно в App Store. Успей скачать Популярное

                            Мобильное приложение «Сбербанк Онлайн» стало доступно в магазине приложений App Store. На этот раз оно получило название «Умный онлайн», и доступно для скачивания на iPhone — как минимум в течение какого-то времени.

                             
                            CMF Phone (1) станет самым необычным смартфоном последних лет [ВИДЕО] Популярное

                            Основанный компанией Nothing бренд CMF активно готовится к выпуску своего первого смартфона. Сегодня он опубликовал небольшой видеотизер. Ролик однозначно даёт понять, что нас ждёт что-то совершенно нестандартное и не похожее на другие смартфоны.

                             

                            Техноблогер Мишаал Рахман обнаружил в свежей бета-версии Android 15 новую полезную функцию, связанную с работой системного интерфейса. Она должна расширить возможности тёмного режима, «починив» проблемные приложения, которые до сих пор его не поддерживают.

                             

                            Как оказалось, преждевременной кончине сериала «Ведьмак» рады не только рядовые поклонники вселенной, но и сами актёры. За всех говорить сложно, но Фрейя Аллан, исполняющая роль Цири, публично призналась в этом.

                             

                            Сериал по мотивам Fallout можно назвать безоговорочно успешным — он не просто «пришёл и ушёл», о нём говорят, его тщательно исследуют в поисках намёков на оригинальные игры и различных «пасхалок» от съёмочной группы. На днях, к примеру, фанаты заметили на вид рабочий номер телефона и решили его проверить.

                             

                            Канадская компания Sandvine поделилась статистикой веб-трафика, которая показывает его распределение по  объёму. Как оказалось, протокол BitTorrent переживает не лучшие времена — его изрядно потеснили сразу несколько популярных онлайн-площадок.

                             

                            С момента выхода «Смуты» прошло два месяца. Релиз для разработчиков выдался непростым, и с тех пор они выпустили для игры несколько патчей. И вот в сети обратили внимание на любопытное событие: именитые российские инфлюенсеры начали одновременно нахваливать игру.

                             

                            Компания Lenovo выпустила планшет Xiaoxin Pad Studio (2024). Новинка позиционируется как гаджет для развлечений: она поддерживает стилус, оборудована мощной акустикой с настройкой JBL и экраном с повышенной частотой обновления. При этом цена устройства сопоставима с бюджетным смартфоном.

                             

                            Как сообщает издание «Коммерсантъ», крупные ритейлеры обратились к Минпромторгу и Генпрокуратуре с просьбой обратить внимание на новую мошенническую схему, в рамках которой покупатели преднамеренно портят технику, а затем получают компенсации через обращение в суд. Утверждается, что речь идёт о сотнях подобных дел, в рамках которых от крупных ритейлеров только за 2023 год было потребовано свыше 1 миллиарда долларов.