Тестируем Gemini 1.5 Pro — гордость Google

Google открыла доступ к бета-версии языковой модели Gemini 1.5 Pro. Это лучшая из нейросетей компании, способная работать с большими массивами текста, кода и визуальных данных. Мы опробовали возможности ИИ и делимся результатами.

Gemini 1.5 Pro

Значительный прорыв

Объём информации, который Gemini 1.5 Pro может принять на вход, составляет 1 млн токенов. Это эквивалентно 700 000 слов или свыше 30 тысяч строчек кода. Для сравнения, у передового аналога GPT-4 контекст в 8,2 раза меньше — 128 тысяч. Модель поискового гиганта также умеет распознавать картинки и считывать содержимое роликов длительностью до 1 часа, правда без аудиодорожки. Есть функция анализа нескольких файлов за раз — достаточно предоставить доступ к папке на «Google Диске». Впечатляет и точность, с которой ИИ извлекает сведения — в 99% случаев Gemini 1.5 Pro правильно указывает отдельные факты из длинных текстов. То есть нейронка не находит нужный фрагмент лишь в трёх из 1125 запросов.

Для теста мы загрузили первые два тома романа Льва Толстого «Война и мир». Они заняли 445 224 токена. На создание краткого содержания всех глав модели понадобилось 310 cекунд. Следовательно, за секунду обрабатываются 739 слов. Ещё на анализ предоставили 30-секундное видео с субтитрами. У Gemini не возникло проблем с тем, чтобы правильно пересказать сюжет и посыл ролика. В качестве изображения отправили простой визуальный ребус — от ИИ требовалось сказать, что произойдёт, когда перчатка упадёт на рычаг. Искусственный интеллект ответил корректно. Это говорит не только о способности видеть объекты, но и моделировать будущее по входным данным.

1 / 3
Миллионный контекст и распознавание видео. Тестируем Gemini 1.5 Pro
Миллионный контекст и распознавание видео. Тестируем Gemini 1.5 Pro
Миллионный контекст и распознавание видео. Тестируем Gemini 1.5 Pro

Как опробовать Gemini 1.5 Pro в РФ?

Модель доступна бесплатно на сайте Google AI Studio, который официально представлен в ряде стран. Оптимально подходят американский либо сингапурский IP-aдреса. С ними достаточно войти в свой Google-аккаунт и выбрать необходимую версию Gemini. Сейчас предоставляются 20 запросов в день. Русский и другие языки поддерживаются, но быстрее и качественнее ответы генерируются на английском.

  • Aliari Perodsacki
    Разницу с ChatGPT обыватель не заметит!
    • dragon1020
      Aliari Perodsacki,
      да, такой же хлам. Придумывает факты, не может решить хоть сколько-то сложную задачу (к примеру вычислить длину намотанной на бобину ленты, если известна ее толщина, диаметр бобины, и общий диаметр рулона.
      • stiimen
        я эти чат-боты всегда одним запросом тестирую: "составь список смартфонов с диагональю от 4" до 5,5" и все чат-боты одинаково тупят, добавляют и меньше 4" и больше 5,5", и всегда почему-то в списке отсутствуют айфоны мини, хотя более ранние айфоны присутствуют, гемини тоже не справился, вот когда справятся, думаю, тогда прогресс и будет очевиден
        • AdeptMasterAgusha
          stiimen,
          gemini advanced составил список из Apple iPhone SE (2020 & 2022), iPhone 12 mini & 13 mini, Sony Xperia XZ2 Compact (запрос делал на англ)
          • stiimen
            AdeptMasterAgusha,
            это весь список? просто устройств куда больше, включая японский sharp aquos r2 compact, китайский xiaomi qin 3 ultra и другие
            • edmschick
              stiimen,
              так этот список огромен, нахрена все модели писать, если телефонов с такой диагональю куда больше, чем парочка штук?
              • stiimen
                edmschick,
                да не такой уж и огромный, 10-15 максимум, да и хоть 500 пусть будет, разве бот не должен конкретно на запрос полноценно ответить, а раз отвечает некорректно, значит проблемы с пониманием простого запроса, а если список неполный, значит некорректная работа с базой знаний, или сама база попросту неполная, хотя когда вторым запросом пишешь "а как же айфоны мини 12 и 13", бот отвечает типа "да, вы правы, вот обновлённый список" или "почему ты добавил смартфон 5,8", ведь он больше чем 5,5", отвечает "вы правы, убираю из списка" и там уже добавлены и убраны лишние, значит знание об этих смартфонах есть, но почему сразу с первого запроса не добавляет, непонятно

                (отредактирован)

                • Levsha_2011
                  edmschick,
                  Г - логика, бот перетрудится, если выдаст весь список. Нахрена писать всё? Для того, чтобы при использовании в реальной работе, н-р, статификация, он выдал всю требуемую информацию, а не что захотел. Если он сделал запрос от вашей логики, то это не ИИ, а з.....а.
            • водочник
              stiimen,
              что так сложно то,я проще: вспомнил кино москва -кассиопея-отроки вовселенной : а и б сидели на трубе,а упало б пропало,чтоосталось на трубе и почему антошка не копает картошку 😁
              • Termich
                stiimen, ну ты видимо колода опус не юзал)
              • @Knox0x1
                dragon1020,
                Gemini решил
                • dragon1020
                  @Knox0x1,
                  решил. Только неправильно. :D Мне его три раза пришлось поправлять, чтобы он верно посчитал. Первое решение вообще "гениально" - он просто посчитал, сколько слоев у намотки, и умножил длину окружности первого слоя на количество слоев. :D
                  • dragon1020,
                    В справочнике Детлафа и Фаворского есть готовая формула ,и даже таблицы, как мне помнится.
                    • Kireels
                      N.Nik,
                      надо будет на туалетной бумаге проверить
              • Illiryel
                Aliari Perodsacki, разница огромна... начиная с отсутствия у gemini целой кучи функций, доступных у gpt (что называется) "из коробки" и заканчивая совершенно разным характером содержимого результатов анализа текстов. Имхо - единственное, чем gemini "выигрывает" - это (неожиданно) скорость ответов... но не их точность. А, да! Глючит gemini ГОРААААЗДО сильнее чем gpt.
                • Ultraviolet75
                  Aliari Perodsacki,
                  "Разницу с ChatGPT обыватель не заметит!" - заметит если попросит нарисовать немецкого солдата! )))))))))
                • ЗлойБобр
                  Зачем в России? У нас ж своя Алиса есть, Маруся, или что-то типо того. А это всё для них, для «наивысших».
                  • dimixxvv
                    ЗлойБобр,
                    Учи матчасть!
                    • Kireels
                      dimixxvv,
                      проблема в прокладке между сиденьем и рулем
                      от слова совсем
                      имхо

                      какие еще дурацкие фразочки бы вспомнить ))
                    • 451859443
                      ЗлойБобр,
                      куда чтоб отправить данные нужна привязка к документам, а если данные будут неверны - проверять их отправителя приедет весь омон района?
                      • PIKreal
                        451859443,
                        А если ещё и спросить что-то, что не понравится, то и вовсе....
                    • fantiк
                      Что за шум вокруг пустышки?
                      • dezmen3
                        Хз, месяц использую модель Ultra. Ни о чем. Если выбирать для работы что-то то или GPT-4 или Claude 3 Opus, последний впечатлил по коду
                        • Atris
                          dezmen3,
                          в моих задачах справляется получше, чем GPT-4. Например создать быстренько форму авторизации по описанию на material ui, а затем обработать её на next.js - за секунды.
                          • dezmen3
                            Atris,
                            по кодингу - только Claude 3 Opus, уделывает обе ИИ.
                        • LockMyClock
                          Не помогают твои сингапурские и американские айпи...
                        • Захожу с американского IP, ввожу гуглоаккаунт - и снова на Дерибасовской!
                          • SV_13,
                            А на Брайтон-бич опять идут дожди😉🤣
                          • lawgun
                            Узконаправленные модели с общим доступом все ещё лучше, но как в плане прикладного ума ничего лучше базовой 4ки нет.
                            <div></div><a href='/2024/06/13/7307307/' target='_blank'><img src='https://i.4pda.ws/s/as6ywue3S4wsjFGg0z2I2iyY7kHEE0EmiXkPLY783uK3Miqm98HafRECC.jpg' title='' /></a><div ><img src='https://4pda.to/s/as6yu42hlyXjD7kQLqbvVMOGid.gif' /></div><div></div>

                            Накануне Microsoft отказалась от поддержки эмулятора Android для Windows 11, не объясняя причин такого решения. Один из сотрудников компании решил это исправить, и опубликовал в X пост, частично проливающий свет на «похороны» этой функции ОС.

                             

                            Правительство утвердило полосу радиочастот 4400–4990 МГц для развития 5G. Это не самый популярный диапазон: почти во всём мире для 5G используют 3400–3800 МГц. Вот почему заметная часть смартфонов не сможет работать в российских сетях пятого поколения.

                             

                            Рис — это основа питания 60–70% населения Земли. Главный недостаток этой культуры заключается в том, что в ней мало витамина B1. Это нарушает обмен веществ и может стать причиной почечной недостаточности. Чтобы решить эту проблему, биологи попытались разработать рис с повышенным содержанием B1. И, судя по первому урожаю, это сработало.

                             

                            В сети появились рендеры ещё не представленного автомобиля Lada Iskra, которые были найдены в базе патентов Федерального института промышленной собственности. Судя по изображениям, новинка во многом будет похожа на Lada Vesta.

                             

                            Компания снова расширила список фирменных устройств, для которых официально прекратилась программная поддержка. На этот раз «под раздачу» попали по два устройства брендов Xiaomi и POCO, представленных три года назад.

                             

                            Сотрудники университета Киото продолжают работать над первым в мире лекарством для выращивания зубов. Средство уже успешно протестировали на животных, а теперь исследователи активно готовятся к началу его клинических испытаний, которые стартуют в сентябре текущего года.

                             

                            Разработчики «Яндекс Карт» и «Навигатора» обновили фирменные сервисы компании — теперь в приложении лучше видна траектория маршрута, а новые подсказки помогут водителям перестроиться, чтобы подготовиться к нужному повороту.

                             

                            Компания объявила о выпуске «премиальной» версии фирменного браузера, распространяемой по модели платной подписки. Она ориентирована на корпоративное использование, и отличается от базовой сборки с приставкой Enterprise расширенным набором функций. В блоге Google появилось подробное описание приложения и данные о новом тарифе.

                             

                            Нидерландская компания Yandex N.V. объявила о продаже бизнеса «Яндекса» консорциуму частных инвесторов. Представители компании рассказали об ожидаемых следствиях реструктуризации и сообщили, кто станет её новым владельцем.

                             

                            Эксперты DxOMark протестировали основную камеру флагманского смартфона Honor Magic6 Pro. Новинка не только установила три рекорда лаборатории, но и стала лидером глобального рейтинга. В DxOMark рассказали, за какие качества смартфон занял первое место.

                             
                            Вышло крупное обновление Telegram. Что нового в мессенджере? Популярное

                            Очередной апдейт Telegram добавил в приложение несколько новых функций, призванных разнообразить онлайн-общение. В мессенджере появились сообщения со спецэффектами, подписи над медиафайлами, быстрые действия с номерами телефонов, поиск по хештегам, сворачиваемые цитаты и красочные звонки на macOS. Разработчики показали, как это выглядит.

                             
                            5 главных функций Android 15 Популярное

                            Google продолжает бета-тестирование ОС Android 15. Грядущий апдейт не привнесёт кардинальных изменений или редизайна, но приятные улучшения всё же появятся. Рассказываем о ключевых фишках системы, обнаруженных в актуальной сборке Beta 2.1.

                             

                            Подводя итоги февраля, разработчики бенчмарка AnTuTu составили рейтинг самых производительных Android-смартфонов среднего уровня. И если зачастую разница между моделями достаточно условная, то в этот раз есть однозначный лидер, сильно опережающий всех других.

                             

                            Компания Natron Energy запатентовала технологию работы аккумуляторов, основанных на электронах и пригодных для быстрой и частой передачи ионов натрия. Новый метод позволит десятикратно увеличить скорости работы аккумуляторов и повысить их ресурс до 50 000 циклов.

                             

                            Благодаря успеху сериала от Amazon и Джонатана Нолана, Fallout нынче постоянно на слуху. Первый сезон шоу все уже обсудили вдоль и поперёк, и теперь фанаты переключились на другие животрепещущие вопросы.

                             
                            Лучшие смартфоны апреля: флагманы HUAWEI и Motorola, хитовый Redmi и долгоиграющий TECNO
                            26
                            24.04.24News

                            Хотя в апреле не проводили крупных выставок и конференций, в интересных новинках недостатка не было. HUAWEI уже традиционно выпустила без анонсов новую флагманскую линейку, а Motorola решила отдать дань памяти старым моделям Moto X. Ещё вышли мощные, но недорогие аппараты от realme и Redmi. Рассказываем подробнее об этих и других устройствах, вышедших в минувшем месяце.

                             
                            Adobe заявила права на весь контент своих пользователей Популярное

                            В сети разгораются споры о новом лицензионном соглашении Adobe: согласно ему, весь контент художников в Photoshop, 3D-моделлеров в Substance 3D и других профессионалов обретает второго хозяина в виде Adobe.

                             
                            Новый POCO F6 Pro с Flow AMOLED-экраном и 120-Вт зарядкой распродают по сниженной цене Популярное

                            Спустя неделю с момента анонса смартфон POCO F6 Pro уже можно приобрести с хорошей скидкой. Новинка получила флагманский чип Snapdragon 8 Gen 2, экран с пиковой яркостью в 4000 нит, а также тройную основную камеру с 50-мегапиксельным датчиком Light Fusion 800.

                             

                            С 4 по 10 апреля во время весенней распродажи на AliExpress POCO снижает цену на популярнейший M6 Pro. Напомним, что смартфон получил быстрый Flow AMOLED-экран, большой объём памяти и хорошие фотовозможности в виде тройной камеры с основным 64-мегапиксельным датчиком и поддержкой OIS.

                             

                            Сериал по мотивам Fallout можно назвать безоговорочно успешным — он не просто «пришёл и ушёл», о нём говорят, его тщательно исследуют в поисках намёков на оригинальные игры и различных «пасхалок» от съёмочной группы. На днях, к примеру, фанаты заметили на вид рабочий номер телефона и решили его проверить.

                             

                            Компания Hysata намерена «подарить» миру самый дешёвый в мире водород, что стало возможным благодаря новой установке для расщепления воды на H2 и O2 с эффективностью в 95%. Это на 20% выше в сравнении с традиционными установками, использующими электролиз.

                             

                            Техноблогер Эрик Паркер опубликовал любопытный видеоролик: он демонстрирует, насколько Windows XP отстала от времени в контексте защиты от вредоносных программ. Как оказалось, достаточно просто подключить компьютер к интернету — и уже через несколько минут состояние системы станет весьма печальным.

                             
                            Baseus PB Blade 2: чемпион пауэрбанков Популярное
                            65
                            31.05.24News

                            Baseus PB Blade 2 способен зарядить всё, начиная от наушников и заканчивая ноутбуком. При этом он предлагает ряд решений, которые выводят его на уровень носимых гаджетов. Рассказываем, как им управлять, где хранить и что он умеет.

                             

                            Компания ZTE выпустила недорогой смартфон Changxing 60 с интересным набором характеристик. Новинка поставляется с Android-интерфейсом под кнопочную звонилку, оснащается неплохим для своей цены объёмом памяти и современным разъёмом USB Type-C, а также поддерживает сети 5G.

                             

                            Сотрудники Калифорнийского университета в Ирвине поделились результатами исследования, согласно которому основная часть выбрасываемых во время торможения частиц способна нести электрический заряд и последующий вред для здоровья людей. Эта работа может помочь в борьбе по сдерживанию источников загрязнения в крупных городах.

                             

                            Сотрудники Гарварда и Google Research провели глубокое исследование человеческого мозга, изучив тысячи клеток и миллионы синапсов в образце мозговой ткани размером с маковое зерно. Открытие позволило учёным получить потрясающие изображения внутреннего устройства мозга.