Gemini Ultra от Google. Конкурент GPT-4 или пшик?

Google представила Gemini Advanced — улучшенную версию чат-бота на базе собственной ИИ-модели Ultra 1.0. Итану Моллику, профессору Пенсильванского университета и автору блога One Useful Thing, удалось протестировать сервис и сравнить его с GPT-4.

Gemini Ultra

Личности

Gemini формулирует ответы в более дружелюбной манере и стремится быть полезным: например, завершает объяснение концепций фразой в духе «Всё ли вам понятно?» GPT-4 выдаёт более сухие и строгие тексты.

 

При этом обе системы полны искусственных ограничений. Разработчики запретили нейросетям реагировать на крамольные вопросы. Но лимиты работают неодинаково: GPT-4 спокойно объясняет, как устроено ядерное оружие через дискографию Тейлор Свифт, а Gemini выдаёт целую тираду, почему такой вопрос неприличен и вреден.

Gemini Ultra

Сложные задачи

Моллик сравнил GPT-4 и Gemini Advanced в нескольких задачах, которые обычно вызывают трудности у моделей подобного рода. Один из вопросов — просьба придумать дизайн кроссовок на основе последних трендов. Обе нейросети справились с задачами, но по-разному. Gemini сгенерировал более реалистичное изображение, но оно местами противоречит тексту. Зато GPT-4 придумал более смелый концепт.

Ещё одна хитрая задачка — придумать 10 предложений, которые оканчиваются на слово «яблоко». Нюанс в том, что большие языковые модели воспринимают текст не целиком, а по фрагментам слов (токенам). GPT-4 успешно справился с тестом, чего не скажешь о Gemini.

1 / 2

Интеграции

OpenAI предлагает систему плагинов и возможность создать кастомизированную версию чат-бота под конкретную задачу. Но всё это функционирует в ограниченном режиме.

Gemini же специально обучался для роли личного помощника: нейросеть Google способна прошерстить список входящих имейлов в Gmail, выбрать самые важные и подготовить черновики ответов на каждое. Но всё неидеально: иногда Gemini может «галлюционировать», то есть придумать какой-то фрагмент письма или подсказать несуществующий адрес в Google Maps.

Выводы

По итогам месячного тестирования Моллик заключил, что Gemini Advanced сопоставим с GPT-4, хотя и не превосходит его. Продукт Google лучше объясняет термины и анализирует изображения; разработка OpenAI обгоняет конкурента в программировании и сложных лингвистических задачах.

  • dezmen3
    Если сравнивать в реальных задачах - вообще не конкурент. Использую Gemini Ultra, он тупой как пробка если сравнивать с GPT-4. Абсолютно порой не понимает контекста, не запоминает просьбы, будто языковая модель с альцгеймером.

    (отредактирован)

    • Аcтaрoт
      Баловался одно время gpt-чатом, в основном для подбора книг, выбесило что бот часто выдумывает авторов книг и их названия. Так что ну их эти ваши gpt))
      • Аcтaрoт,
        хахаха, была ситуация и я хотел вспомнить фильм по описанию, ответ был:
        - мне кажется вы описываете фильм "Холодное Танго" 1997 года, русского режиссера Рамзеса Буранова,
        я говорю назови топ картин Рамзеса Буранова:
        - на момент завершения моего обучения в январе 2022 года у меня нет точной информации о режиссере по имени Рамзес Буранов

        мне кажется что Рамзес Буранов отличный псевдоним
        • Аcтaрoт
          cdtj,
          Один момент он мне втирал о проекте Ледокол, якобы проектируется судно на котором будет размещен центробанк для проведения транзакций в водах Арктики. В какой-то момент его клинануло, он перестал отвечать и дальше сделал вид, что не понимает о чем речь и никогда о нем не слышал.
          Единственный плюс он все же умеет из реальных книг выдерать нужную инфу, но опять же в жатом виде и общими фразами.
      • 1466726
        Мне нужно купить подписку, но два сервиса оплачивать Gemini и ChatGPT — это слишком жирно. Ваше мнение, что выбрать?
        • dezmen3
          1466726,
          GPT4 однозначно
          • 1466726
            dezmen3,
            Зато Google за те же деньги даёт 2Tb на Google Drive, но зато у GPT есть магазин с плагинами. Я тестирую уже несколько недель. Я до сих пор не определился
            • dezmen3
              1466726,
              Та я беру, чтобы использовать языковую модель ) Зачем мне глупая модель и каких-то 2тб в облаке?
              • 1466726
                dezmen3,
                Я бы не сказал, что Gemini глупая
                • dezmen3
                  1466726,
                  В сравнении - глупая. Если не сравнивать, пойдет
                  • akkermanrulit
                    dezmen3,
                    Ну не знаю. Надо было выборку недавно посчитать, так шо копилот, шо чатгпт (правда 3й) какую-то шляпу в расчетах выдавали постоянно - либо неправильно считали, либо цифры от балды брали, либо каждый раз какую-то формулу придумывали и игнорировали вводные данные. а гемини сразу нормально посчитал.
        • urdukhanoff
          Не запустилась на OnePlus 8t и pixel 5
          • spellmaster2006
            Да все это не ИИ, а чухня алкоРитмовая
            • FoxVol
              ChatGPT не все предложения закончил словом "apple", 8-ое из 10 забраковано. Это разве успешно?
              • >> Gemini формулирует ответы в более дружелюбной манере и стремится быть полезным
                ненавижу эту фигню, когда ты высказываешь свои предположения и модель с ними соглашается, хотя они изначально неправильные, просто чтобы тебя не обидеть,

                нарпимер:
                - я знаком с Х и хочу использовать её в Y, как думаешь это сработает?
                - да, будет круто!
                - окай, дай мне пример имплементации
                - // выдает эротическую фантазию //
                - это не выглядит как нечто рабочее
                - тогда поробуй другую // эротическая фатназия //
                - окей, я решил проверить и это точно не работает
                - извино, оно не может работать потому что Х не умеет в Y
                • vahrom2802
                  Объясните кто-нибудь реду значение слова "пшик"

                  (отредактирован)

                  • Ultraviolet75
                    пшик, ибо гугловский с рекламой а гпт4 без
                    • Ultraviolet75
                      а Copilot забыли? мне он нравится больше.
                      • Copilot топ тем более бесплатно
                        • PavelEZ
                          sweee,
                          он на основе GPT4
                        • eklektikos
                          Платные версии не знаю, но базовый бесплатный Gemini имеет доступ к интернету, в отличие от GPT3.5, что позволяет использовать его там, где GPT бессилен
                          • Chuk2004
                            Опять гугл херню выдал по неймингу. Они специально запутывают? Чем отличаются Bard, Gemini, Gemini Ultra и Gemini Advanced? Openai всё чётко называют - ИИ модели gpt-x и сайт для общения с ней chatGPT

                            (отредактирован)

                            Недавно Sony запретила активацию своих релизов в онлайн-магазине Steam для аккаунтов из РФ и Беларуси. Но оказалось, что игры успешно активируются в виде подарков от профиля из другой страны. К тому же можно сменить регион аккаунта. Рассказываем, как это сделать.

                             

                            Каталог гаджетов Xiaomi пополнила электронная книга с сенсорным экраном и Wi-Fi. Вдобавок она может похвастаться возможностью подключения чехла со встроенной АКБ, которая увеличивает продолжительность чтения более чем в два раза.

                             
                            <div></div><a href='/2024/03/03/1963973/' target='_blank'><img src='https://4pda.to/s/as6ywue3S4wsjFGg0z2I2iyY7kHEE0EmiXkPLY783uK3Miqm98HafRECC.jpg' title='' /></a><div ><img src='https://4pda.to/s/as6yu42hlyXjD7kQLqbvVMOGid.gif' /></div><div></div><div></div><div></div>

                            По данным «Коммерсанта», ссылающегося на представителей маркетплейсов и ритейлеров, в России растут продажи накопителей и модулей оперативной памяти. Эксперты объясняют это желанием покупателей модернизировать ноутбуки исходя из собственных потребностей.

                             

                            HUAWEI уже выпустила новую прошивку HarmonyOS 4 для огромного числа смартфонов и планшетов, а теперь пришла очередь и смарт-часов. Компания объявила о начале тестирования бета-версии сразу для 9 моделей, вышедших в прошлом году. 

                             

                            Распродажа 11.11 — хороший повод присмотреть себе новый смартфон с продвинутыми характеристиками. Например, Xiaomi 13T с «заряженной» камерой, производительным процессором и мощной 67-ваттной зарядкой до 17 ноября можно приобрести по специальной цене.

                             

                            После новости о появлении на iOS в Европе сторонних магазинов и возможности загрузки приложений вне App Store многие явно задумались о создании европейского аккаунта. Но похоже, что Apple предусмотрела этот момент и ввела ряд ограничений на этот случай. 

                             

                            Вышедшая ещё в 2016 году утилита для кастомизации пользовательского интерфейса Good Lock от Samsung наконец-то стала официально доступна в российском каталоге фирменного магазина приложений Galaxy Store, так что больше не нужно искать обходные пути её установки. Теперь владельцам смартфонов Galaxy будет ещё проще настроить их под себя.

                             

                            Современный планшет на Android — это удобный и доступный помощник на каждый день. Бренд Teclast предлагает специальную цену сразу на две модели: T60 с большим дисплеем и четырьмя динамиками, а также T45HD с поддержкой двух SIM-карт и продвинутой фронталкой с функцией разблокировки по лицу.

                             

                            На выставке MWC 2024 компания представила обновлённый список фирменных устройств, которые в ближайшее время перейдут на стабильную версию прошивки HyperOS. В перечень вошли гаджеты брендов Xiaomi и Redmi, включая планшеты и умные часы.

                             

                            По данным операторов и аналитиков, российские абоненты всё чаще подключают комплексные пакеты услуг от одного провайдера. Такие предложения по сниженной цене могут одновременно включать звонки, домашний интернет, ТВ и не только. Сейчас их приобретают более 30% клиентов, тогда как полгода назад доля таких пользователей составляла около 20%. Выясняем, насколько это выгодно для потребителей и компаний.

                             

                            Держатели цифровых платформ по продаже видеоигр любят умасливать геймеров различными подарками. Ubisoft, например, регулярно дарит своей аудитории старые хиты из собственного послужного списка. На сей раз игроков решили задобрить поездкой в Лондон XIX века.

                             
                            Samsung рассказала о Galaxy Ring: все функции, предназначение и сроки выхода Популярное

                            На выставке MWC 2024 компания Samsung обнародовала первые подробности о фирменном умном кольце Galaxy Ring. Производитель рассказал о возможностях гаджета, его работе с другими устройствами семейства Galaxy и предполагаемых сроках выхода. 

                             

                            Аналитики медиакомпании Visual Capitalist составили список из 15 бестселлеров мобильного рынка за всю его многолетнюю историю. Рейтинг оказался любопытным: его практически поровну поделили всего два бренда, из которых на плаву к 2024 году остался только один.

                             
                            Обновление Google TV сделает домашний экран телевизора «чище» Популярное

                            Компания Google анонсировала обновление интерфейса операционной системы Google TV, которое изменит дизайн домашнего экрана ОС. В сети уже появились первые скриншоты, демонстрирующие грядущие нововведения.

                             

                            По случаю 20-летия кнопочной раскладушки Samsung E700 компания выпустила специальную версию складного смартфона Z Flip5 с приставкой Retro. Аппарат выполнен в классической расцветке своего «прародителя», и получил несколько программных отличий от стандартной модели.

                             
                            Названы 10 самых мощных Android-смартфонов в мире по версии AnTuTu Популярное

                            Разработчики мобильного бенчмарка AnTuTu составили рейтинг самых мощных смартфонов по итогам минувшего месяца. Удивительно, но 5 из 10 мест заняли аппараты от одного производителя, а возглавляет рейтинг аппарат с чипом MediaTek.

                             

                            «Лаборатория Касперского» рассказала РБК о 15-кратном росте количества хакерских атак вида FakeBoss. С их помощью злоумышленники крадут деньги или ценные сведения у специалистов через Telegram, притворяясь их же работодателями.

                             
                            Samsung анонсировала «ИИ-прошивку» One UI 6.1 для прошлогодних смартфонов Популярное

                            Samsung обновила график развёртывания фирменной прошивки One UI 6.1 с набором ИИ-функций. Вслед за флагманами серии  Galaxy S24 пакет утилит Galaxy AI получат и выпущенные ранее устройства — компания рассказала, когда именно это произойдёт.

                             
                            «Скачать» Galaxy S24 Ultra теперь можно на любой Android-смартфон Популярное

                            В своё время Samsung выпустила веб-приложение Try Galaxy, которое имитирует прошивку One UI на iPhone, позволяя ознакомиться с её преимуществами. Теперь оно стало доступно и на платформе Android — компания рассказала, где его найти и как запустить.

                             

                            После обновления своих смартфонов до Android 14 пользователи начали замечать нехватку одной важной функции. Как оказалось, Google приняла решение убрать быстрый доступ к уведомлениям приложений, которой, как оказалось, многие активно пользовались.

                             

                            Стартап в области 3D-технологий VividQ поделился изображением голограммы с рекордным разрешением, обеспечивающим высокую реалистичность 3D-картинки. Свою разработку создатели планируют использовать в VR-гарнитурах, что, по их словам, обеспечит пользователям максимальный уровень погружения.

                             

                            В ответ на сообщения о ржавеющем покрытии Cybertruck главный инженер Tesla рассказал, как удалить следы коррозии с электропикапа. Проверить его советы на практике взялся автор YouTube-канала Bearded Tesla Guy — и поделился видеозаписью всего процесса со своими подписчиками.

                             

                            Миллиардер и бизнесмен Илон Маск практически каждый день появляется на страницах новостей. На сей раз владелец X (некогда Twitter) заявил, что когда-то он был «одним из лучших игроков в Quake». Как оказалось, это преувеличение. 

                             

                            До конца текущего года Samsung намерена выпустить One UI 6.0 ещё для трёх десятков фирменных смартфонов. В очереди за новой версией ОС стоят не только флагманские модели, но и представители среднего и бюджетного ценовых сегментов.

                             

                            Intel объявила о грядущем «апгрейде» процессоров Core 12-го и 13-го поколений, которые получат поддержку технологии APO. Она была эксклюзивом новых чипов на момент анонса, но после серии негативных отзывов в свой адрес компания всё же пошла геймерам навстречу.

                             

                            Авторы мобильного бенчмарка AnTuTu представили обновлённый рейтинг лучших смартфонов по соотношению цены и производительности. В некоторых ценовых категориях изменения достаточно серьёзные, что обусловлено выпуском новых моделей. 

                             

                            The Sims надёжно закрепилась в игровой индустрии в качестве единственного полноценного симулятора жизни. Но вот уже который год EA бездействует, а свято место пусто не бывает: геймеров поразил анонсирующий трейлер inZOI от издателя PUBG.

                             

                            Семейство смартфонов vivo пополнила среднебюджетная модель V30. Отличительными чертами новинки стали расширенные возможности мобильной съёмки на основную и фронтальную камеры, а также дисплей с приличным запасом яркости, свежий процессор Qualcomm и поддержка технологии быстрой зарядки высокой мощности.

                             

                            Компания Solos выпустила умные очки, которые могут переводить разговоры в режиме реального времени за счёт интегрированного чат-бота ChatGPT. Адаптированная речь воспроизводится на выбранном языке.

                             

                            Подводя итоги февраля, разработчики бенчмарка AnTuTu составили рейтинг самых производительных Android-смартфонов среднего уровня. И если зачастую разница между моделями достаточно условная, то в этот раз есть однозначный лидер, сильно опережающий всех других.

                             

                            Разработчики бенчмарка AnTuTu опубликовали список смартфонов и планшетов Apple, пользователи которых больше всего довольны их приобретением. Примечательно, что в рейтинге лидируют вовсе не свежие айфоны, а сравнительно старые гаджеты.

                             

                            В новых флагманах серии Galaxy S24 компания Samsung вновь вернулась к использованию фирменных процессоров —«сердцем» новинок стал Exynos 2400. Это 10-ядерный чип, выполненный по 4-нм техпроцессу, с графикой Xclipse 940 и архитектурой AMD RDNA 3.

                             

                            Среди хейтеров Genshin Impact наиболее часто звучит аргумент, касающийся «анимешной» стилистики игры. Видимо поэтому один геймер решил использовать нейросеть, чтобы создать более реалистичных героев.

                             

                            Швейцарский стартап I'm Back Film разработал оригинальный аксессуар для старых плёночных фотоаппаратов, позволяющий забыть о покупке классических расходников. Эта идея быстро нашла отклик у аудитории: нужная сумма была собрана всего за 17 минут, а сборы продолжают расти. Авторы проекта рассказали, как работает их изобретение.