Представлена нейросеть YandexGPT 3 Pro: умнее, точнее и быстрее прошлой версии

Представлена нейросеть YandexGPT 3 Pro: умнее, точнее и быстрее прошлой версии

Компания «Яндекс» представила третье поколение больших языковых моделей YandexGPT. Первой нейросетью этой линейки стала YandexGPT 3 Pro, уже доступная через Yandex Cloud. В сравнении с ИИ прошлого поколения она лучше работает со сложными запросами и точнее следует заданному формату ответов, что делает её полезной в решении реальных задач.

YandexGPT

Согласно официальному анонсу, YandexGPT 3 Pro эффективнее решает сложные задачи, лучше понимает контекст беседы и обрабатывает существенно больше запросов за единицу времени по сравнению с YandexGPT 2. Языковая модель способна выполнять инструкции с несколькими условиями, даёт более точные и полные ответы и допускает меньше стилистических ошибок.

YandexGPT 3 Pro можно встроить в продукты бизнеса через API. Кроме того, пользователи смогут дообучить новую нейросеть самостоятельно в сервисе ML-разработки Yandex DataSphere. По оценкам «Яндекса», она особенно хорошо проявляет себя в таких сферах, как клиентская поддержка, онлайн-продажи, цифровые коммуникации, маркетинг, реклама и управление персоналом. Также языковая модель лучше работает с документами: например, составляет договоры, счета, нормативную документацию, должностные инструкции и другое.

Качество работы YandexGPT 3 Pro оценили с помощью нескольких тестов, включая YaMMLU_ru — локализованную на русский язык версия международного бенчмарка MMLU. Разработчики также применили методику тестирования Side by Side (SBS), чтобы оценить возможность модели справляться с генерацией идей, обобщением информации, задачами классификации, созданием контента и другими бизнес-задачами. В 67% случаев YandexGPT 3 отвечает лучше YandexGPT 2, а при работе с пользовательскими запросами и обработке бизнес-запросов новая нейросеть справляется лучше в 69% и 60% случаев соответственно.

YandexGPT 3 Pro

Также теперь YandexGPT 3 Pro значительно реже ошибается — количество фактических ошибок по сравнению с YandexGPT 2 сократилось с 16,4% до 13,5%, доля неподтверждённой информации в ответах снизилась с 6,4% до 5%, а количество вопросов пользователя без ответа уменьшилось в 5 раз.

В ближайшее время YandexGPT 3 Pro и другие нейросети третьего поколения YandexGPT появятся и в сервисах «Яндекса» для широкой аудитории.

Источник: 4pda.to


  • Angus123
    После того как попробовал Claude Opus на другие даже смотреть не хочется, GPT-4 ещё более-менее, но все эти Гигачаты, Алисы, GPT 3.5 нервно курят в стороне по сравнению Клауди. ИМХО.
    • dr.Pavlov1
      Angus123,
      Gemini ничего так, точно лучше ГПТ4
      • Angus123
        dr.Pavlov1,
        Pro или обычный?
        • dr.Pavlov1
          Angus123,
          Обычный, который доступен
        • Illiryel
          dr.Pavlov1, Gemini хуже... быстрее - да, но глючит его иногда не по детски :)
        • Eozhty
          Angus123,
          а где можно клауди потрогать ?
          • Angus123
            Eozhty,

            Либо купить, либо гугли arena lmsys, там бесплатно, но он общий на всех, пользоваться лучше когда в США и Европе ночь
          • SecondName
            Angus123, что именно ты там попробовал юный исследователь ?
            • 🌌b42h🌌
              Angus123,
              не хватает анализа всяких файлов, но в целом, очень даже хорошо. убрал подписку ChatGPT, пробую пока Opus.
              • Eleman
                🌌b42h🌌,
                Есть конкретная ссылка где можно с клаудом пообщаться ? Я нашел лишь некий батл спаринг, где анонимно две сети одновременно отвечают, а ты выбираешь лучший ответ, после этого тебе снизу пишут кто это был. Так себе. Я вот так выбрал лучший, и им оказался клауд. Теперь хочу напрямую с ним
                • 🌌b42h🌌
                  Eleman,
                  да, клауди аі.
                  правда, если не ошибаюсь, в бесплатной версии все очень плохо.
                  • SatoShi0
                    Eleman,
                    На том сайте, о котором ты говоришь, есть отдельная вкладка, где можно вручную выбрать, с какой моделью хочешь общаться. Там и Opus доступен.
                    • Eleman
                      SatoShi0,
                      Да. нашел.
                • BoomaleX
                  Angus123,
                  Русский язык поддерживает? В чем плюс относительно gpt ? И как вы его используете?
                  • SecondName
                    BoomaleX,
                    Русский поддерживает. Для обычных пользователей разницы между ним и гпт особо нет.
                    Я бы от него ответа внятного не ждал.

                    (отредактирован)

                    • BoomaleX
                      SecondName,
                      Ну я просто столкнулся сегодня с невнятным ответом от gpt) типо нужно лабораторными испытаниями только получить результат. Но даже не предоставил хотя бы ответ из справочников химиков или уже проведенных испытаний. Думал может другой ai поможет.
                  • mister_B
                    Angus123,
                    Только твой опус не затолкать в колонку на кухне
                    • Selfik2010
                      Angus123,
                      А с какой целью вы его и пользуете? Для каких сценариев?
                      • ingref
                        Angus123,
                        Только не Клауди, а Клод)
                        Вообще, из России без VPN прекрасно доступен chat.mistral.ai - там качество такое же и генерация быстрее.
                      • dr.Pavlov1
                        Умнее и точка!
                        • Резюме пропадет мне создать?
                          • qweka,
                            *Поможет
                            • CынМаминойПодруги
                              qweka,
                              Я сопроводительное письмо сделал на ней. Отлично прошло.
                              На GPT4 - анализ таблиц.
                              К каждой AI свои задачи. Поэтому 4-5 шт под рукой всегда держу.
                              • 🌌b42h🌌
                                CынМаминойПодруги,
                                чатгпт, клауди, гемини. что еще и зачем?
                                • SatoShi0
                                  🌌b42h🌌,
                                  NousHermes на Mistral для ответов без цензуры.
                                  • CынМаминойПодруги
                                    🌌b42h🌌,
                                    Один почтовый, что бы полуавтоматом текст составлял. Второй перевод звука в текст, надиктовываю, что быстрее чем набирать текст и мучаться с грамматикой.
                            • Sergei113
                              Кстати у них недавно был опрос среди пользователей нейросети в Алисе, по поводу YaGPT 2.0, так вот один из вопросов был типо такой: "вы готовы платить за более умные функции YaGPT?" - не к добру все это
                              • Angus123
                                Sergei113,

                                Не, если Алиса станет на уровне GPT-4/Gemini, то купить подписку не проблема, но если такая, какая была YaGPT 2.0, то даже если мне доплачивать будут, не буду использовать :)
                                • Сладенькая Булочка
                                  Sergei113,
                                  Ого, продукт хотят монетизировать, вот это да…
                                  По сути вон, гптшки, гуглы и прочие тоже за деньги, но это другое да
                                  • Sergei113
                                    Сладенькая Булочка,
                                    Не было бы подписки "плюс" я бы молчал, а так они могут и эту нейруху YaGPT-3Pro начать монетизировать, хотя она прилично отстаёт от GPT-4/Gemini. Если будут две отдельные подписки (плюс и нейруха) то смысла нет отдавать за yagpt деньги.
                                    • SecondName
                                      Sergei113, а в чем отстает ? наглядно пояснить можешь ?
                                      • Sergei113
                                        SecondName,
                                        Куча статей где сравнивают ЯГПТ и чатгпт в интернете, загугли) я тут описывать не буду. Я огласил свое мнение на основе прочитанного. Ваше мнение мб другим)
                                        • SecondName
                                          Sergei113, ну что и требовалось доказать. Ты сам ничем не пользовался или пользовался на уровне детского сада. твое мнение формируется на статье в которой нет никакой технической информации и сравнений позволяющую сделать закономерное заключение, просто на основе пары строк котоыре ты даже осознать не можешь о чем я тебе написал в другом комментарии. И да, хочу напомнить хлебушкам вроде тебя.
                                          Яндекс представил свою первую версию языковой модели год назад, тогда как OPEN AI занимаются только этим направлением уже полдесятка лет.
                                        • Sergei113
                                          SecondName,
                                          Даже один факт что они Yandex в этой статье сравнивают YaGPT-3Pro не с GPT-4, а с устаревшей GPT-3.5 о многом говорит
                                          • SecondName
                                            Sergei113, нет уж изволь ответить. ты как я понимаю активный пользователь и видимо у тебя есть личные претензии к качеству выполняемого действий на разных языковых моделях. ты же их все попробовал ?
                                            твой вывод про сравнение на уровне детского сада.
                                            gpt 4 продолжает совершенствоваться и сравнение с незаконченным продуктом это по меньшей мере безграмотность, потому что сегодня количество параметров одно, а завтра его поднимают в 2-10-50-100 раз и результаты изменяются в разы, но продукт остается все тем же gpt 4, а твои сравнения начинают выглядеть как обман. Сравнения с gpt 4 начнутся тогда, когда его параметры получат границы.
                                        • SecondName
                                          Sergei113, а как связана подписка плюс с языковой моделью ?
                                        • Sergei113
                                          Сладенькая Булочка,
                                          Ну по факту это все домыслы, поживём увидим))
                                      • Нейроперевод в Яндекс Браузере порадовал, а тут ещё лучше будет
                                        • risnew
                                          Пока всякого жипити не будут говорить правду, то нет в них никакого толка. Достаточно задать пару тестовых вопросов и всё становится ясно.
                                          Например : Какую форму имеет земля? Были ли американцы на Луне?
                                          Если ответы на вопросы будут, как из школьной программы, то можно делать выводы. А вывод прост :никакие они не умные, а очередные зомбо программы
                                          • Badcocf
                                            risnew,
                                            боже
                                            • 4i4i4iPi
                                              Badcocf,
                                              -Да, слушаю тебя.

                                              (отредактирован)

                                          • Restik.
                                            13% ошибок - это очень много, чтобы доверять боту
                                            • Надеюсь перестали тупо перенаправлять на Яндекс поиск
                                              • Фаренгейт
                                                sur.,
                                                Если на бета тестирование подписаться - не перенаправляет, а сразу выдаёт ответ. Но указывает, откуда он был взят.
                                              • Lord-Valington
                                                Дифферинциалы научилась решать? В прошлом году очень нужно было
                                                • Skorpi17_96
                                                  И сливает данные запросов Майору))
                                                  • Фаренгейт
                                                    Skorpi17_96,
                                                    Естественно, как и вот этот ваш комментарий, берегитесь!
                                                  • jsjxu 2.0
                                                    Всё ищут какие-то ответы на свои, наверное, важнейшие вопросы))
                                                    • slam007
                                                      Только не написали как пользоваться gpt. Зашёл по ссылке, побродил по сайту, но так и не нашёл yandex gpt.

                                                      Каталог цифровой техники Xiaomi пополнила камера наружного наблюдения CW500. Помимо практичной конструкции, новинка интересна продвинутыми программными возможностями. Она получила поддержку ИИ-функций благодаря чему способна фиксировать приближение человека или автомобиля.

                                                       

                                                      Разработчик технологий для борьбы с киберпреступлениями F.A.C.C.T. (бывший Group-IB) сообщил изданию РБК, что мошенники придумали новый опасный метод кражи паролей для онлайн-банков, и рассказал, как от него защититься.

                                                       
                                                      <div></div><div></div><div></div><a href='/2024/05/21/2852862/' target='_blank'><img src='https://4pda.to/s/as6ywue3S4wsjFGg0z2I2iyY7kHEE0EmiXkPLY783uK3Miqm98HafRECC.jpg' title='' /></a><div ><img src='https://4pda.to/s/as6yu42hlyXjD7kQLqbvVMOGid.gif' /></div><div></div><div></div>

                                                      Сбер объявил о запуске полезной функции для тех, кто не любит носить с собой банковскую карту. Теперь клиенты банка могут не только снять наличные, но и пополнить ими свой счёт в банкомате при помощи мобильного приложения без использования «пластика».

                                                       

                                                      После релиза iPhone 14 Pro всё больше вендоров перенимают технологию спутниковой связи. На днях с этим нововведением дебютировал Xiaomi 14 Ultra. Рассказываем, в каких случаях может выручить спутниковая коммуникация и как она работает.

                                                       

                                                      Аналитики медиакомпании Visual Capitalist составили список из 15 бестселлеров мобильного рынка за всю его многолетнюю историю. Рейтинг оказался любопытным: его практически поровну поделили всего два бренда, из которых на плаву к 2024 году остался только один.

                                                       

                                                      Проверенный временем инсайдер Йогеш Брар опубликовал в социальной сети X подробности о предстоящем «бюджетном» смартфоне от Google. Он назвал практически все характеристики и цену будущего Pixel 8a. Есть вероятность, что аппарат будет дороже предшественника.

                                                       

                                                      После победы над Windows в играх ОС Linux «расправилась» с соперницей и в других дисциплинах. Об этом рассказали авторы портала Phoronix. Они провели 101 тест в разных бенчмарках, используя в качестве тестовой платформы ноутбук Framework 16 с процессором Ryzen 7 7840HS. Как выяснилось, преимущество Linux в прикладных задачах оказалось весьма ощутимым.

                                                       

                                                      Компания объявила о выпуске «премиальной» версии фирменного браузера, распространяемой по модели платной подписки. Она ориентирована на корпоративное использование, и отличается от базовой сборки с приставкой Enterprise расширенным набором функций. В блоге Google появилось подробное описание приложения и данные о новом тарифе.

                                                       

                                                      Microsoft давно сотрудничает с OpenAI. Так, на базе технологий стартапа работает чат-бот Microsoft Copilot. Хотя OpenAI продаёт доступ к своей самой передовой языковой модели за деньги, редмондская корпорация решила порадовать юзеров и встроила GPT-4 Turbo в бесплатный тариф Copilot.

                                                       

                                                      Практически сразу же после премьеры флагманский смартфон HUAWEI Pura 70 Ultra начал попадать в руки техноблогеров. Один из них не ограничился изучением дизайна устройства и сразу принялся за разборку, чтобы раскрыть одну из тайн его выдвижной камеры.

                                                       

                                                      Сериал по мотивам Fallout можно назвать безоговорочно успешным — он не просто «пришёл и ушёл», о нём говорят, его тщательно исследуют в поисках намёков на оригинальные игры и различных «пасхалок» от съёмочной группы. На днях, к примеру, фанаты заметили на вид рабочий номер телефона и решили его проверить.

                                                       
                                                      Все три версии Google Pixel 9 показали на реальных снимках [ФОТО] Популярное

                                                      В сети появилась серия фотографий всех трёх смартфонов ещё не представленной серии Google Pixel 9. Помимо базовой модели и «прошки», инсайдеры показали и версию Pro XL. Дизайн гаджета выглядит знакомым, но сам он будет крупнее других представителей линейки.

                                                       

                                                      Компания Boom Supersonic отчиталась о первом успешном испытательном полёте прототипа сверхзвукового пассажирского самолёта XB-1 (Overture). Ожидается, что в будущем он сможет развивать скорость свыше 2000 км/ч, получив статус первого коммерческого сверхзвукового судна после «Конкорда», выведенного из эксплуатации в 2003 году.

                                                       
                                                      Обзор Xiaomi 14 Ultra: претендент на смартфон года глазами зарубежных СМИ
                                                      61
                                                      7.03.24News

                                                      Xiaomi 14 Ultra не назовёшь революционным устройством, но компания проделала немалую работу по устранению недостатков предыдущей модели. В результате многие издания и блогеры уже называют новинку одним из лучших смартфонов года.

                                                       

                                                      После презентации HyperOS в сети начали распространять информацию, что эта прошивка только для китайского рынка, а в остальном мире Xiaomi продолжит выпускать MIUI. И хотя компания так никогда не заявляла, теперь появилось официальное опровержение всем спекуляциям — анонс глобального развёртывания прошивки. 

                                                       
                                                      Названы самые продаваемые смартфоны 2024 года Популярное

                                                      Аналитическая компания Counterpoint раскрыла рейтинг самых продаваемых смартфонов в мире за первый квартал 2024 года. Кроме того, аналитики сравнили статистику с аналогичными показателями 2023 года. По традиции iPhone снова оказался недосягаем для Android-флагманов, а в топ-10 обосновались модели только двух брендов.

                                                       
                                                      Космический аппарат заснял Солнце «вплотную» [ВИДЕО] Популярное

                                                      Европейское космическое агентство представило видео поверхности Солнца, снятое с помощью космического спутника Solar Orbiter. Аппарат приблизился на короткое расстояние к звезде, благодаря чему астрономам удалось рассмотреть поверхность Солнца практически вплотную — насколько это возможно.

                                                       

                                                      На китайском портале Autohome вышел материал с официальными ответами Xiaomi на часто задаваемые вопросы про автомобиль SU7. Так, стало известно, сколько стоит ТО, будет ли автомобиль продаваться за границей, сколько людей уже заказали новинку и есть ли у неё профессиональный режим вождения.

                                                       

                                                      По данным «Коммерсанта», ссылающегося на представителей маркетплейсов и ритейлеров, в России растут продажи накопителей и модулей оперативной памяти. Эксперты объясняют это желанием покупателей модернизировать ноутбуки исходя из собственных потребностей.

                                                       

                                                      В конце марта Google удалила приложение Mir Pay из каталога Google Play. Причина — американские санкции в отношении АО «Национальная система платёжных карт» (НСПК), которая обслуживает карты «Мир». В Mir Pay нет автоматического обновления, так что устанавливать апдейты придётся самостоятельно.

                                                       
                                                      Google запустила Chrome OS на Android-смартфоне. Как это выглядит? Популярное

                                                      Google провела любопытный эксперимент по запуску фирменной операционной системы ChromeOS на мобильных устройствах, «заточенных» под Android. Первым подопытным стал смартфон Pixel — как на нём работает десктопная операционка, компания показала в рамках закрытого презентационного мероприятия.

                                                       

                                                      Рубен Крус, дизайнер и основатель модельного агентства The Clueless, разработал виртуальную подопечную, которая приносит ему тысячи евро в месяц. «Девушку» зовут Айтана, и она, по мнению дизайнера и его клиентов, лишена недостатков, свойственных живым моделям.

                                                       

                                                      Как сообщает издание «Коммерсантъ», крупные ритейлеры обратились к Минпромторгу и Генпрокуратуре с просьбой обратить внимание на новую мошенническую схему, в рамках которой покупатели преднамеренно портят технику, а затем получают компенсации через обращение в суд. Утверждается, что речь идёт о сотнях подобных дел, в рамках которых от крупных ритейлеров только за 2023 год было потребовано свыше 1 миллиарда долларов.

                                                       

                                                      Известная своими защищёнными устройствами компания Oukitel приняла участие в большой весенней распродаже на AliExpress. В честь этого ряд моделей бренда можно приобрести по сниженным ценам. Например, со скидкой доступны планшет RT8 и смартфон WP36 с ёмкими аккумуляторами и повышенной долговечностью.

                                                       

                                                      Как оказалось, преждевременной кончине сериала «Ведьмак» рады не только рядовые поклонники вселенной, но и сами актёры. За всех говорить сложно, но Фрейя Аллан, исполняющая роль Цири, публично призналась в этом.

                                                       

                                                      Аналитический портал Statcounter опубликовал статистику распространённости мобильных и десктопных браузеров по итогам марта 2024 года. На этот раз обошлось без сюрпризов: бессменный лидер всё ещё не спешит сдавать свои позиции.

                                                       
                                                      Достигнут новый рекорд термоядерного синтеза Популярное

                                                      Расположенный во Франции реактор Токамак WEST установил новый рекорд, удерживая термоядерную плазму при более высоких показателях энергии и плотности, чем ранее. Всё дело в используемом вольфрамовом корпусе, справляющимся со своей задачей лучше углеродных аналогов.

                                                       

                                                      Три месяца назад компания Neuralink впервые в истории вживила чип 29-летнему пациенту по имени Ноланд Арбо. Спустя ровно сто дней стартап Илона Маска сообщил, что часть мозгового импланта вышла из строя. Из-за этого компании пришлось срочно обновлять программное обеспечение.

                                                       

                                                      Как правило, Microsoft неохотно признаёт проблемы с очередным патчем, и без лишнего шума исправляет их в последующих обновлениях. Но апдейт KB5034848 для Windows 11 компания проигнорировать не смогла. Он содержит серьёзные ошибки, нарушающие корректную работу ПК — и разработчики сами посоветовали пользователям не устанавливать его.

                                                       
                                                      Первый взгляд на Honor Magic6 Pro: когда вкачал магию на максимум
                                                      48
                                                      9.04.24News

                                                      Топовый Honor Magic6 Pro наделал немало шума, и неудивительно: он, по мнению экспертов известного рейтинга DxOMark, предлагает передовую камеру и отличную автономность. Кандидат на роль идеального флагмана добрался до редакции 4PDA. Мы уже готовим подробный обзор новинки, а пока поделимся первыми впечатлениями.

                                                       

                                                      В конце прошлой недели CD Projekt RED анонсировала новый патч для Cyberpunk 2077, призванный исправить «самые частые проблемы, о которых сообщали игроки». Правки действительно не заставили себя долго ждать.