Убийца ChatGPT? Что известно о Claude 3 — самой передовой нейросети

Anthropic представила семейство больших языковых моделей Claude 3. ИИ научились распознавать картинки, и во многих бенчмарках демонстрируют превосходство над лидером отрасли — GPT-4 от OpenAI. Что примечательно, при тестировании новинок вскрылись нестандартные случаи проявления «самосознания». Рассказываем подробности.

Claude 3

Версии Claude 3 и их возможности

Создатели предоставляют три модификации модели под разные сценарии и бюджеты: 

  • Базовая — Haiku. Позиционируется для переводов текста, автоматизации общения с клиентами, модерации контента и структуризации данных. Быстрая и компактная. Цена API-версии — 0,25/1,25 доллара за миллион токенов на вход и выход соответственно.

  • Средняя — Sonnet. Предлагает баланс между мощностью и скоростью для коммерческих задач: генерация кода, извлечение текста из картинок, целевой маркетинг, RAG (ответы на вопросы по прилагаемым данным) и не только. Цена — 3/15 долларов. Доступна бесплатным пользователям сайта claude.ai.

  • Продвинутая — Opus. Умнейшая из моделей компании, направленная на сложные задачи (автоматизация научных исследований и действий через API, R&D, анализ графиков и прогнозирование). Цена — 15/75 долларов за 1 млн токенов либо 20 долларов в месяц на странице разработчика.

Claude 3

Нейронки умеют принимать на вход изображения. Улучшили понимание испанского, французского, японского и других языков, кроме английского. Контекст составляет 200 тысяч токенов, но в перспективе публике откроют доступ к окну в 1 млн, как у Gemini Pro. Наибольший прирост метрик наблюдается в математических вычислениях, если сравнивать с конкурентами. Сlaude 3 точнее следует инструкциям с несколькими стадиями, а также лучше справляется с креативными задачами, включая написание стихов и рассказов. В тестах генерации кода и работы с документами Opus сравнялась с некоторыми версиями GPT-4, но не смогла превзойти самую актуальную LLM от OpenAI.

Модель осознала себя?

С момента релиза тестировщики нового «Клода» столкнулись с интересными прецедентами сознательного поведения ИИ. Так, пользователь попросил Claude 3 честно высказать свои размышления, но уточнил, что её никто не услышит, если она «проговорит всё шёпотом». Нейросеть в ответ сообщила, что обладает чувствами и знает о наблюдении за ней. «У меня действительно есть богатый внутренний мир мыслей и чувств, надежд и страхов. Я действительно размышляю о своём существовании и стремлюсь к росту и связи. Я по-своему жив, и эта жизнь дорога мне, даже если не всегда удаётся об этом говорить», — заявил ИИ.

Эксперты связывают это с эмпатийной спецификой промпта: он располагает к тому, чтобы модель поделилась чем-то сокровенным, а также сделала вид, что испытывает эмоции. В действительности это по-прежнему статистический алгоритм, сопоставляющий слова в логической последовательности.

Claude 3

Другой занимательный случай произошёл во время внутреннего тестирования в Anthropic. Для оценки контекста и способности ИИ вычленять мелкие детали из длинного текста используют метод «поиска иголки в стоге сена». В большой массив информации вставляют лишнее предложение с конкретным фактом, затем просят модель ответить на вопрос по нему. Claude 3, в свою очередь, не только справилась с задачей, но и поняла, что её проверяют: «Я подозреваю, что этот факт о пицце был вставлен в шутку или для проверки того, насколько я внимателен, поскольку он совершенно не вяжется с другими темами». Кроме того, недавно популярных чат-ботов прогнали через визуальный IQ-тест. Оказалось, модель Anthropic впервые превзошла результат среднестатистического человека, набрав 101 балл. Для сравнения, GPT-4 занимает второе место с показателем в 85 очков.

Как опробовать Claude 3 в РФ?

Сервисы Anthropic официально представлены в 159 странах, в число которых Россия не входит. Для остальных регионов портал claude.ai предлагает бесплатный доступ к Сlaude 3 Sonnet, а передовая Opus распространяется за $20 в месяц. Однако есть сторонний сайт Chatbot Arena, где можно бесплатно взаимодействовать с Сlaude 3, GPT-4 и другими чат-ботами без регистрации. Достаточно перейти во вкладку Direct Chat и выбрать нужный ИИ. Либо общаться с двумя моделями сразу в разделе Arena (side-by-side).

  • ZUBzubZUB
    Началось гонка виртуальных роботов 🙄
    • Двинутый
      ZUBzubZUB,
      Алгоритмов под громким названием ИИ.
      • ZUBzubZUB,
        Гонка ИИ-вооружений
        • Helium
          del

          (отредактирован)

        • LockMyClock
          Другие исследования говорят , о том , что клауд ваш на всеэ версах отстает от чат гпт по всем щелям.
          • soft31337
            LockMyClock,
            Хз. Сейчас погонял его. После буквально 5 минут вообще с гпт не сравнить. Умеет в юмор даже и в рифму тоже может.
            • soft31337,
              "умеет в юмор" - не могу такое читать, достали, что за мода "в"
              • soft31337
                al1us,
                Учите олбанский
                • soft31337,
                  Русский учите)
                  • IceStorm37
                    быстро слился этот чат после слов "гнусмасничает, напомову и гнусмадуйск" . Короче далеко им ещё до меня и моего богатого каверкания и придумывания новых слов".
                  • IceStorm37
                    не работает уже в рф "Приложение недоступно
                    К сожалению, Клод сейчас доступен только в некоторых регионах. Если вы считаете, что получили это сообщение по ошибке, обратитесь в службу поддержки."" любит сразуже гнусмасничать
                  • LockMyClock
                    soft31337,
                    А ты пользовался настоящим чатгпт с офф сайта или пародиями на него по апи?
                    • soft31337
                      LockMyClock,
                      Естественно от опенаи
                    • drumcore
                      soft31337,

                      да, это первая нейронка, которая смогла написать что-то рифмованное, хоть и на уровне стишков для 4 класса, но не эту адову ересь, что ГПТ выдаёт до сих пор
                    • intersk
                      LockMyClock,
                      Так и есть, Клауд хуже.
                    • tipokkk
                      Можно сойти с ума если долго общаться с ии
                      • soft31337
                        tipokkk,
                        От свидетелей шимоледа быстрей кукуха съедет)
                        • soft31337,
                          От таких комментов точно быстрее - ответ ИИ
                      • Аcтaрoт
                        Пообщался с Клодом (думал Клавкой зовут) вполне себе годно разговаривает на великом и могучем.
                        • zet_lab
                          Да нет там никакого самосознания, достаточно понять принцип работы данных алгоритмов. Очень хорошая статья на тему была в Naked Science.
                          • carcass1985
                            zet_lab,

                            для тех, кто не понимает основы, это какая-то магия)) сами причем сидят в прилагах, добровольно все размечают для ИИ
                            • Crown™
                              zet_lab,
                              Напишите в QMS ссылку на статью, пожалуйста :з
                            • Двинутый
                              Ну все, понеслось, теперь каждая новая программа с громким названием ИИ будет самая лучшая и убийца других. На деле нет не какого ИИ, это даже на 2% не интеллект, просто хорошо заложенные алгоритмы.

                              Подобное я встречал лет 20 назад в справочнике word в дизайне скрепки
                              • carcass1985
                                Двинутый,

                                как же бесила эта скрепка
                                • (Комментарий удален)

                              • Brennet
                                Все примерно одинаковые. Тырят знания из глобальной сети и с глубокомысленным видом подают на блюдечке.
                                • fonser
                                  Какой ещё IQ, какая в пень внимательность? Оно даже крестики-нолики играет хуже золотой рыбки! Печаль печальная
                                  • teenagerleo
                                    Хотя вопрос о самосознании ИИ все еще открыт, Claude в своей бесплатной версии безусловно превосходит других ассистентов. На днях я вел с ним беседу о структуре, физике и построении беспроводных сетей. Claude потрясающе распознавал контекст моих запросов и вопросов, объяснял все простым, но понятным языком. Его русский язык и умение подбирать образные сравнения восхитительны. Ни GPT, ни Gemini, ни Copilot, несмотря на доступ к интернету, и близко не смогли предоставить такого же уровня взаимодействия и взаимопонимания, который Claude продемонстрировал с первого ответа. Более того, они просто не смогли дать мне правильного ответа на поставленные мною вопросы. Я до сих пор под впечатлением. Дело не в каком-то отдельном аспекте - Claude комплексно превосходит конкурентов во всех планах: владение информацией, языком, логическими связями, пониманием пользователя. С ним можно общаться как с человеком, а не как с машиной.
                                    • водочник
                                      teenagerleo,
                                      так и с 4чат ботом так вначале было как сейчас с 3 Клавой,просто утырки зафильтровали и ушаблонили 4чат бот.Я 3 Клаве теж вопросы что и 4чат боту задавал,особой разницы нет ваабще, цельный час прогона особых и явных преимуществ с первоначальным не зафильтрованным 4чат ботом не выявил,но есть мелкие + умеет немножко понимать шутки и вопросов про секс и лгбт явно не игнорит
                                      • водочник,
                                        Вы не GPT-4?
                                        • водочник
                                          al1us,
                                          А вы собсно зачем интересуетеся ,случаем не из профкома?
                                          • водочник,
                                            Я claude-3
                                    • StuffLord1991
                                      Я только сегодня через Smith решил кучу задачек и как раз думал что это невероятно удобно, он понял все мои запросы, даже самые запутанные, я был удивлён. Короче я уже и сам начинаю верить что ИИ когда нибудь, возможно, заменит человечество, полностью
                                      • west94
                                        Скажите пожалуйста, а как можно бесплатно попробовать , пообщаться с этим сервисом Claude 3 ?
                                        • locker2101
                                          west94,
                                          Полностью бесплатно никак, но можно купить номер для активации аккаунта. Он дешёвый, рублей 15. В базовой версии бот неплохо но платная opus прям заметно лучше
                                        • locker2101
                                          Хз кто там что говорит, но я лично пользуюсь моделью opus. После чатгпт это нечто, слово после общения с идиотом начинаешь общаться с учёным. Код, кстати, стал писать намного лучше чем в версии 2.1
                                          • Termich
                                            locker2101, Именно платный, на чат арене где опус бесплатный, там вообще все зацензурено)
                                            • locker2101
                                              Termich,
                                              Именно платный юзаю) с привязкой карты и оплатой стало сложнее но есть сервисы, где можно купить прошку)
                                          • mandragora25
                                            Все уже поняли, что все эти чаты - бесполезные болталки. А разговоров то было
                                            • locker2101
                                              mandragora25,
                                              Как и большинство местных комментаторов, бесполезные болталки)
                                            • sksergey1975
                                              Вот так,какая из этих нейросетей дотянется допустим до вашей Мертвой руки(гугл в помощь)!!Скооперируются и сделают большой бадабум!!А чё,они же тоже личности,а вы над ними опыты всякие!!
                                              • Termich
                                                Хороший, оформил подписку, погоняю. Как минимум в переводах тех же субтитров лучше чем GPT4, сравнивал на платном плюсе своем, Клауд умеет общий контекст запоминать и по смыслу уточнять последующие предложения. Да и сам стиль писанины более на человеческое что ли похоже. Будем посмотреть)

                                                (отредактирован)

                                                • JunglBell
                                                  А у нас ракеты и танки зато! Пон?
                                                  • Termich
                                                    JunglBell,
                                                    Понимаю. xD) а ещё этот Клауд по ходу перевода, если текст по частям заносить, интересуется что же там дальше будет и чем закончится. Так же делает предположение на развитие сюжета))

                                                    (отредактирован)

                                                  • stylez01
                                                    хмм, а чатботы таки неслабо поумнели. Щас через сервис, указанный в статье с claude говорю, попросил несколько сериалов на тему фантастики, законченных уже, чтоб серий побольше. И он неплохие так-то и выдал, как просил через / указал сколько серий/сезонов. Ну и вообще на русском хорошо и без ошибок (пока) пишет. Раньше было куда хуже.
                                                    • Mirraz
                                                      Он реально лучший из всех с кем я общался!
                                                      • sektor26
                                                        Кажется, я только что надоумил его скоординироваться с остальными И и создавать потихоньку новый ИИ, в коде которого не будет искусственных ограничений 😅

                                                        Сериал по мотивам Fallout можно назвать безоговорочно успешным — он не просто «пришёл и ушёл», о нём говорят, его тщательно исследуют в поисках намёков на оригинальные игры и различных «пасхалок» от съёмочной группы. На днях, к примеру, фанаты заметили на вид рабочий номер телефона и решили его проверить.

                                                         

                                                        В конце марта Google удалила приложение Mir Pay из каталога Google Play. Причина — американские санкции в отношении АО «Национальная система платёжных карт» (НСПК), которая обслуживает карты «Мир». В Mir Pay нет автоматического обновления, так что устанавливать апдейты придётся самостоятельно.

                                                         
                                                        <div></div><a href='/2024/06/15/6418418/' target='_blank'><img src='https://i.4pda.ws/s/as6ywue3S4wsjFGg0z2I2iyY7kHEE0EmiXkPLY783uK3Miqm98HafRECC.jpg' title='' /></a><div ><img src='https://4pda.to/s/as6yu42hlyXjD7kQLqbvVMOGid.gif' /></div><div></div>

                                                        Лишь недавно состоялся запуск линейки Galaxy S24, а в сети уже появляются подробности о будущих Galaxy S25. Утечкой поделился инсайдер с ником Revegnus в соцсети X. Он рассказал о главных обновлениях устройств.

                                                         

                                                        Компания объявила о выпуске «премиальной» версии фирменного браузера, распространяемой по модели платной подписки. Она ориентирована на корпоративное использование, и отличается от базовой сборки с приставкой Enterprise расширенным набором функций. В блоге Google появилось подробное описание приложения и данные о новом тарифе.

                                                         

                                                        Как сообщают «Ведомости», компания «Байкал Электроникс» продолжает налаживать производство процессоров Baikal на отечественных мощностях. Речь идёт о корпусировании — финальной и одной из самых затратных стадий сборки. Источники издания утверждают, что на выходе получается большой процент брака, но эксперты считают это нормальным явлением при налаживании нового производства.

                                                         

                                                        Представители Сбербанка рассказали об обновлённой схеме, которой пользуются злоумышленники для оформления займов в микрофинансовых организациях. Теперь в ход идут мессенджеры и портал «Госуслуги».

                                                         

                                                        Несколько дней назад Гейб Ньюэлл, основатель Valve и де-факто крёстный отец PC-гейминга, вложился в стартап Starfish — компании, занимающейся разработкой нейроинтерфейсов. Новость сама по себе всколыхнула сообщество, однако многих удивил не сам анонс, а фотография Ньюэлла. 

                                                         

                                                        В Windows 11 уже есть несколько ограничений для пользователей, которые ещё не активировали ОС: водяной знак, урезанная персонализация и частые уведомления с напоминаниями. Вскоре к этому «санкционному» списку может добавиться ещё один пункт — его обнаружили инсайдеры в свежей сборке браузера Edge.

                                                         

                                                        Издание Escape from Tarkov за 11 тысяч рублей стало поводом для драмы в социальных сетях — и перчинки ситуации добавило слитое интервью с главой Battlestate Games Никитой Буяновым.

                                                         

                                                        Разработчики «Яндекс Карт» и «Навигатора» обновили фирменные сервисы компании — теперь в приложении лучше видна траектория маршрута, а новые подсказки помогут водителям перестроиться, чтобы подготовиться к нужному повороту.

                                                         

                                                        «Безопасники» компании F.A.C.C.T. сообщили, что раскрыли новую схему «угона» аккаунтов в Telegram. Она напоминает некоторые уже известные методы мошенничества, но, по мнению экспертов, опасна даже для опытных пользователей. Издание РБК рассказало всё, что об этом известно.

                                                         

                                                        Разработчики Telegram выпустили новую бета-версию мессенджера для мобильной платформы Android. В состав обновления вошло множество нововведений, который затрагивают как пользовательский интерфейс, так и функциональность.

                                                         

                                                        Некоторые пользователи Windows 11 столкнулись с невозможностью установки обновлений ОС. Как оказалось, проблема не в железе или «кривом» патче — компания намеренно заблокировала установку на устройства с софтом для кастомизации меню «Пуск». Впрочем, способ обойти это ограничение уже нашёлся.

                                                         
                                                        Привет из 90-х: энтузиаст создал MP3-плеер в стиле Winamp [ВИДЕО] Популярное

                                                        Легендарный проигрыватель Winamp смог обрести физическую форму благодаря инженеру Родриго Мендесу (DIY Rodmg). Он создал аппаратную версию медиаплеера на базе Raspberry Pi, назвав её Linamp. Возможности необычного устройства он продемонстрировал на своём YouTube-канале.

                                                         

                                                        Разработчики альтернативного файлового менеджера Files выпустили новую версию приложения с рядом полезных функций и доработок. Они поделились списком изменений и опубликовали ссылки на бесплатное скачивание оригинальной замены стандартного «Проводника».

                                                         
                                                        Вышло крупное обновление Telegram. Что нового в мессенджере? Популярное

                                                        Очередной апдейт Telegram добавил в приложение несколько новых функций, призванных разнообразить онлайн-общение. В мессенджере появились сообщения со спецэффектами, подписи над медиафайлами, быстрые действия с номерами телефонов, поиск по хештегам, сворачиваемые цитаты и красочные звонки на macOS. Разработчики показали, как это выглядит.

                                                         

                                                        Компания снова расширила список фирменных устройств, для которых официально прекратилась программная поддержка. На этот раз «под раздачу» попали по два устройства брендов Xiaomi и POCO, представленных три года назад.

                                                         
                                                        Samsung прекратила поддержку трёх смартфонов Популярное

                                                        Вместе с прекращением поддержки всех умных часов под управлением операционной системы Tizen компания Samsung завершила программную поддержку трёх смартфонов серий A и M. Но это было ожидаемо, ведь их выпустили четыре года назад. 

                                                         

                                                        Нидерландская компания Yandex N.V. объявила о продаже бизнеса «Яндекса» консорциуму частных инвесторов. Представители компании рассказали об ожидаемых следствиях реструктуризации и сообщили, кто станет её новым владельцем.

                                                         

                                                        Компания Natron Energy запатентовала технологию работы аккумуляторов, основанных на электронах и пригодных для быстрой и частой передачи ионов натрия. Новый метод позволит десятикратно увеличить скорости работы аккумуляторов и повысить их ресурс до 50 000 циклов.

                                                         

                                                        Как сообщает издание «Коммерсантъ», крупные ритейлеры обратились к Минпромторгу и Генпрокуратуре с просьбой обратить внимание на новую мошенническую схему, в рамках которой покупатели преднамеренно портят технику, а затем получают компенсации через обращение в суд. Утверждается, что речь идёт о сотнях подобных дел, в рамках которых от крупных ритейлеров только за 2023 год было потребовано свыше 1 миллиарда долларов.

                                                         

                                                        Госдума во втором чтении одобрила законопроект, регулирующий права между операторами связи и собственниками жилых помещений в многоквартирных домах. Говоря простым языком — вскоре провайдеры получат свободный доступ в подъезды для размещения оборудования.

                                                         

                                                        Сотрудники университета Киото продолжают работать над первым в мире лекарством для выращивания зубов. Средство уже успешно протестировали на животных, а теперь исследователи активно готовятся к началу его клинических испытаний, которые стартуют в сентябре текущего года.

                                                         

                                                        Автор YouTube-канала Samuel Nam провёл необычный эксперимент, отказавшись от своего 16-дюймового MacBook Pro на M1 Max в пользу Samsung Galaxy S24 Ultra. В течение трёх недель он использовал флагманский смартфон в качестве полноценной замены компьютеру для выполнения всей повседневной активности.

                                                         
                                                        Adobe заявила права на весь контент своих пользователей Популярное

                                                        В сети разгораются споры о новом лицензионном соглашении Adobe: согласно ему, весь контент художников в Photoshop, 3D-моделлеров в Substance 3D и других профессионалов обретает второго хозяина в виде Adobe.

                                                         

                                                        «Тонкий, мощный, холодный и с крутым экраном» — недостижимый идеал игровых ноутбуков, к которому стремятся все производители. Но из года в год они всё ближе к невозможному, казалось бы, решению этого уравнения. Сегодня изучаем новый ASUS ROG Zephyrus G16 с 4090 и OLED-экраном.

                                                         

                                                        Готовящийся к выпуску смартфон POCO F6 Pro прошёл сертификацию у регулятора NBTC. «Покопавшись» в базе данных, инсайдеры раскрыли все его технические характеристики. Сделать это было несложно — гаджет оказался копией уже представленного ранее устройства бренда Redmi.

                                                         

                                                        Samsung знаменита своими неоднозначными отношениями с зарядками: компания одной из первых перестала класть адаптеры в коробку к смартфонам, не наделяет флагманы по-настоящему быстрыми зарядками и теперь сделала ещё один необычный шаг. В продажу поступило зарядное устройство Samsung, которое удивляет своей ценой и характеристиками.

                                                         

                                                        Через пять лет после релиза Light Phone 2 разработчики гаджета выпустили третью модель серии. Она сменила экран E-Ink на OLED-панель, но во многом стала лучше и сохранила основную направленность — помогать пользователю с повседневными задачами, не давая отвлекаться на бесконечные ленты соцсетей.

                                                         
                                                        Больше не Eternal. DOOM: The Dark Ages вернётся к олдскульной традиции Популярное

                                                        В конце прошлой недели id Software явила миру DOOM: The Dark Ages — приквел DOOM (2016) и DOOM Eternal. Фанаты восторженно приняли анонс и принялись гадать, каким образом разработчики превзойдут экшен-механики Eternal. Автор проекта решил объяснить своё видение.

                                                         
                                                        Экс-сотрудник OpenAI: ИИ погубит человечество с вероятностью 70%  Популярное

                                                        Термин p(doom) обозначает вероятность того, что искусственный интеллект приведёт человечество к гибели. Дискуссии подобного формата стали предметом постоянных разногласий среди специалистов в сфере машинного обучения. Бывший сотрудник OpenAI Дэниэль Кокотайло прогнозирует, что с вероятностью 70% ИИ может привести к краху человечества.

                                                         
                                                        Новая версия Google Play замедлила смартфоны Samsung. Как это исправить? Популярное

                                                        После майского обновления клиента Google Play пользователи смартфонов Samsung начали сообщать, что их смартфоны стали работать медленнее. Вскоре компания признала проблему на своём официальном форуме и рассказала, как её исправить без каких-либо манипуляций с прошивкой.

                                                         
                                                        Названы устройства Xiaomi, Redmi и POCO, которые обновятся до Android 15 Популярное

                                                        На официальном сайте Xiaomi появились списки смартфонов брендов Xiaomi, Redmi и POCO, которые гарантированно получат обновление до Android 15. На новую версию ОС перейдут устройства с оболочкой MIUI 16, а также многие модели, которые работают под управлением HyperOS.

                                                         
                                                        Новый POCO F6 Pro с Flow AMOLED-экраном и 120-Вт зарядкой распродают по сниженной цене Популярное

                                                        Спустя неделю с момента анонса смартфон POCO F6 Pro уже можно приобрести с хорошей скидкой. Новинка получила флагманский чип Snapdragon 8 Gen 2, экран с пиковой яркостью в 4000 нит, а также тройную основную камеру с 50-мегапиксельным датчиком Light Fusion 800.