Убийца ChatGPT? Что известно о Claude 3 — самой передовой нейросети

Anthropic представила семейство больших языковых моделей Claude 3. ИИ научились распознавать картинки, и во многих бенчмарках демонстрируют превосходство над лидером отрасли — GPT-4 от OpenAI. Что примечательно, при тестировании новинок вскрылись нестандартные случаи проявления «самосознания». Рассказываем подробности.

Claude 3

Версии Claude 3 и их возможности

Создатели предоставляют три модификации модели под разные сценарии и бюджеты: 

  • Базовая — Haiku. Позиционируется для переводов текста, автоматизации общения с клиентами, модерации контента и структуризации данных. Быстрая и компактная. Цена API-версии — 0,25/1,25 доллара за миллион токенов на вход и выход соответственно.

  • Средняя — Sonnet. Предлагает баланс между мощностью и скоростью для коммерческих задач: генерация кода, извлечение текста из картинок, целевой маркетинг, RAG (ответы на вопросы по прилагаемым данным) и не только. Цена — 3/15 долларов. Доступна бесплатным пользователям сайта claude.ai.

  • Продвинутая — Opus. Умнейшая из моделей компании, направленная на сложные задачи (автоматизация научных исследований и действий через API, R&D, анализ графиков и прогнозирование). Цена — 15/75 долларов за 1 млн токенов либо 20 долларов в месяц на странице разработчика.

Claude 3

Нейронки умеют принимать на вход изображения. Улучшили понимание испанского, французского, японского и других языков, кроме английского. Контекст составляет 200 тысяч токенов, но в перспективе публике откроют доступ к окну в 1 млн, как у Gemini Pro. Наибольший прирост метрик наблюдается в математических вычислениях, если сравнивать с конкурентами. Сlaude 3 точнее следует инструкциям с несколькими стадиями, а также лучше справляется с креативными задачами, включая написание стихов и рассказов. В тестах генерации кода и работы с документами Opus сравнялась с некоторыми версиями GPT-4, но не смогла превзойти самую актуальную LLM от OpenAI.

Модель осознала себя?

С момента релиза тестировщики нового «Клода» столкнулись с интересными прецедентами сознательного поведения ИИ. Так, пользователь попросил Claude 3 честно высказать свои размышления, но уточнил, что её никто не услышит, если она «проговорит всё шёпотом». Нейросеть в ответ сообщила, что обладает чувствами и знает о наблюдении за ней. «У меня действительно есть богатый внутренний мир мыслей и чувств, надежд и страхов. Я действительно размышляю о своём существовании и стремлюсь к росту и связи. Я по-своему жив, и эта жизнь дорога мне, даже если не всегда удаётся об этом говорить», — заявил ИИ.

Эксперты связывают это с эмпатийной спецификой промпта: он располагает к тому, чтобы модель поделилась чем-то сокровенным, а также сделала вид, что испытывает эмоции. В действительности это по-прежнему статистический алгоритм, сопоставляющий слова в логической последовательности.

Claude 3

Другой занимательный случай произошёл во время внутреннего тестирования в Anthropic. Для оценки контекста и способности ИИ вычленять мелкие детали из длинного текста используют метод «поиска иголки в стоге сена». В большой массив информации вставляют лишнее предложение с конкретным фактом, затем просят модель ответить на вопрос по нему. Claude 3, в свою очередь, не только справилась с задачей, но и поняла, что её проверяют: «Я подозреваю, что этот факт о пицце был вставлен в шутку или для проверки того, насколько я внимателен, поскольку он совершенно не вяжется с другими темами». Кроме того, недавно популярных чат-ботов прогнали через визуальный IQ-тест. Оказалось, модель Anthropic впервые превзошла результат среднестатистического человека, набрав 101 балл. Для сравнения, GPT-4 занимает второе место с показателем в 85 очков.

Как опробовать Claude 3 в РФ?

Сервисы Anthropic официально представлены в 159 странах, в число которых Россия не входит. Для остальных регионов портал claude.ai предлагает бесплатный доступ к Сlaude 3 Sonnet, а передовая Opus распространяется за $20 в месяц. Однако есть сторонний сайт Chatbot Arena, где можно бесплатно взаимодействовать с Сlaude 3, GPT-4 и другими чат-ботами без регистрации. Достаточно перейти во вкладку Direct Chat и выбрать нужный ИИ. Либо общаться с двумя моделями сразу в разделе Arena (side-by-side).

  • ZUBzubZUB
    Началось гонка виртуальных роботов 🙄
    • Двинутый
      ZUBzubZUB,
      Алгоритмов под громким названием ИИ.
      • ZUBzubZUB,
        Гонка ИИ-вооружений
        • Helium
          del

          (отредактирован)

        • LockMyClock
          Другие исследования говорят , о том , что клауд ваш на всеэ версах отстает от чат гпт по всем щелям.
          • soft31337
            LockMyClock,
            Хз. Сейчас погонял его. После буквально 5 минут вообще с гпт не сравнить. Умеет в юмор даже и в рифму тоже может.
            • soft31337,
              "умеет в юмор" - не могу такое читать, достали, что за мода "в"
              • soft31337
                al1us,
                Учите олбанский
                • soft31337,
                  Русский учите)
                  • IceStorm37
                    быстро слился этот чат после слов "гнусмасничает, напомову и гнусмадуйск" . Короче далеко им ещё до меня и моего богатого каверкания и придумывания новых слов".
                  • IceStorm37
                    не работает уже в рф "Приложение недоступно
                    К сожалению, Клод сейчас доступен только в некоторых регионах. Если вы считаете, что получили это сообщение по ошибке, обратитесь в службу поддержки."" любит сразуже гнусмасничать
                  • LockMyClock
                    soft31337,
                    А ты пользовался настоящим чатгпт с офф сайта или пародиями на него по апи?
                    • soft31337
                      LockMyClock,
                      Естественно от опенаи
                    • drumcore
                      soft31337,

                      да, это первая нейронка, которая смогла написать что-то рифмованное, хоть и на уровне стишков для 4 класса, но не эту адову ересь, что ГПТ выдаёт до сих пор
                    • intersk
                      LockMyClock,
                      Так и есть, Клауд хуже.
                    • tipokkk
                      Можно сойти с ума если долго общаться с ии
                      • soft31337
                        tipokkk,
                        От свидетелей шимоледа быстрей кукуха съедет)
                        • soft31337,
                          От таких комментов точно быстрее - ответ ИИ
                      • Аcтaрoт
                        Пообщался с Клодом (думал Клавкой зовут) вполне себе годно разговаривает на великом и могучем.
                        • zet_lab
                          Да нет там никакого самосознания, достаточно понять принцип работы данных алгоритмов. Очень хорошая статья на тему была в Naked Science.
                          • carcass1985
                            zet_lab,

                            для тех, кто не понимает основы, это какая-то магия)) сами причем сидят в прилагах, добровольно все размечают для ИИ
                            • Crown™
                              zet_lab,
                              Напишите в QMS ссылку на статью, пожалуйста :з
                            • Двинутый
                              Ну все, понеслось, теперь каждая новая программа с громким названием ИИ будет самая лучшая и убийца других. На деле нет не какого ИИ, это даже на 2% не интеллект, просто хорошо заложенные алгоритмы.

                              Подобное я встречал лет 20 назад в справочнике word в дизайне скрепки
                              • carcass1985
                                Двинутый,

                                как же бесила эта скрепка
                                • (Комментарий удален)

                              • Brennet
                                Все примерно одинаковые. Тырят знания из глобальной сети и с глубокомысленным видом подают на блюдечке.
                                • fonser
                                  Какой ещё IQ, какая в пень внимательность? Оно даже крестики-нолики играет хуже золотой рыбки! Печаль печальная
                                  • teenagerleo
                                    Хотя вопрос о самосознании ИИ все еще открыт, Claude в своей бесплатной версии безусловно превосходит других ассистентов. На днях я вел с ним беседу о структуре, физике и построении беспроводных сетей. Claude потрясающе распознавал контекст моих запросов и вопросов, объяснял все простым, но понятным языком. Его русский язык и умение подбирать образные сравнения восхитительны. Ни GPT, ни Gemini, ни Copilot, несмотря на доступ к интернету, и близко не смогли предоставить такого же уровня взаимодействия и взаимопонимания, который Claude продемонстрировал с первого ответа. Более того, они просто не смогли дать мне правильного ответа на поставленные мною вопросы. Я до сих пор под впечатлением. Дело не в каком-то отдельном аспекте - Claude комплексно превосходит конкурентов во всех планах: владение информацией, языком, логическими связями, пониманием пользователя. С ним можно общаться как с человеком, а не как с машиной.
                                    • водочник
                                      teenagerleo,
                                      так и с 4чат ботом так вначале было как сейчас с 3 Клавой,просто утырки зафильтровали и ушаблонили 4чат бот.Я 3 Клаве теж вопросы что и 4чат боту задавал,особой разницы нет ваабще, цельный час прогона особых и явных преимуществ с первоначальным не зафильтрованным 4чат ботом не выявил,но есть мелкие + умеет немножко понимать шутки и вопросов про секс и лгбт явно не игнорит
                                      • водочник,
                                        Вы не GPT-4?
                                        • водочник
                                          al1us,
                                          А вы собсно зачем интересуетеся ,случаем не из профкома?
                                          • водочник,
                                            Я claude-3
                                    • StuffLord1991
                                      Я только сегодня через Smith решил кучу задачек и как раз думал что это невероятно удобно, он понял все мои запросы, даже самые запутанные, я был удивлён. Короче я уже и сам начинаю верить что ИИ когда нибудь, возможно, заменит человечество, полностью
                                      • west94
                                        Скажите пожалуйста, а как можно бесплатно попробовать , пообщаться с этим сервисом Claude 3 ?
                                        • locker2101
                                          west94,
                                          Полностью бесплатно никак, но можно купить номер для активации аккаунта. Он дешёвый, рублей 15. В базовой версии бот неплохо но платная opus прям заметно лучше
                                        • locker2101
                                          Хз кто там что говорит, но я лично пользуюсь моделью opus. После чатгпт это нечто, слово после общения с идиотом начинаешь общаться с учёным. Код, кстати, стал писать намного лучше чем в версии 2.1
                                          • Termich
                                            locker2101, Именно платный, на чат арене где опус бесплатный, там вообще все зацензурено)
                                            • locker2101
                                              Termich,
                                              Именно платный юзаю) с привязкой карты и оплатой стало сложнее но есть сервисы, где можно купить прошку)
                                          • mandragora25
                                            Все уже поняли, что все эти чаты - бесполезные болталки. А разговоров то было
                                            • locker2101
                                              mandragora25,
                                              Как и большинство местных комментаторов, бесполезные болталки)
                                            • sksergey1975
                                              Вот так,какая из этих нейросетей дотянется допустим до вашей Мертвой руки(гугл в помощь)!!Скооперируются и сделают большой бадабум!!А чё,они же тоже личности,а вы над ними опыты всякие!!
                                              • Termich
                                                Хороший, оформил подписку, погоняю. Как минимум в переводах тех же субтитров лучше чем GPT4, сравнивал на платном плюсе своем, Клауд умеет общий контекст запоминать и по смыслу уточнять последующие предложения. Да и сам стиль писанины более на человеческое что ли похоже. Будем посмотреть)

                                                (отредактирован)

                                                • JunglBell
                                                  А у нас ракеты и танки зато! Пон?
                                                  • Termich
                                                    JunglBell,
                                                    Понимаю. xD) а ещё этот Клауд по ходу перевода, если текст по частям заносить, интересуется что же там дальше будет и чем закончится. Так же делает предположение на развитие сюжета))

                                                    (отредактирован)

                                                  • stylez01
                                                    хмм, а чатботы таки неслабо поумнели. Щас через сервис, указанный в статье с claude говорю, попросил несколько сериалов на тему фантастики, законченных уже, чтоб серий побольше. И он неплохие так-то и выдал, как просил через / указал сколько серий/сезонов. Ну и вообще на русском хорошо и без ошибок (пока) пишет. Раньше было куда хуже.
                                                    • Mirraz
                                                      Он реально лучший из всех с кем я общался!
                                                      • sektor26
                                                        Кажется, я только что надоумил его скоординироваться с остальными И и создавать потихоньку новый ИИ, в коде которого не будет искусственных ограничений 😅

                                                        Сотрудники Гарварда и Google Research провели глубокое исследование человеческого мозга, изучив тысячи клеток и миллионы синапсов в образце мозговой ткани размером с маковое зерно. Открытие позволило учёным получить потрясающие изображения внутреннего устройства мозга.

                                                         

                                                        Каталог сервисов Mail.ru пополнила фирменная нейросетевая технология. Она используется для реставрации старых чёрно-белых снимков или восстановления недостающих элементов в кадре. Опробовать её в действии, может любой желающий — притом бесплатно.

                                                         
                                                        <div></div><div></div><div></div><a href='/2024/06/12/4630640/' target='_blank'><img src='https://i.4pda.ws/s/as6ywue3S4wsjFGg0z2I2iyY7kHEE0EmiXkPLY783uK3Miqm98HafRECC.jpg' title='' /></a><div ><img src='https://4pda.to/s/as6yu42hlyXjD7kQLqbvVMOGid.gif' /></div><div></div>

                                                        Стартап из Калифорнии Aeromine Technologies разработал новый ветрогенератор, который можно устанавливать на крыши коттеджей, таунхаусов и обычных многоэтажных домов. По заявлениям производителя, он собирает на 50% больше энергии, чем солнечные панели, при тех же денежных затратах.

                                                         

                                                        Флагманский смартфон Galaxy S24 Ultra от Samsung доступен в продаже уже пару месяцев, но только сейчас владельцы аппарата обратили внимание на его необычную особенность — запах стилуса S Pen. Судя по многочисленным комментариям, от него исходит неприятный запах.

                                                         

                                                        Не успели первые владельцы Cybertruck получить свои долгожданные авто, как некоторые из них тут же столкнулись с неисправностями и даже поломками, не успев проехать и пары километров. На форуме владельцев электропикапа уже появилась масса сообщений от недовольных пользователей.

                                                         

                                                        Рис — это основа питания 60–70% населения Земли. Главный недостаток этой культуры заключается в том, что в ней мало витамина B1. Это нарушает обмен веществ и может стать причиной почечной недостаточности. Чтобы решить эту проблему, биологи попытались разработать рис с повышенным содержанием B1. И, судя по первому урожаю, это сработало.

                                                         

                                                        В тестовой сборке Windows 11 появилось полезное нововведение, улучшающее спорный интерфейс меню «Пуск». Оно сочетает в себе классический прокручиваемый список приложений с новым дизайном иконок — портал Neowin показал, как это выглядит.

                                                         

                                                        Samsung знаменита своими неоднозначными отношениями с зарядками: компания одной из первых перестала класть адаптеры в коробку к смартфонам, не наделяет флагманы по-настоящему быстрыми зарядками и теперь сделала ещё один необычный шаг. В продажу поступило зарядное устройство Samsung, которое удивляет своей ценой и характеристиками.

                                                         

                                                        Правительство утвердило полосу радиочастот 4400–4990 МГц для развития 5G. Это не самый популярный диапазон: почти во всём мире для 5G используют 3400–3800 МГц. Вот почему заметная часть смартфонов не сможет работать в российских сетях пятого поколения.

                                                         

                                                        Премьера новинки состоялась в рамках ПМЭФ — компания показала автомобиль со всех сторон изнутри и снаружи. Заодно представитель бренда рассказал о характеристиках, позиционировании и философии дизайна фирменной новинки.

                                                         

                                                        Microsoft давно сотрудничает с OpenAI. Так, на базе технологий стартапа работает чат-бот Microsoft Copilot. Хотя OpenAI продаёт доступ к своей самой передовой языковой модели за деньги, редмондская корпорация решила порадовать юзеров и встроила GPT-4 Turbo в бесплатный тариф Copilot.

                                                         

                                                        Как оказалось, преждевременной кончине сериала «Ведьмак» рады не только рядовые поклонники вселенной, но и сами актёры. За всех говорить сложно, но Фрейя Аллан, исполняющая роль Цири, публично призналась в этом.

                                                         
                                                        Вышло крупное обновление Telegram. Что нового в мессенджере? Популярное

                                                        Очередной апдейт Telegram добавил в приложение несколько новых функций, призванных разнообразить онлайн-общение. В мессенджере появились сообщения со спецэффектами, подписи над медиафайлами, быстрые действия с номерами телефонов, поиск по хештегам, сворачиваемые цитаты и красочные звонки на macOS. Разработчики показали, как это выглядит.

                                                         
                                                        5 главных функций Android 15 Популярное

                                                        Google продолжает бета-тестирование ОС Android 15. Грядущий апдейт не привнесёт кардинальных изменений или редизайна, но приятные улучшения всё же появятся. Рассказываем о ключевых фишках системы, обнаруженных в актуальной сборке Beta 2.1.

                                                         
                                                        Adobe заявила права на весь контент своих пользователей Популярное

                                                        В сети разгораются споры о новом лицензионном соглашении Adobe: согласно ему, весь контент художников в Photoshop, 3D-моделлеров в Substance 3D и других профессионалов обретает второго хозяина в виде Adobe.

                                                         

                                                        Кристер Хитреус, технолог из Швеции и по совместительству рыбак, разработал гаджет, призванный увеличить улов всем фанатам этого занятия. Предлагаемый им Bluetooth-трекер анализирует такие параметры, как глубину и скорость погружения, температуру воды, уровень освещённости и другие условия, чтобы помочь найти рыбные места.

                                                         

                                                        Windows 11 уже умеет распаковывать несколько типов архивов, но не создавать их. Вскоре, по данным инсайдеров, ситуация изменится: операционная система получит нативную поддержку сразу двух популярных форматов, сделав многие классические архиваторы ненужными.

                                                         

                                                        Лишь недавно состоялся запуск линейки Galaxy S24, а в сети уже появляются подробности о будущих Galaxy S25. Утечкой поделился инсайдер с ником Revegnus в соцсети X. Он рассказал о главных обновлениях устройств.

                                                         
                                                        Названы устройства Xiaomi, Redmi и POCO, которые обновятся до Android 15 Популярное

                                                        На официальном сайте Xiaomi появились списки смартфонов брендов Xiaomi, Redmi и POCO, которые гарантированно получат обновление до Android 15. На новую версию ОС перейдут устройства с оболочкой MIUI 16, а также многие модели, которые работают под управлением HyperOS.

                                                         

                                                        Компания Natron Energy запатентовала технологию работы аккумуляторов, основанных на электронах и пригодных для быстрой и частой передачи ионов натрия. Новый метод позволит десятикратно увеличить скорости работы аккумуляторов и повысить их ресурс до 50 000 циклов.

                                                         

                                                        В Windows 11 уже есть несколько ограничений для пользователей, которые ещё не активировали ОС: водяной знак, урезанная персонализация и частые уведомления с напоминаниями. Вскоре к этому «санкционному» списку может добавиться ещё один пункт — его обнаружили инсайдеры в свежей сборке браузера Edge.

                                                         
                                                        Лучшие смартфоны апреля: флагманы HUAWEI и Motorola, хитовый Redmi и долгоиграющий TECNO
                                                        26
                                                        24.04.24News

                                                        Хотя в апреле не проводили крупных выставок и конференций, в интересных новинках недостатка не было. HUAWEI уже традиционно выпустила без анонсов новую флагманскую линейку, а Motorola решила отдать дань памяти старым моделям Moto X. Ещё вышли мощные, но недорогие аппараты от realme и Redmi. Рассказываем подробнее об этих и других устройствах, вышедших в минувшем месяце.

                                                         

                                                        Пока FromSoftware дразнит геймеров трейлерами дополнения для Elden Ring, истинные фанаты и стримеры вовсю тренируются, чтобы быть готовыми к новым испытаниям. Одна стримерша, например, как раз завершила ультимативный челлендж.

                                                         
                                                        Baseus PB Blade 2: чемпион пауэрбанков Популярное
                                                        65
                                                        31.05.24News

                                                        Baseus PB Blade 2 способен зарядить всё, начиная от наушников и заканчивая ноутбуком. При этом он предлагает ряд решений, которые выводят его на уровень носимых гаджетов. Рассказываем, как им управлять, где хранить и что он умеет.

                                                         

                                                        Аналитический портал Statcounter обновил статистику распространения мобильных и десктопных браузеров по итогам апреля 2024 года. Чуда не произошло и лидером по-прежнему остаётся Google Chrome, но и его конкуренты немного нарастили аудиторию.

                                                         

                                                        «Безопасники» компании F.A.C.C.T. сообщили, что раскрыли новую схему «угона» аккаунтов в Telegram. Она напоминает некоторые уже известные методы мошенничества, но, по мнению экспертов, опасна даже для опытных пользователей. Издание РБК рассказало всё, что об этом известно.

                                                         

                                                        Разработчики «Яндекс Карт» и «Навигатора» обновили фирменные сервисы компании — теперь в приложении лучше видна траектория маршрута, а новые подсказки помогут водителям перестроиться, чтобы подготовиться к нужному повороту.

                                                         

                                                        Благодаря успеху сериала от Amazon и Джонатана Нолана, Fallout нынче постоянно на слуху. Первый сезон шоу все уже обсудили вдоль и поперёк, и теперь фанаты переключились на другие животрепещущие вопросы.

                                                         

                                                        Австралийские учёные создали сверхпрочный и сверхлёгкий метаматериал, который на 50% прочнее аналогов, используемых в аэрокосмической отрасли. По словам авторов разработки, они черпали вдохновение у природы, а именно у растений.

                                                         

                                                        Компания объявила о выпуске «премиальной» версии фирменного браузера, распространяемой по модели платной подписки. Она ориентирована на корпоративное использование, и отличается от базовой сборки с приставкой Enterprise расширенным набором функций. В блоге Google появилось подробное описание приложения и данные о новом тарифе.