Apple и другие компании без разрешения используют YouTube-видео для обучения ИИ

Apple и другие компании без разрешения используют YouTube-видео для обучения ИИ

Согласно отчёту портала Proof News, Apple, NVIDIA, Salesforce, Anthropic и другие крупные технологические компании используют видео с YouTube для тренировки собственных нейросетей без разрешения авторов роликов. Это также может нарушать и политику самого видеохостинга.

В статье говорится, что компании обучали свои модели искусственного интеллекта частично с помощью Pile — коллекции некоммерческой организации EleutherAI, включающей книги, статьи из Wikipedia, субтитры, извлечённые из 173 536 видеороликов на YouTube с более чем 48 000 каналов. В этот список попали видео крупных YouTube-блогеров, таких как MrBeast, PewDiePie и MKBHD. Маркес Браунли, он же MKBHD, уже раскритиковал Apple за использование данных его видео, но в то же время он отмечает, что в этом случае сложно винить компанию, поскольку она лично не собирала данные.

«Apple получила данные для своего ИИ от нескольких компаний. Одна из них вырезала тонны данных/транскриптов из видеороликов на YouTube, включая мои. Apple технически избегает "вины" здесь, поскольку сама она не занималась сбором данных. Но эта проблема будет развиваться ещё долгое время», — написал Маркес.

Интересно, что в наборе данных Pile было видео, созданное Ars Technica с помощью ИИ, который был обучен на видео с попугаем, имитирующим человеческую речь. Получился буквально «испорченный телефон».

В ходе своего расследования авторы Proof News разработали инструмент, позволяющий искать в базе данных Pile отдельные видео или каналы.

Многие блогеры оскорблены таким подходом корпораций, поскольку это их работа, в которую они вкладывают время, силы и деньги, а их материалы без спроса берут для обучения ИИ других компаний.

Источник: arstechnica.com


  • istratil
    Так вроде же открытая платформа
    • Romero F.
      ИИ обучили на российских видео:

      Чел: -не закрывается дверь , как исправить?
      ИИ: -Дверь запили!

      Чел: -забыл кошелёк, как бесплатно доехать на автобусе домой.
      ИИ: -Скажите что у вас джип в Москве, попросите мелочь у людей , крикните СТАРТУЕМ!

      Чел: -Начал тапать хомяка, когда можно будет вывести деньги?
      ИИ: -Ты втираешь мне какую-то дичь!
    • strubus
      А ИИ рекламу в это время смотрел? Если да то какие проблемы? Или он через revanced смотрел?
      • Иными словами, воруют интеллектуальную собственность для своих разработок.
        • Alaska14
          SubV,
          Вы смотрите на Ютубе видео. И ИИ смотрит. Вы какие-то знания получаете и ИИ получает. В чем проблема?
          • Alaska14,
            Машина ничего не "смотрит". Это тупая железка с сумматором, который умеет складывать два числа, и пересылать их в другую ячейку памяти.
            Люди смотрят, и пишут алгоритм, который ворует чужие материалы для незаконного использования. Чтобы запудрить мозги наивным простакам, они называют это "ИИ". Как-то так.
        • Neuralink-X
          Это же цивилизованный бизнес. Получили бесплатно, продали за очень дорого. Apple всегда так поступали.

          (отредактирован)

          • BBLucky
            Neuralink-X,
            а можно пример? Тем более, что данные компаниями были получены через посредника. Не факт, что бесплатно.

            (отредактирован)

            • Neuralink-X
              BBLucky,
              Стив Джобс дал 350 бакинских за разработку игры, хотя обговорена была сумма 700 . А получил за проданную игру 5000 бакинских. С тех пор у аппла так заведено, получить очень дешево или бесплатно, а продать очень дорого.
              • BBLucky
                Neuralink-X,
                прям как у любого бизнеса?
                • Slayer2020
                  Neuralink-X,
                  Забыл за шлемы вр apple vision за 3500 долларов,когда с таким же функционалам и (как оказалось со временем) удобнее quest 3 за 500 долларов.
                  • stylez01
                    Slayer2020,
                    сам угорал с этой поделки от эпл, которая не могла впринципе взлететь. Однако не стоит лукавить, говоря про тот де функционал. Железо у вижн куда дороже как минимум. Разумеется 3500 не стоит, но всё же.
                    • BBLucky
                      Slayer2020,
                      это тот самый квест, у которого все без исключения характеристики хуже?) ну ей богу, это как сказать, что Мерседесс - это оверпайс, ведь есть Лада Гранта, там всё тоже самое и дешевле.
                • Neuralink-X,
                  На самом деле - такая модель, как у Джобса, может работать только в том случае, если из компании сделать секту. Потому что нужно внедрять в сознание зомбированных идею о том, что точно такой же китайский продукт, который продаётся за $100, если прилепить на него логотип Эппл, сразу приобретает волшебные свойства, и стоит уже $500.

                  Я наблюдал достаточно много поклонников Эппл, и все они твердят мантру о том, что Джобс пророк, а продукты Эппл невероятно инновационные. Это самая настоящая индоктринация, как в полноценных сектах. Такие люди очень управляемы, и не имеют собственного мнения вообще.
                • tipokkk
                  Итс амайзинг
                  • clawbug
                    Интересно. Значит, если я посмотрю ролик по ремонту ноутов и буду на этом зарабатывать, то всё ок. А если нейросеть посмотрит - всё, караул, нарушение.
                    Что за дискриминация?
                    • setimuy
                      clawbug,
                      Согласен, робот тоже человек.
                      • nnikitsin
                        clawbug, если ты будешь использовать ролик или его части без согласия автора получишь по шапке
                        • BBLucky
                          nnikitsin,
                          дак нейросети не используют части контента.
                      • BBLucky
                        ИИ берёт инфу с открытых источников. Ютуб, вроде как, отрытый источник. В чём проблема-то?
                        • nnikitsin
                          BBLucky, нет боты тырят все из интернета. С каких пор ютуб открытый источник, в вашем понимании? Это ресурс с авторскими контентом
                          • BBLucky
                            nnikitsin,
                            с тех самых, как контент на нём бесплатен. Никто тебе не мешает учиться по материалам оттуда, подсматривать какие-либо идеи.
                        • WR4IITH
                          Использование видео с YouTube для тренировки нейросетей без разрешения авторов поднимает серьезные вопросы. Во-первых, это нарушение авторских прав и условий использования платформы. Во-вторых, это неэтично и может негативно сказаться на репутации компаний. Компании должны использовать только те данные, на которые получено явное разрешение, чтобы избежать юридических и этических проблем.
                          • Двинутый
                            А то что 99% блогеров воруют идеи просматривая ролики про это все молчат.
                            • nnikitsin
                              Двинутый, на идею нет распространяется авторское право, с оговоркой. На контент автора распространяется. ИИ воспроизводит именно авторский материал, который ему скормили, часто идентично. Это как пиратство
                              • dmdimonof
                                nnikitsin,
                                ИИ не воспроизводит исходный материал. То, что остается после использования материала для обучения - имеет примерно такое же отношение к исходнику как хеш к содержанию файла
                                • nnikitsin
                                  dmdimonof, то что останется после имеет прямое отношение к исходнику. ИИ воспроизводит и миксует только то что видел, включая и водяные знаки, подписи, узнаваемых людей, чужие IP и тд.
                                  • BBLucky
                                    nnikitsin,
                                    значит, если я посмотрел какой-нибудь образовательный материал, а потом на основе полученных данных сгенерировал что-то своё, то я вор и обязан платить отчисления автору образовательного материала?
                                    • nnikitsin
                                      BBLucky, нет. Если упростить весь процесс до абсурда на примере ролика, то работа ИИ это как взять чужой ролик, сделанный не вами, сделать из него нарезку и выкатить. На деле все гораздо сложнее, естественно, и ИИ не опирается на единичный материал, в его датасете миллионы материала.

                                      Если вы сами посмотрели ролик например о том как ловить сачком бабочек и затем сняли тутор на эту же тему используя свой видеоматериал, технику, звук, монтаж и тп., это уже уникальная единица защищенная авторским правом.

                                      Надеюсь понятна разница
                                      • BBLucky
                                        nnikitsin,
                                        но ИИ не так работают. Да и опять-таки, а если я обзор фильма делаю, например и использую фрагменты этого самого фильма? Это вполне легально, все так делают, даже разрешений спрашивтаь не надо. Но по твоей логике, это жесткое нарушение авторского права.
                                        • nnikitsin
                                          BBLucky, ИИ так и работает, юзает все что есть в датасете не больше и не меньше.

                                          Пример про обзор фильма частный случай (И да правообладатель будет все еще иметь право потребовать заблочить ролик). Вот если бы ты делал свой фильм и впихнул туда кадры из другого, вот это был бы более подходящий пример.
                                    • dmdimonof
                                      nnikitsin,
                                      ну так и хеш имеет отношение, прямое, к содержанию файла, ктож спорит
                                      И еще раз - ИИ _НЕ_ "воспроизводит и миксует", генеративные ИИ работают совершенно иначе.
                                      Так что нет, ваша идея, что "работа ИИ это как взять чужой ролик, сделанный не вами, сделать из него нарезку и выкатить" - принципиально неверна.

                                      (отредактирован)

                                      • nnikitsin
                                        dmdimonof, ИИ буквально не миксует материал на котором обучался. Он способен воспроизводить очень похожий материал, где может угадывается первоисточник.

                                        На примере изображений были десятки и сотни примеров когда генерация практически точно повторила работу художника, воспроизводила подписи и уникальные детали, а на многих генерации я в стиле fantasy можно разглядеть что-то очень похожее на логотип magic the gathering и тд.

                                        Так что мой пример про нарезанный ролик как нельзя лучше описывает процесс простыми словам.
                              • Vaqtincha
                                Эпол умеет зарабатывать на г#вне.
                                • rarina
                                  Выложили в открытый доступ и негодуют об авторских правах.. Твое у тебя в кармане.
                                  • Yan_Ter
                                    Непонятно, что тут возмутительного. Нейросеть указывает источники в конце ответа

                                    В сети разгораются споры о новом лицензионном соглашении Adobe: согласно ему, весь контент художников в Photoshop, 3D-моделлеров в Substance 3D и других профессионалов обретает второго хозяина в виде Adobe.

                                     
                                    Обзор vivo X100 Ultra: крутой камерофон глазами зарубежных СМИ
                                    56
                                    9.07.24News

                                    Вышедший в конце прошлого года vivo X100 Pro собрал дифирамбы в адрес своей камеры, поэтому от Ultra ожидания были очень высокими. Удалось ли производителю переплюнуть себя в плане фотосъёмки? Мы изучили зарубежные обзоры и готовы рассказать, что представляет собой vivo X100 Ultra.

                                     
                                    <div></div><div></div><div></div><a href='/2024/09/12/7307307/' target='_blank'><img src='https://i.4pda.ws/s/as6ywue3S4wsjFGg0z2I2iyY7kHEE0EmiXkPLY783uK3Miqm98HafRECC.jpg' title='' /></a><div ><img src='https://4pda.to/s/as6yu42hlyXjD7kQLqbvVMOGid.gif' /></div><div></div>

                                    Недавно бренд POCO представил недорогой геймерский смартфон POCO F6, который сейчас можно приобрести по сниженной цене. Новинка оснащена производительным чипом серии Snapdragon 8, ярким AMOLED-эконом и двойной камерой с высоким разрешением.

                                     

                                    Кастомная прошивка LineageOS 21 вышла для нескольких новых, но устаревших смартфонов. В список попали гаджеты от LG, realme, Xiaomi и Motorola, и в некоторых случаях устройства уже давно не видели новых версий ОС.

                                     

                                    Новый iPhone 16 поступит в продажу на следующей неделе, но уже известно, сколько он будет стоить в разных уголках мира. Портал Android Authority проанализировал цены на смартфон на официальном сайте Apple для разных стран, выяснив, где он стоит меньше и больше всего.

                                     

                                    Согласно появившейся информации, ситуация с замедлением работы YouTube в России может разрешиться уже до конца этой недели. Об этом, ссылаясь на слова знакомых с ситуацией источников, сообщил главный редактор Mobile Research Group Эльдар Муртазин.

                                     

                                    Компания Google представила свой аналог сервиса Apple Find My для поиска потерянных смартфонов. Он работает без подключения к интернету, а некоторые гаджеты серии Pixel будут подавать «сигнал SOS» даже при выключенном питании. Представители компании рассказали главные подробности о новой технологии.

                                     

                                    Сотрудники Политехнического института SUNY в Нью-Йорке представили покрытие, способное свести к минимуму трение в металлических деталях. Открытие позволит производителям добиться большей экономии топлива и увеличить срок службы движущихся компонентов в технике.

                                     

                                    Компания Ookla (разработчик приложения Speedtest) опубликовала актуальный рейтинг скорости мобильного интернета. За год Россия поднялась на 10 пунктов, заняв 86-ю строчку. Но улучшение позиции не связано с ростом качества инфраструктуры.

                                     
                                    Очень старым iPad нашли полезное применение Популярное

                                    Выпущенный в 2012 году iPad третьего поколения, также именуемый The New iPad или iPad Retina, уже давно лишился поддержки и не способен запускать современные приложения и игры. И всё же китайские умельцы сумели найти ему полезное применение.

                                     

                                    Помимо смартфона и планшета, OnePlus представила новую модель умных часов. Они получили производительный процессор от Qualcomm, поддержку мобильных сетей, улучшенные функции навигации и множество дополнительных функций.

                                     

                                    Ценители Fallout, подобно фанатам The Elder Scrolls, жуть как любят делать модификации. К сожалению, самым амбициозным из таких проектов почему-то не везёт — производству Fallout: London, например, ненароком помешала Bethesda Softworks. И, как выяснилось, это ещё не самый интересный подобный кейс.

                                     

                                    Google призвала владельцев Android-смартфонов отключить сети второго поколения. Связано это с их низкой безопасностью, из-за чего мошенники могут отправлять на устройства поддельные текстовые сообщения от имени разных крупных компаний.

                                     

                                    Некоторые пользователи Windows 11 пожаловались на странную работу одной из системных служб, которая отбирает у процессора до 10% мощности без видимых причин. Официального решения у проблемы пока нет — но энтузиасты уже вычислили «виновника» и нашли способ исправления досадного бага.

                                     

                                    Бывшая головная компания «Яндекса», нидерландская Yandex N.V., закрыла сделку по продаже российской части бизнеса консорциуму частных инвесторов. Процесс разделения технологической корпорации, который стартовал ещё в 2022 году, наконец завершился.

                                     

                                    Telegram активно продвигает использование криптовалюты среди пользователей, чем ожидаемо решили воспользоваться мошенники. С помощью фишинговых ботов злоумышленники крадут цифровые активы людей, которые были куплены в P2P-маркете внутри мессенджера.

                                     
                                    YouTube препятствует массовому переносу видео на российские площадки Популярное

                                    Издание Runet, ссылающееся на близкие к крупным российским видеохостингам источники, сообщает, что компания Google начала вводить технические меры, препятствующие массовому переносу или скачиванию роликов с YouTube. Эту информацию подтвердили разработчики видеохостинга «Платформа» и руководитель Ассоциации профессиональных пользователей соцсетей и мессенджеров Владимир Зыков.

                                     
                                    Apple объявила дату выпуска iOS 18 и iPadOS 18. Какие устройства обновятся? Популярное

                                    Во время презентации iPhone 16 компания также сообщила, когда другие смартфоны и планшеты компании обновятся до iOS 18 и iPadOS 18. Заодно стал известен точный список фирменных устройств, которые в этом году гарантированно получат обновление прошивки.

                                     

                                    Компания Илона Маска xAI представила Grok 2 — новейшую ИИ-модель, которая по вычислительной мощности значительно превосходит GPT 4 Turbo и Amazon Claude. Платформа включает раннюю предварительную версию Grok 2 и Grok 2-mini, обе из них будут доступны пользователям социальной сети X.

                                     
                                    Представлены умные гантели Julu, меняющий свой вес Популярное

                                    Компания Julu Smart Tech представила умные регулируемые гантели с поддержкой цифровых функций. Разработка способна менять свой вес в диапазоне от 2,7 кг до 16,3 кг, поэтому подойдёт как для лёгких тренировок с малой нагрузкой, так и для интенсивных занятий.

                                     

                                    OnePlus провела презентацию новых гаджетов, представив смартфон Nord 4. Технически это клон ранее выпущенного в Китае OnePlus Ace 3V, но только в совершенно ином дизайне. Главной фишкой аппарата вполне можно считать цельнометаллический корпус, что стало большой редкостью в последние годы.

                                     

                                    Сотрудники Университета Шеффила, Великобритания, успешно испытали первый в мире жидкостный ракетный двигатель, полностью спроектированный искусственным интеллектом и напечатанный на 3D-принтере. Удивительно, но он заработал с первой попытки.

                                     

                                    Жуткий хоррор про аниматроников Five Nights at Freddy's уже давно успел стать культовым, а франшиза обзавелась множеством спин-оффов и даже полноценной экранизацией. Теперь поклонников роботов ждёт новое приключение.

                                     

                                    Астрофотограф Мигель Кларо поделился завораживающей фотографией Солнца. Мужчина из Португалии на профессиональном уровне создаёт впечатляющие изображения ночного неба. Недавно ему удалось получить снимки корональных выбросов Солнечной массы.

                                     

                                    Несмотря на многочисленные достоинства, вроде настоящего чёрного цвета, энергоэффективности, низкого времени отклика и малой толщины, у OLED-панелей есть ряд важных недостатков, главный из которых — выгорание пикселей. Похоже, что компании LG удалось решить эту проблему.

                                     
                                    Сверхзвуковой самолёт XB-1 успешно протестировали в небе Популярное

                                    Компания Boom Supersonic завершила новые испытания прототипа сверхзвукового пассажирского самолёта XB-1. 26 августа 2024 года ему удалось подняться в воздух под управлением лётчика-испытателя Тристана Бранденбурга. Стартап успешно протестировал системы управления воздушного судна. 

                                     

                                    В первую тройку мировых чартов музыкального сервиса Spotify вошла песня, сгенерированная искусственным интеллектом. Точнее она представляет собой пародийную композицию, которая среди немецких СМИ получила крайне негативные отзывы.

                                     

                                    Три месяца назад компания Neuralink впервые в истории вживила чип 29-летнему пациенту по имени Ноланд Арбо. Спустя ровно сто дней стартап Илона Маска сообщил, что часть мозгового импланта вышла из строя. Из-за этого компании пришлось срочно обновлять программное обеспечение.

                                     

                                    В этом выпуске Инсайдов: Samsung откажется от «угловатого дизайна» в Galaxy S25 Ultra; iPhone 18 Pro и 18 Pro Max могут получить 2 ТБ памяти; Xiaomi 14T Pro протестировали в бенчмарке.

                                     

                                    По информации издания «Коммерсантъ», китайская TCL приняла решение прекратить производство своих телевизоров в России из-за угрозы наложения санкций со стороны США и ЕС. Компания уже перестала поставлять компоненты российским контрактным производителям «Квант» и STI Group.

                                     

                                    Авторы YouTube-канала RetroGamingBase провели необычный эксперимент. Блогеры превратили классический ЭЛТ-монитор в «киберспортивный» с частотой обновления, превышающей возможности современных игровых флагманов. Правда, без подводных камней такой «разгон» всё же не обошёлся.

                                     

                                    Китайские суперфлагманы — особая категория устройств. В Россию они обычно попадают благодаря маркетплейсам и перекупщикам, а на улице вызывают неподдельный интерес — слишком уж редки они для наших широт. В редакцию приехал OPPO Find X7 Ultra. Это топовый смартфон, который получил едва ли не самый продвинутый набор камер в мире.