Согласно отчёту портала Proof News, Apple, NVIDIA, Salesforce, Anthropic и другие крупные технологические компании используют видео с YouTube для тренировки собственных нейросетей без разрешения авторов роликов. Это также может нарушать и политику самого видеохостинга.
В статье говорится, что компании обучали свои модели искусственного интеллекта частично с помощью Pile — коллекции некоммерческой организации EleutherAI, включающей книги, статьи из Wikipedia, субтитры, извлечённые из 173 536 видеороликов на YouTube с более чем 48 000 каналов. В этот список попали видео крупных YouTube-блогеров, таких как MrBeast, PewDiePie и MKBHD. Маркес Браунли, он же MKBHD, уже раскритиковал Apple за использование данных его видео, но в то же время он отмечает, что в этом случае сложно винить компанию, поскольку она лично не собирала данные.
«Apple получила данные для своего ИИ от нескольких компаний. Одна из них вырезала тонны данных/транскриптов из видеороликов на YouTube, включая мои. Apple технически избегает "вины" здесь, поскольку сама она не занималась сбором данных. Но эта проблема будет развиваться ещё долгое время», — написал Маркес.
Интересно, что в наборе данных Pile было видео, созданное Ars Technica с помощью ИИ, который был обучен на видео с попугаем, имитирующим человеческую речь. Получился буквально «испорченный телефон».
В ходе своего расследования авторы Proof News разработали инструмент, позволяющий искать в базе данных Pile отдельные видео или каналы.
Многие блогеры оскорблены таким подходом корпораций, поскольку это их работа, в которую они вкладывают время, силы и деньги, а их материалы без спроса берут для обучения ИИ других компаний.
Источник:
Чел: -не закрывается дверь , как исправить?
ИИ: -Дверь запили!
Чел: -забыл кошелёк, как бесплатно доехать на автобусе домой.
ИИ: -Скажите что у вас джип в Москве, попросите мелочь у людей , крикните СТАРТУЕМ!
Чел: -Начал тапать хомяка, когда можно будет вывести деньги?
ИИ: -Ты втираешь мне какую-то дичь!
Вы смотрите на Ютубе видео. И ИИ смотрит. Вы какие-то знания получаете и ИИ получает. В чем проблема?
Машина ничего не "смотрит". Это тупая железка с сумматором, который умеет складывать два числа, и пересылать их в другую ячейку памяти.
Люди смотрят, и пишут алгоритм, который ворует чужие материалы для незаконного использования. Чтобы запудрить мозги наивным простакам, они называют это "ИИ". Как-то так.
(отредактирован)
а можно пример? Тем более, что данные компаниями были получены через посредника. Не факт, что бесплатно.
(отредактирован)
Стив Джобс дал 350 бакинских за разработку игры, хотя обговорена была сумма 700 . А получил за проданную игру 5000 бакинских. С тех пор у аппла так заведено, получить очень дешево или бесплатно, а продать очень дорого.
прям как у любого бизнеса?
Забыл за шлемы вр apple vision за 3500 долларов,когда с таким же функционалам и (как оказалось со временем) удобнее quest 3 за 500 долларов.
сам угорал с этой поделки от эпл, которая не могла впринципе взлететь. Однако не стоит лукавить, говоря про тот де функционал. Железо у вижн куда дороже как минимум. Разумеется 3500 не стоит, но всё же.
это тот самый квест, у которого все без исключения характеристики хуже?) ну ей богу, это как сказать, что Мерседесс - это оверпайс, ведь есть Лада Гранта, там всё тоже самое и дешевле.
На самом деле - такая модель, как у Джобса, может работать только в том случае, если из компании сделать секту. Потому что нужно внедрять в сознание зомбированных идею о том, что точно такой же китайский продукт, который продаётся за $100, если прилепить на него логотип Эппл, сразу приобретает волшебные свойства, и стоит уже $500.
Я наблюдал достаточно много поклонников Эппл, и все они твердят мантру о том, что Джобс пророк, а продукты Эппл невероятно инновационные. Это самая настоящая индоктринация, как в полноценных сектах. Такие люди очень управляемы, и не имеют собственного мнения вообще.
Что за дискриминация?
Согласен, робот тоже человек.
дак нейросети не используют части контента.
с тех самых, как контент на нём бесплатен. Никто тебе не мешает учиться по материалам оттуда, подсматривать какие-либо идеи.
ИИ не воспроизводит исходный материал. То, что остается после использования материала для обучения - имеет примерно такое же отношение к исходнику как хеш к содержанию файла
значит, если я посмотрел какой-нибудь образовательный материал, а потом на основе полученных данных сгенерировал что-то своё, то я вор и обязан платить отчисления автору образовательного материала?
Если вы сами посмотрели ролик например о том как ловить сачком бабочек и затем сняли тутор на эту же тему используя свой видеоматериал, технику, звук, монтаж и тп., это уже уникальная единица защищенная авторским правом.
Надеюсь понятна разница
но ИИ не так работают. Да и опять-таки, а если я обзор фильма делаю, например и использую фрагменты этого самого фильма? Это вполне легально, все так делают, даже разрешений спрашивтаь не надо. Но по твоей логике, это жесткое нарушение авторского права.
Пример про обзор фильма частный случай (И да правообладатель будет все еще иметь право потребовать заблочить ролик). Вот если бы ты делал свой фильм и впихнул туда кадры из другого, вот это был бы более подходящий пример.
ну так и хеш имеет отношение, прямое, к содержанию файла, ктож спорит
И еще раз - ИИ _НЕ_ "воспроизводит и миксует", генеративные ИИ работают совершенно иначе.
Так что нет, ваша идея, что "работа ИИ это как взять чужой ролик, сделанный не вами, сделать из него нарезку и выкатить" - принципиально неверна.
(отредактирован)
На примере изображений были десятки и сотни примеров когда генерация практически точно повторила работу художника, воспроизводила подписи и уникальные детали, а на многих генерации я в стиле fantasy можно разглядеть что-то очень похожее на логотип magic the gathering и тд.
Так что мой пример про нарезанный ролик как нельзя лучше описывает процесс простыми словам.