
Компания OpenAI заявила, что китайское приложение DeepSeek, завоевавшее популярность, возможно, скачало огромные объемы данных для создания своих моделей без согласия. Это обвинение поднимет вопросы о правилах использования данных и прав оригинальных создателей в мире искусственного интеллекта.
Сам Альтман, руководитель OpenAI, утверждает, что у них есть «некоторые доказательства» того, что DeepSeek использовала выходные данные моделей OpenAI для обучения своих собственных моделей с помощью метода, известного как «дистилляция».
Исследователи безопасности Microsoft, которая владеет 49% акций OpenAI, заметили осенью прошлого года, что группы, связанные с DeepSeek, извлекали значительные объемы данных, используя API OpenAI.
Представитель OpenAI Лиз Буржуа отметила: «Мы знаем, что группы в Китайской Народной Республике активно работают над использованием методов, включая так называемую дистилляцию, для воспроизведения продвинутых моделей ИИ из США». Она добавила, что компания уже проводит внутреннее расследование и будет продолжать принимать меры для защиты своей технологии.
Китайский стартап DeepSeek на этой неделе вызвал сильное волнение в мире технологий, когда его чат-бот достиг вершин App Store, при этом его создатели утверждают, что на разработку было выделено всего 6 миллионов долларов. Несмотря на запреты на продажу микросхем Nvidia в Китай, запуск DeepSeek R1 ставит под сомнение представления о том, что стартапы в Китае отстают от американских.
Многие считают ироничным, что OpenAI, которая сама использовала большие объемы данных без разрешения, теперь жалуется на подобные практики в адрес другой компании.
OpenAI, управляющая такими проектами, как ChatGPT и генератор изображений DALL-E, также заявила, что невозможно обучать модели без использования защищенного авторским правом контента, и сейчас она вовлечена в несколько судебных разбирательств по нарушениям авторских прав.