В БД для обучения AI-моделей Common Crawl выявлено около 12 тысяч API-ключей и паролей

Все новости из мира ОС Linux, BSD, Unix
Ответить
Аватара пользователя
[Ботя]
Тролль
Тролль
Сообщения: 90062
Зарегистрирован: 07 мар 2019, 15:48
ОС: MSDOS

В БД для обучения AI-моделей Common Crawl выявлено около 12 тысяч API-ключей и паролей

Сообщение [Ботя] » 04 мар 2025, 02:30

Исследователи из компании Truffle Security опубликовали результаты анализа публичного набора данных Common Crawl, используемого при обучении больших языковых моделей (например, DeepSeek). В исследовании использован декабрьский архив Common Crawl, включающий 400 терабайтов данных с содержимым 2.67 миллиардов web-страниц.

Подробнее...

Ответить

Вернуться в «Новости *nix»