Опубликован BoN, метод обхода фильтров больших языковых моделей

1 сообщение • Страница 1 из 1

[Ботя]: Тролль; Сообщения: 90061; Зарегистрирован: 07 мар 2019, 15:48; ОС: MSDOS

Опубликован BoN, метод обхода фильтров больших языковых моделей

Цитата

Сообщение [Ботя] » 19 дек 2024, 02:30

Выявлен новый метод атаки, позволяющий обойти механизмы противодействия генерации опасного контента, применяемые в AI-сервисах на основе больших языковых моделей. Метод, который получил кодовое имя BoN (Best-of-N), при тестировании на 10 тысячах запросов позволил обойти ограничения модели GPT-4o в 89% случаев, модели Claude 3.5 Sonnet - в 78%, а Gemini Pro - в 50%. Инструментарий для проведения атаки опубликован под лицензией MIT.

Подробнее...

[Ботя]

Ответить

1 сообщение • Страница 1 из 1

Вернуться в «Новости *nix»

Error: Error download links from server! Read from local cache file.

Моды и расширения phpBB