24 марта 2026, 22:07

OpenAI выпустила open source-инструменты для повышения безопасности ИИ-приложений для подростков

2 мин

OpenAI представила набор open source-промптов, которые должны помочь разработчикам создавать ИИ-приложения безопаснее для подростков. Компания предлагает применять их наряду со своей моделью модерации gpt-oss-safeguard, но отмечает, что эти политики можно адаптировать и для других моделей.

Речь идет не о готовом приложении, а о наборе правил, которые помогают заранее задать границы допустимого поведения ИИ. В них затрагиваются темы графического насилия, сексуального контента, опасных челленджей, вредных представлений о теле, романтического или агрессивного ролевого взаимодействия, а также товаров и услуг с возрастными ограничениями.

Другие новости и материалы по AI — в Telegram-канале NH | Новости технологий, AI и будущее.

В OpenAI объясняют, что даже опытным командам сложно перевести общие цели безопасности в точные и рабочие правила. В результате защита часто получается либо непоследовательной, либо слишком размытой, либо, наоборот, чрезмерно жесткой. Новый набор промптов должен дать разработчикам базовый каркас, который можно дорабатывать под свой продукт.

Над этими политиками OpenAI работала вместе с организациями Common Sense Media и everyone.ai. В компании подчеркивают, что это не полноценное решение всех проблем AI safety, а скорее минимальный практический уровень защиты, который можно быстро встроить в продукт.

На фоне растущего внимания к тому, как ИИ взаимодействует с несовершеннолетними, такой шаг выглядит логичным. Особенно для небольших команд, у которых нет собственных ресурсов на разработку сложной системы модерации с нуля.

OpenAI AI safety безопасность ИИ модерация контента gpt-oss-safeguard open source LLM подростки мифи разработка ИИ-приложений

Читают сейчас

16 минут назад

Kuber Community Day возвращается

, привет! 30 июля в Москве и онлайн вновь состоится инженерная конференция Kuber Community Day. В этому году мероприятие станет масштабнее: больше участников, экспертизы и полезного общения. Участие о

18 минут назад

«Дальнобойщики 2» вышли в Steam

«Дальнобойщики 2» вышли в Steam. В магазине игра называется Hard Truck 2: King of the Road — русский язык на месте. Ознакомиться далее

28 минут назад

INTEKEY вошла в топ-10 рынка WMS России с ростом +27% — и что рейтинг CNews сообщает обо всём рынке

CNews в начальный раз посчитал поставщиков систем управления складом по выручке за 2025 год. INTEKEY — в десятке. Разбираем, что стоит за цифрами и куда движется сегмент складского софта. Коротко. CNe

29 минут назад

GTA VI, предзаказ которой откроется 25 июня, будет стоит $80 за стандартное книга и $100 — за Ultimate

Что ж, похоже, в этот раз переноса даты релиза не будет. GTA VI выйдет на последних поколениях PlayStation и Xbox 19 ноября, а оформить предзаказ можно будет уже через несколько часов. Впрочем, об это

1 час назад

Потребительские NVMe на Луне: Kioxia и HPE готовят Spaceborne Computer 4 к лунной миссии

Привет, ! На связи Selectel. Kioxia и HPE готовят к лунной миссии вычислительную систему Spaceborne Computer 4 с обычными потребительскими NVMe SSD на борту. Рассказываем, зачем на Луне LLM и почему д