24 марта 2026, 22:07
OpenAI выпустила open source-инструменты для повышения безопасности ИИ-приложений для подростков

OpenAI представила набор open source-промптов, которые должны помочь разработчикам создавать ИИ-приложения безопаснее для подростков. Компания предлагает применять их наряду со своей моделью модерации gpt-oss-safeguard, но отмечает, что эти политики можно адаптировать и для других моделей.
Речь идет не о готовом приложении, а о наборе правил, которые помогают заранее задать границы допустимого поведения ИИ. В них затрагиваются темы графического насилия, сексуального контента, опасных челленджей, вредных представлений о теле, романтического или агрессивного ролевого взаимодействия, а также товаров и услуг с возрастными ограничениями.
Другие новости и материалы по AI — в Telegram-канале NH | Новости технологий, AI и будущее.
В OpenAI объясняют, что даже опытным командам сложно перевести общие цели безопасности в точные и рабочие правила. В результате защита часто получается либо непоследовательной, либо слишком размытой, либо, наоборот, чрезмерно жесткой. Новый набор промптов должен дать разработчикам базовый каркас, который можно дорабатывать под свой продукт.
Над этими политиками OpenAI работала вместе с организациями Common Sense Media и everyone.ai. В компании подчеркивают, что это не полноценное решение всех проблем AI safety, а скорее минимальный практический уровень защиты, который можно быстро встроить в продукт.
На фоне растущего внимания к тому, как ИИ взаимодействует с несовершеннолетними, такой шаг выглядит логичным. Особенно для небольших команд, у которых нет собственных ресурсов на разработку сложной системы модерации с нуля.
Читают сейчас

48 минут назад
Уволенные работники Oracle пытались договориться о более выгодном выходном пособии, но бывший работодатель отказал
В конце марта Oracle сократила от 20 тыс. до 30 тыс. человек. Уволенные работники компании пытались договориться о более выгодном выходном пособии, но бывший работодатель отказал, пишет TechCrunch. Оз

51 минуту назад
Инициатива PHP перешёл на лицензию BSD-3
Авторы языка программирования PHP направили в организацию OSI (Open Source Initiative) уведомление о добровольном выводе из обращения лицензии PHP License 3.01. Заявлено, что после нескольких лет рабо

2 часа назад
В Италии впервые диагностировали зависимость от ИИ
Итальянская национальная служба поддержки людей с зависимостями (Servizio per le Dipendenze, SerD) в начальный раз в стране зафиксировала аддикцию от искусственного интеллекта, пишет местное книга Gaz
2 часа назад
Instagram* отключил сквозное шифрование личных сообщений: что произошло 8 мая 2026 года
С 8 мая 2026 года Instagram* официально перестал поддерживать сквозное шифрование (E2EE) в директах. Meta** теперь технически способна видеть содержимое переписок между пользователями платформы. Офици

3 часа назад
В США чиновники резали гранты через ChatGPT. Потом сделали бота крайним в суде
Окружной судья Колин Маккэхон в Манхэттене 7 мая признала незаконной отмену больше 1400 грантов Национального фонда гуманитарных наук — государственной структуры, которая распределяет деньги между уче