24 марта 2026, 22:07
OpenAI выпустила open source-инструменты для повышения безопасности ИИ-приложений для подростков

OpenAI представила набор open source-промптов, которые должны помочь разработчикам создавать ИИ-приложения безопаснее для подростков. Компания предлагает применять их наряду со своей моделью модерации gpt-oss-safeguard, но отмечает, что эти политики можно адаптировать и для других моделей.
Речь идет не о готовом приложении, а о наборе правил, которые помогают заранее задать границы допустимого поведения ИИ. В них затрагиваются темы графического насилия, сексуального контента, опасных челленджей, вредных представлений о теле, романтического или агрессивного ролевого взаимодействия, а также товаров и услуг с возрастными ограничениями.
Другие новости и материалы по AI — в Telegram-канале NH | Новости технологий, AI и будущее.
В OpenAI объясняют, что даже опытным командам сложно перевести общие цели безопасности в точные и рабочие правила. В результате защита часто получается либо непоследовательной, либо слишком размытой, либо, наоборот, чрезмерно жесткой. Новый набор промптов должен дать разработчикам базовый каркас, который можно дорабатывать под свой продукт.
Над этими политиками OpenAI работала вместе с организациями Common Sense Media и everyone.ai. В компании подчеркивают, что это не полноценное решение всех проблем AI safety, а скорее минимальный практический уровень защиты, который можно быстро встроить в продукт.
На фоне растущего внимания к тому, как ИИ взаимодействует с несовершеннолетними, такой шаг выглядит логичным. Особенно для небольших команд, у которых нет собственных ресурсов на разработку сложной системы модерации с нуля.
Читают сейчас

3 минуты назад
Huawei Atlas 350 — конкурент NVIDIA или нишевый продукт? Новости из Поднебесной
Едва NVIDIA показали новую RTX Pro 4500 Blackwell Server Edition, как китайский вендор Huawei на мероприятии Huawei China Partner Conference показывает новинку — ускоритель Huawei Atlas 350. Об этой н
14 минут назад
Windows 11 получит компактную панель задач подобно Windows 10
Microsoft вернёт в Windows 11 компактную панель задач, похожую на Windows 10, с возможностью изменения размера. Читать далее

27 минут назад
90% репозиториев с Claude Code имеют меньше 2 звезд. Это задача или новая норма?
Независимый дашборд claudescode.dev, отслеживающий все публичные коммиты с тегом Claude Code на GitHub, насчитал более 20 млн коммитов в 1,08 млн репозиториев за год с момента запуска инструмента. Но

28 минут назад
Инициатива Минцифры об инвестициях IT-компаний в образование вызвал разногласия
«Ъ» ознакомился с отзывами участников рынка на обновлённый инициатива приказа Минцифры, устанавливающий порядок взаимодействия IT‑компаний и образовательных организаций. Документ, опубликованный 20 фе

33 минуты назад
Sonova планирует продать подразделение Sennheiser по производству наушников
Швейцарский производитель слуховых аппаратов Sonova планирует продать потребительское подразделение немецкой Sennheiser в рамках масштабной реструктуризации рыночной стратегии. Sonova намерена сосредо