18 мая 2026, 17:37
В Google DeepMind представили концепцию курсора мыши с возможностями ИИ
В Google DeepMind представили концепт указателя мыши с возможностями искусственного интеллекта. Он призван решить проблему работы с инструментами ИИ, которые находятся в отдельных окнах.
«Мы хотим обратного: интуитивно понятного ИИ, который будет взаимодействовать с пользователями во всех используемых ими инструментах, не прерывая их рабочий процедура. Например, представьте, что вы указываете на изображение здания и запрашиваете “Покажите мне маршрут”. Больше ничего не нужно, когда платформа ИИ уже понимает контекст», — пояснили исследователи.
Курсор работает на платформе Gemini. В частности, вы может посетить Google AI Studio, чтобы отредактировать изображение или найти места на карте, просто указав пальцем и произнеся команду.
Исследователи разработали четыре принципа, которые в совокупности переносят сложную работу по передаче контекста и намерений с пользователя на компьютер, заменяя текстовые подсказки более простыми и интуитивно понятными взаимодействиями:
возможности ИИ должны работать во всех приложениях. Прототип указателя с поддержкой ИИ доступен везде, в частности, он может указать на PDF-файл и запросить краткое изложение в виде списка для вставки непосредственно в электронное письмо, навести курсор на таблицу статистики и запросить версию в виде круговой диаграммы либо выделить рецепт и обратиться с просьбой к удвоить все ингредиенты;
объяснять то, что видит пользователь. Современные модели ИИ требуют точных инструкций, и им приходится писать подробную подсказку. Указатель с поддержкой ИИ упростит этот процедура, плавно захватывая визуальный и семантический контекст вокруг указателя, позволяя компьютеру «видеть» и понимать, что важно для пользователя. В экспериментальной системе в достаточной степени просто указать пальцем, и ИИ точно знает, с каким словом, абзацем, частью изображения или блоком кода пользователю нужна помощь;
преобразовывать пиксели в структурированные сущности, такие как места, даты и объекты, с которыми пользователи могут мгновенно взаимодействовать. Так, ИИ сможет превратить фотографию набросанной заметки в интерактивный список дел, а стоп-кадр в видеоролике о путешествии — в ссылку для бронирования столика в том самом ресторане;
понимать простые фразы. Например, потребитель может сказать: «Исправьте это», «Переместите это сюда» или «Что это значит?», а платформа искусственного интеллекта поймёт сочетание контекста, указания и речи.
Ранее Google анонсировала линейку ноутбуков «Googlebook», которая выйдет этой осенью. Устройства будут функционировать на новой операционной системе, созданной на основе Android и ChromeOS, и будут запускать Chrome, приложения Android, приложения и файлы, подключаемые к телефону, а также будут интегрированы с функциями Gemini.
Читают сейчас

57 минут назад
Нейросеть находит поломку авто по звуку — обучение проходило на роликах из YouTube и TikTok
Разработчик Адам Сон выложил в открытый доступ cardiag — систему, которая по аудиозаписи определяет, есть ли у машины неисправность, и подсказывает, в какой части автомобиля искать проблему. В достато

1 час назад
ФАС РФ призвала операторов связи не препятствовать переходу абонентов к другим компаниям с сохранением номера
Федеральная антимонопольная служба (ФАС) России призвала операторов связи РФ привести свои бизнес-практики в соответствие с требованиями Закона о защите конкуренции. Ведомство настоятельно порекомендо

2 часа назад
«Египет победил»: Qwen3-4B превратили в «самый согласованный ИИ в истории»
В X завирусился пост исследователя под ником waterloo_intern: он рассказал, что "дистиллировал 2,3 млн трейсов рассуждений Claude Fable 5" в компактную схема Qwen3-4B и получил невиданные результаты —

3 часа назад
Версия открытой платформы для самостоятельного хранения и управления фото и видео Immich 3.0
В начале июля 2026 года состоялся версия стабильного обновления открытой платформы для самостоятельного хранения и управления фото и видео Immich 3.0. Проект находится в разработке с начала 2022 года

6 часов назад
В AIRI создали нейросеть GENATATOR для разметки генов по последовательности ДНК и аннотации геномов без подробных данных
Учёные Института AIRI разработали нейросетевую схема Genatator, которая строит карту генов по последовательности ДНК.Как сообщили информационной службе а в AIRI, модель предназначена для разметки гено