Мозг и франкенштейны

Александр Гурьянов

Проблема компьютерного распознавания образов существует многие десятилетия. На этом пути достигнут огромный прогресс. Человечество создало разнообразные системы ИИ, но задача далека от окончательного решения. Причина в отсутствии хотя бы качественной теории мозга, а значит, и понимании того, как распознавание происходит в человеческой голове. Однако кое-что ясно уже сейчас. При идентификации объекта на изображениях люди опираются на взаимное расположение различных его частей, то есть всегда оценивают форму объекта в целом.

Нейронные сети сегодня доминируют среди математических моделей явлений, происходящих в визуальных отделах коры головного мозга. Но обладают ли сети чувствительностью к форме? На этот вопрос в своем новом исследовании постарались ответить двое профессоров, канадец Джейс Илдер (James Elder) из Йоркского университета и американец Николас Бейкер (Nicholas Baker) из колледжа Лойолы в Чикаго. Картинки силуэтов животных, предъявляемые ИИ и людям для опознания, они разрезали на две части, которые затем неправильно соединяли. Силуэт предмета оказывался искаженным, но детали каждой части сохранялись. Получившиеся объекты исследователи называли франкенштейнами по имени главного героя известного романа Мэри Шелли.

Человека франкенштейны вводили в заблуждение, тренированные же сети не были чувствительны к их конфигурации. Общая форма объекта для сетей оказалась не важна. И смена методов тренировки сети, и изменение ее архитектуры не вели к устанению этого различия. Ни одна из самых сложных сетей так и не сумела полностью воспроизвести последовательность человеческих ответов при распознавании предметов.

Авторы делают вывод о принципиальных отличиях в восприятии образов сетями и мозгом. Это означает, что сеть имеет неустранимые недостатки, заложенные в принципах ее организации. Поэтому, говорит профессор Илдер, нейросети могут быть опасны в реальных приложениях, особенно в индустриальных и военных применениях. Один из негативных примеров — это системы управления трафиком на дорогах. Объекты здесь загораживают друг друга, поэтому человек опознает их, домысливая невидимые фрагменты. ИИ же может только воспринимать фрагменты, но не способен их домыслить. Поэтому его оценка рисков может не соответствовать реальности дорожного движения.

Профессора надеются, что для достижения адекватности сетей их нужно тренировать на более широком наборе объективных задач, не ограничиваясь при этом категорией распознавания образов. Вывод, на наш взгляд, сколь неоднозначный, столь и сомнительный.

iScience, 25, 9, 104913, 2022

Разные разности

Память обезьян похожа на человеческую

Наука постоянно добывает все новые и новые факты, подтверждающие сходство людей и обезьян и намекающие на то, что, как минимум, общий предок у человека и обезьяны был. И речь идет не о внешнем сходстве, а о более тонких вещах — о работе мозга.

Камни боли

Недавно в МГУ разработали оптическую методику, позволяющую определить состав камней в живой почке пациента. Это важно для литотрипсии — процедуры, при которой камни дробятся с помощью лазерного инфракрасного излучения непосредственно в почках.

Женщина изобретающая

Пишут, что за последние 200 лет только 1,5% изобретений сделали женщины. Не удивительно. До конца XIX века во многих странах женщины вообще не имели права подавать заявки на патенты, поэтому частенько оформляли их на мужей. Сегодня сит...

Мужчина читающий

Откуда в голове изобретателя, ученого вдруг возникает идея, порой безумная — какое-нибудь невероятное устройство или процесс, которым нет аналогов в природе? Именно книги формируют воображение юных читателей, подбрасывают идеи, из которых выраст...