Мозг и франкенштейны

Александр Гурьянов
(«ХиЖ», 2022, №10)

Проблема компьютерного распознавания образов существует многие десятилетия. На этом пути достигнут огромный прогресс. Человечество создало разнообразные системы ИИ, но задача далека от окончательного решения. Причина в отсутствии хотя бы качественной теории мозга, а значит, и понимании того, как распознавание происходит в человеческой голове. Однако кое-что ясно уже сейчас. При идентификации объекта на изображениях люди опираются на взаимное расположение различных его частей, то есть всегда оценивают форму объекта в целом.

Нейронные сети сегодня доминируют среди математических моделей явлений, происходящих в визуальных отделах коры головного мозга. Но обладают ли сети чувствительностью к форме? На этот вопрос в своем новом исследовании постарались ответить двое профессоров, канадец Джейс Илдер (James Elder) из Йоркского университета и американец Николас Бейкер (Nicholas Baker) из колледжа Лойолы в Чикаго. Картинки силуэтов животных, предъявляемые ИИ и людям для опознания, они разрезали на две части, которые затем неправильно соединяли. Силуэт предмета оказывался искаженным, но детали каждой части сохранялись. Получившиеся объекты исследователи называли франкенштейнами по имени главного героя известного романа Мэри Шелли.

Человека франкенштейны вводили в заблуждение, тренированные же сети не были чувствительны к их конфигурации. Общая форма объекта для сетей оказалась не важна. И смена методов тренировки сети, и изменение ее архитектуры не вели к устанению этого различия. Ни одна из самых сложных сетей так и не сумела полностью воспроизвести последовательность человеческих ответов при распознавании предметов.

Авторы делают вывод о принципиальных отличиях в восприятии образов сетями и мозгом. Это означает, что сеть имеет неустранимые недостатки, заложенные в принципах ее организации. Поэтому, говорит профессор Илдер, нейросети могут быть опасны в реальных приложениях, особенно в индустриальных и военных применениях. Один из негативных примеров — это системы управления трафиком на дорогах. Объекты здесь загораживают друг друга, поэтому человек опознает их, домысливая невидимые фрагменты. ИИ же может только воспринимать фрагменты, но не способен их домыслить. Поэтому его оценка рисков может не соответствовать реальности дорожного движения.

Профессора надеются, что для достижения адекватности сетей их нужно тренировать на более широком наборе объективных задач, не ограничиваясь при этом категорией распознавания образов. Вывод, на наш взгляд, сколь неоднозначный, столь и сомнительный.


iScience, 25, 9, 104913, 2022

Разные разности
Белая подруга
В многочисленной березовой семье не без урода. Есть в ней необычные деревья — белоствольные, но низкорослые, извилистые и с большими наростами. Однако это именно тот случай, когда вся красота спрятана внутри, потому что это — карельская бер...
Почему заржавел Марс?
Что придает Марсу ржаво-красный цвет? За это должна отвечать какая-то форма оксида железа. Но вопрос — какая именно? Действительно, железо в изобилии присутствует в марсианских породах, и оно могло окислиться, заржаветь. Однако оксидов железа мн...
Противоестественная эволюция
Если сравнить фотографии носорогов, сделанные за последние полтора столетия, то бросается в глаза, что рога носорогов стали заметно меньше. Почему такой поворот эволюции? А потому, что в нее вмешался человек.
Люблю грозу в начале марта
Помните у Тютчева: «Люблю грозу в начале мая,/ Когда весенний, первый гром…»? Фёдор Иванович написал эти строки 197 лет назад. Но за два прошедших столетия многое изменилось. Сегодня строки Тютчева нуждаются в редактуре по существу и должны звуч...