Главное меню

Реклама

Глава 5. Восприятие - Распознавание

Содержание материала

 

Распознавание

Теперь мы обратимся к другой важной функции восприятия — распознаванию объектов. Распознавание объекта состоит в отнесении его к той или иной категории: это — рубашка, это — кошка, это — ромашка и т. п. Разумеется, мы можем также узнавать людей, что равнозначно отнесению того или иного входного зрительного сигнала к конкретному индивиду: это Бен Мерфи, это Ирен Пол. В обоих случаях — предметы это или люди — во время распознавания мы делаем выводы о множестве скрытых свойств объекта: если это рубашка, значит, она из ткани и ее можно носить; если это кошка, то она может меня поцарапать, когда я дерну ее за хвост; если это Бен Мерфи, значит, он захочет рассказать мне о своих баскетбольных успехах, и т. п. Распознавание — это то, что позволяет выйти за пределы данной информации.

Какие свойства объекта используются для его распознавания? Форма, величина, цвет, текстура, ориентация и т. д.? Все эти атрибуты играют определенную роль, однако ведущее значение, видимо, имеет форма. Например, чашку мы узнаем независимо от того, большая она или маленькая (вариация величины), белая или коричневая (вариация цвета), гладкая или с рельефом (вариация текстуры), стоит ли она прямо или слегка наклонена (вариация ориентации). А вот изменение формы, наоборот, очень сильно влияет на возможность распознавания чашки; если часть ее формы чем-то загорожена, мы можем не узнать ее вовсе. Один из примеров важности формы для распознавания, — это тот факт, что многие объекты мы узнаем почти так же хорошо на простых контурных рисунках, передающих только форму объекта, как и на подробных цветных фото, передающих множество атрибутов объекта (Biederman & Ju, 1988).

< Рис. На ранних стадиях распознавания система восприятия использует информацию на сетчатке для описания объекта посредством таких примитивных (элементарных) компонентов, как линии и края. На более поздних стадиях система сравнивает данное описание с описаниями различных категорий объектов, хранящихся в зрительной памяти, например таких, как «собаки».>

Тогда встает решающий вопрос: как человек использует информацию о форме объекта, чтобы
отнести его к определенной категории? Отвечая на него, мы сначала обратимся к простым объектам, таким как буквы алфавита, а затем рассмотрим естественные объекты (например, животных) и мебель.

Ранние этапы процесса распознавания

Многие исследователи различают предварительные и завершающие этапы в распознавании объекта. Эти этапы мы охарактеризуем по тому, что совершается на каждом из них. На предварительных этапах перцептивная система использует информацию с сетчатки глаза, в частности вариации интенсивности, и описывает объект на языке элементарных составляющих, таких как линии, края и углы. На основании этих элементарных составляющих система составляет описание самого объекта. На завершающих этапах система сравнивает это описание с описаниями форм разного рода объектов, хранящихся в зрительной памяти, и выбирает наилучшее ему соответствие. Например, опознать определенный объект как букву В — значит сказать, что его форма больше соответствует форме буквы В, чем форме других букв.

Детекторы признаков в коре мозга. Многое из того, что на сегодня известно об элементарных признаках объекта восприятия, было получено в биологических экспериментах над другими видами (кошками, обезьянами) с применением регистрации активности отдельных клеток зрительной коры. В этих исследованиях изучалась чувствительность специфических нейронов коры во время предъявления различных стимулов на те участки сетчатки глаза, которые связаны с этими нейронами; такой участок сетчатки называют рецептивным полем кортикального нейрона. Первые исследования с одноклеточной регистрацией были проведены Хьюбелем и Визелем (Hubel & Wiesel, 1968), которые получили за них Нобелевскую премию в 1981 году. Хьюбел и Визел выделили в зрительной коре три типа клеток, различающихся по признакам, на которые они реагируют. Простые клетки реагируют, когда глазу предъявляют стимул в виде линии (тонкой полоски или прямой грани между темным и светлым участками), имеющей определенную ориентацию и положение в рецептивном поле. На рис. 5.11 показано, как реагирует простая клетка на вертикальную полоску и на полоски, наклоненные относительно вертикали. По мере отклонения ориентации от оптимальной реакция снижается. Другие простые клетки настроены на другие ориентации и положения. Сложные клетки тоже реагируют на полоску или край определенной ориентации, но для них не обязательно, чтобы стимул находился в определенном месте рецептивного поля. Они реагируют на стимул, находящийся в любом месте их рецептивного поля, и реагируют непрерывно, пока стимул перемещается по их рецептивному полю. Сверхсложные клетки реагируют на стимул не только определенной ориентации, но и определенной длины. Если длина стимула выходит за пределы оптимальной, реакция ослабляется и может совсем прекратиться. Со времени публикации Хьюбелем и Визелем своих первых данных ученые обнаружили клетки, реагирующие на другие формы стимулов, помимо полосок и краев; например, они обнаружили сверхсложные клетки, реагирующие на углы и кривые линии определенной длины (Shapley & Lennie, 1985; DeValois & DeValois, 1980).


Рис. 5.11. Реакция простой клетки. На рисунке показана реакция простой клетки коры на полоску света. Сверху показан стимул, снизу — реакция; каждый большой всплеск на графиках внизу соответствует одному нервному импульсу. При отсутствии стимула регистрируется только случайный импульс. Когда стимуляция включена, клетка может реагировать или не реагировать в зависимости от положения и ориентации полоски света. У данной клетки предъявление горизонтальной полоски не меняет реакцию, полоска с наклоном в 45° вызывает небольшое изменение реакции, а вертикальная полоска вызывает очень большое изменение.

Все вышеописанные типы клеток называются детекторами признаков. Поскольку края, полоски, углы и изломы, на которые реагируют эти детекторы, могут использоваться для аппроксимации множества форм, есть основание рассматривать детекторы черт как кирпичики, из которых строится воспринимаемая форма. Как мы увидим далее, это положение, видимо, более справедливо в отношении простых форм (например, букв), чем в отношении сложных (например, столов или тигров).

Взаимосвязь признаков. Форма описывается не только своими признаками: нужно определить также их взаимосвязь. Важность связей между признаками иллюстрирует рис. 5.12. Признаки печатной буквы Т включают вертикальную и горизонтальную линии, но если эти линии не соединены правильно, в результате получится не Т. В описании Т следует учесть, что горизонтальная линия своим центром касается верха вертикальной. Именно такую связь признаков имели в виду гештальт-психологи, когда предупреждали предшествующих психологов (имеются в виду радикальные ассоцианисты.— Прим. ред.), что «целое отличается от суммы его частей».

Одно из таких отличий целого от его частей проявляется в том, что целое создает новые перцептуальные характеристики, которые невозможно объяснить за счет простого анализа отдельных частей. На рис. 5.12 показаны четыре такие возникающие характеристики. Все они возникают за счет специфических пространственных взаимоотношений между более элементарными характеристиками. Тем не менее такие возникающие характеристики часто ведут себя точно так же, как более простые характеристики, при выполнении таких задач, как обнаружение цели и визуальный поиск (Enns & Resnick, 1990; Enns & Prinzmetal, 1984; He & Nakayama, 1992). Эти факты свидетельствуют о том, что в зрительной системе осуществляются различные типы сложного анализа формы, прежде чем результаты этих анализов становятся доступны сознанию.

Рис. 5.12. Отношения между признаками. При сочетании двумерных признаков, таких как линии, углы и геометрические формы, результирующий паттерн в значительной степени зависит от пространственных отношений между компонентами-признаками. Помимо этого создаются (формируются) новые признаки. Эти возникающие признаки обладают перцептуальной реальностью, несмотря на то что они включают сложные пространственные отношения.

 

Поздние стадии распознавания

Теперь, когда у пас уже есть некоторое представление об описании формы объекта, можно обратиться к тому, как это описание сопоставляется с теми описаниями форм, которые хранятся в памяти, с целью найти лучшее соответствие.

Простые сети. Во многих исследованиях этапа сопоставления использовались простые паттерны, в частности, письменные или печатные буквы или слова. На рис. 5.13 показано, как мы можем хранить в памяти описания формы букв. Основная идея состоит в том, чтобы описывать буквы по определенным признакам, информация о которых для каждой буквы хранится в многосвязной сети (отсюда сам термин многосвязная модель). [В некоторых изданиях термин connectionist model переводится как «коннектионистская модель». Поскольку существенным свойством здесь является именно множественность и многоуровневость связей между элементами, название «многосвязная модель» представляется нам более адекватным. — Прим. перев.] В многосвязной модели привлекает то, что легко представить, как такие сети реализуются в мозге с его массивами взаимосвязанных нейронов. Таким образом, многосвязность служит мостом между психологическими и биологическими моделями.

 

Рис. 5.13. Простая сеть. Нижний уровень этой сети содержит признаки (наклонные линии, вертикальная линия и кривая, выгнутая вправо), верхний уровень содержит буквы, а связь между признаком и буквой означает, что данный признак является частью этой буквы. Поскольку эти связи возбуждающие, при активации признака активация передается букве.

 
Нижний уровень сети, показанной на рис. 5.13, содержит признаки — например, правую диагональ, левую диагональ, верикальную линию и кривую, выгнутую вправо. Эти признаки и буквы мы будем называть узлами сети. Связь между узлом признака и узлом буквы означает, что данный признак принадлежит этой букве. Стрелки на концах соединений означают, что связи являются возбуждающими; когда активируется тот или иной признак, активация передается букве (аналогично тому, как электрические импульсы распространяются по сети нейронов).

Сеть на рис. 5.13 говорит нам, что буква K состоит из правой диагонали, левой диагонали и вертикальной линии; буква R состоит из левой диагонали, вертикальной линии и кривой, выгнутой вправо; а буква P состоит из вертикальной линии и кривой, выгнутой вправо. (Для простоты мы здесь опускаем взаимосвязи признаков.) Чтобы понять, как при помощи этой сети можно распознать (или подобрать) букву, посмотрим, что происходит при предъявлении буквы K. Она будет активировать правую диагональ, левую диагональ и вертикальную линию. Все эти три признака будут активировать узел буквы K; два признака — левая диагональ и вертикальная линия — будут активировать узел буквы R и один признак — вертикальная линия — будет активировать узел буквы P. Только в узле буквы K активированы все признаки, и следовательно, она будет выбрана как наиболее подходящая.

Эта модель слишком проста для объяснения многих аспектов распознавания. Чтобы понять, чего в этой модели не хватает, посмотрим, что происходит, когда предъявляется буква R (рис. 5.14). Она активирует левую диагональ, вертикальную линию и кривую, выгнутую вправо. Теперь в обоих узлах букв R и P активированными оказываются все признаки этих букв, и в этой модели никак нельзя решить, какую букву следует выбрать. Чтобы остановиться на одном определенном варианте, эта модель должна знать: наличие левой диагонали означает, что на входе не может быть буквы P. Подобная отрицательная информация учтена в усложненной сети, показанной на рис. 5.14.

Рис. 5.14. Усложненная сеть. Помимо активирующих связей эта сеть содержит тормозящие соединения между признаками и теми буквами, которые этих признаков не содержат.

В этой сети есть все то же, что и в предыдущей, плюс тормозные связи (они показаны с точками на концах) между признаками и теми буквами, которые не содержат этих признаков. Когда признак соединен с буквой тормозной связью, активация этого признака уменьшает активацию буквы. Если буква R предъявляется сети, показанной на рис. 5.14, левая диагональ вызывает торможение в узле буквы Р, снижая тем самым ее общий уровень активации; теперь наибольшая активация будет в узле буквы R и, следовательно, она будет выбрана как наилучшее соответствие.

Сети с обратной связью. Основную идею модели, которую мы только что рассмотрели, а именно что описание буквы должно содержать как те признаки, которые она имеет, так и те, которые в ней отсутствуют, — первоначально предложили исследователи искусственного интеллекта, которые разрабатывали компьютерные программы, моделирующие восприятие букв человеком. Хотя в то время такие идеи пользовались относительным успехом, в конце концов оказалось, что они неспособны адекватно объяснить данные о влиянии контекста на способность воспринимать буквы. В частности, оставалось непонятным, почему буква легче воспринимается, когда она предъявляется в составе слова, чем когда она предъявляется сама по себе. Так, если испытуемым на короткое время предъявляют изображение либо только буквы K, либо слова «WORK» (работа), а затем спрашивают, была ли последняя буква K или D, они отвечают точнее, если было предъявлено целое слово, а не одна буква (рис. 5.15).

 

Рис. 5.15. Восприятие букв и слов. Этот рисунок иллюстрирует последовательность событий в эксперименте, в котором сравнивалось восприятие букв, предъявлявшихся отдельно или в составе слова. Сначала испытуемые видели точку фиксации, за ней следовало слово или отдельная буква, которые предъявлялись всего на несколько миллисекунд. Затем предъявлялся стимул, содержащий маскирующие знаки на том месте, где находились буквы, и два варианта ответа. Испытуемым надо было решить, какой из двух вариантов слова или буквы предъявлялся ранее (по: Reicher, 1969).

Чтобы объяснить этот результат, в вышеописанную сеть со связями между признаками и буквами надо внести несколько изменений. Во-первых, в нее надо добавить уровень слов и помимо этого добавить возбуждающие и тормозные связи от букв к словам (рис. 5.16).

 

Рис. 5.16. Сеть с активацией «сверху вниз». В этой сети между буквами и словами, а также между признаками и буквами имеются возбуждающие и тормозные связи, и некоторые возбуждающие связи идут от слов к буквам.

Кроме того, надо добавить возбуждающие связи, идущие от слов обратно к буквам; эти последние будут обеспечивать обратную связь «сверху вниз», и тогда можно будет объяснить, почему при кратковременном предъявлении буква легче воспринимается в составе слова, чем когда она предъявляется отдельно. Если, например, буква R предъявляется отдельно, активируются ее признаки — вертикальная линия, левая диагональ и кривая, выгнутая вправо, — и эта активация распространяется к узлу буквы R. Поскольку буква предъявлялась на очень короткое время, не все признаки могли успеть активироваться и результирующая активация узла буквы R могла оказаться недостаточной для опознания. Если же буква R предъявляется в составе слова «RED» (красный), то помимо активации, идущей от признаков R к буквенному узлу R, имеет место активация от признаков Е и D к буквенным узлам; все эти частично активированные буквы частично активируют узел слова RED, который в свою очередь по обратным связям активирует свои буквы, используя соединения «сверху вниз».

Все это приводит к тому, что когда буква R предъявляется в составе слова, у нее возникает дополнительный источник активации, а именно сигнал, поступающий вниз от слова; вот почему букву, предъявленную в составе слова, распознать легче, чем предъявленную отдельно. На материале слов и букв были получены и многие другие результаты, согласующиеся с многосвязной моделью (McClelland & Rumelhart, 1981).

Такие модели также успешно используются в устройствах для чтения рукописного текста и распознавания речи (Coren, Ward & Enns, 1999).

Распознавание естественных объектов и обработка по принципу «сверху вниз»

Мы кое-что узнали о распознавании букв и слов, а как насчет естественных объектов — животных, растений, людей, одежды и мебели?

Признаки естественных объектов. Форма естественных объектов состоит из более сложных признаков, чем линии и кривые, и скорее напоминает простые геометрические фигуры. Эти признаки таковы, что их комбинация позволяет создать форму любого узнаваемого объекта (так же как сочетанием линий и кривых можно получить любую букву). Кроме того, надо, чтобы признаки объектов были составлены из более простых признаков — линий и кривых, поскольку простые признаки — это единственная информация, изначально имеющаяся у перцептивной системы. Такие соображения направляли поиски возможного набора признаков предметной среды.

Одно из предположений заключалось в том, что в состав признаков объектов входят некоторые геометрические фигуры, например цилиндры, конусы, параллелепипеды и клиновидные фигуры, как показано на рис. 5.17а. Такие признаки называют геонами (неологизм от «геометрические ионы»); их разработал Бидерман (Biederman, 1987). Бидерман считает, что набора из 36 геонов, аналогичных показанным на рис. 5.17а, в сочетании с небольшим набором пространственных отношений будет достаточно для описания формы всех объектов, которые человек способен опознать. Чтобы оценить этот момент, заметьте, что всего из двух геонов можно составить
36x36 различных объектов (сформировать объект можно из любых двух геонов — см. рис. 5.17б), а из трех геонов — 36x36x36 объектов. Эти два числа дают в сумме уже около 30 000, а еще надо учесть возможные объекты из четырех и более геонов. Кроме того, геоны, показанные на рис. 5.17а, различаются только своими простейшими признаками. Например, геон 2 на рис. 5.17а, куб, отличается от геона 3, цилиндра, тем, что у куба прямые края, а у цилиндра — изогнутые; прямые и изогнутые линии являются простыми признаками.

 

Рис. 5.17. Возможный набор признаков (геонов) естественных объектов. а) Клин, куб, цилиндр и конус могут быть признаками сложных объектов. б) Из комбинации признаков (геонов) получаются естественные объекты. Заметьте, что если дугу (геон 5) присоединить к цилиндру (геон 3), получается чашка; если же дугу присоединить к верху цилиндра, получится ведро (по: Biederman, 1990).

То, что геоны являются признаками объектов, подтвердилось в экспериментах, в которых испытуемым предлагалось распознать нарисованные объекты, предъявляемые на короткое время. Общий результат был таков, что объект распознается настолько хорошо, насколько хорошо воспринимаются его геоны. В одном эксперименте стиралась часть формы объекта; в одном случае стирание мешало восстановлению геонов (правая колонка на рис. 5.18), в другом — не мешало (средняя колонка на рис. 5.18). Объекты распознавались намного лучше, когда стирание не интерферировало с геонами.

 

Рис. 5.18. Распознавание объектов и восстановление геонов. Элементы, использовавшиеся в эксперименте по распознаванию объектов. В левой колонке показаны исходные интактные варианты объектов. В средней колонке показаны варианты объектов, у которых некоторые участки стерты, но восстановить геоны все же можно. В правой колонке — варианты объектов, где участки стерты так, что геоны невосстановимы. Варианты объектов из средней колонки распознавались лучше, чем из правой (по: Biederman, 1987).

Обычно в описание объекта входят не только его признаки, но и отношения между ними. Это хорошо видно из рис. 5.17б. Если дуга присоединена сбоку цилиндра, получается чашка; если же она подсоединена сверху цилиндра, получается ведро. После того как описание формы объекта составлено, оно сравнивается с массивом геонных описаний, хранящихся в памяти, с тем чтобы найти наилучшее соответствие. Такое сопоставление описаний формы объектов с описаниями, хранящимися в памяти, похоже на ранее упоминавшийся процесс распознавания букв и слов (Hummel & Biederman, 1992).

Роль контекста. В восприятии есть принципиальное различие между процессами обработки, протекающими или снизу вверх, или сверху вниз. Процессы «снизу вверх» управляются только входными сигналами, а процессы «сверху вниз» — знаниями и ожиданиями человека. Для иллюстрации скажем, что когда на основе только геонного описания объекта последний узнается как лампа, то здесь участвуют только процессы «снизу вверх»; все начинается с появления на входе простых признаков этого объекта, далее определяется геонная конфигурация входных данных, и затем это описание входа сравнивается с хранящимися в памяти описаниями форм. Наоборот, если мы узнаем в некотором объекте лампу отчасти потому, что она находится на ночном столике рядом с кроватью, то в этом участвуют некоторые процессы «сверху вниз»; здесь привлекается не только та информация, которая поступила на сенсорный вход. Хотя до сих пор мы в этой главе обсуждали в основном процессы типа «снизу вверх», процессы «сверху вниз» также играют важную роль в восприятии.

Именно принцип обработки «сверху вниз» стоит за сильным влиянием контекста на наше восприятие предметов и людей. Если вы ожидаете, что ваша сотрудница Сара во вторник появится в химической лаборатории, как всегда, в 15:00, то когда она в указанный момент входит в лабораторию, вам даже не обязательно смотреть, чтобы знать, что это она. Ваше прежнее знание обусловило сильное ожидание, и для распознания достаточно очень слабого входного сигнала. Но если бы Сара вдруг появилась в вашем родном городе на рождественские каникулы, возможно, вам в первый момент даже было бы трудно ее узнать. Она оказалась бы вне контекста — нарушила бы ваши ожидания, и вам пришлось бы прибегнуть к обширной обработке «снизу вверх», чтобы сказать, что это на самом деле она (такие вещи обычно ощущаются как бы «со второй попытки»). Из этого примера ясно видно, что при соответствующем контексте (т. е. когда он предвосхищает объект на входе), восприятие облегчается; при несоответствующем контексте восприятие затрудняется.

Влияние контекста особенно примечательно, когда стимульный объект неоднозначен, т. е. когда он может восприниматься по-разному. Пример двойственного изображения показан на рис. 5.19; его можно воспринимать как старуху или как молодую женщину (хотя в первый момент с большей вероятностью видна старуха). Если вы уже смотрели на обычные картинки, напоминающие молодую женщину на рис. 5.19 (т. е. если контекст составляют молодые женщины), то на этой двойственной картинке вы скорее всего увидите вначале молодую женщину.

Рис. 5.19. Двойственный стимул. На этом неоднозначном рисунке можно видеть или молодую женщину, или старуху. Большинство видит сначала старуху. Молодая женщина отвернулась, и видна левая часть ее лица. Ее подбородок образует нос старухи, а цепочка у нее на шее — рот старухи (по: Boring, 1930).

Этот эффект временного контекста виден на другом наборе изображений на рис. 5.20. Смотрите на них, как при чтении рассказа в картинках — слева направо и сверху вниз. Картинки в середине этой последовательности неоднозначны. Если вы смотрели на эти изображения в предложенной последовательности, то скорее всего видели в них мужское лицо. Если вы посмотрите на них в обратном порядке, то в двойственных картинках скорее всего увидите молодую женщину.

Рис. 5.20. Эффект временного контекста. То, что вы здесь увидите, зависит от порядка рассматривания картинок. Картинки в середине ряда — двойственные. Если вы вначале смотрите на картинку с мужским лицом, они будут казаться вам искаженными мужскими лицами. Если вы вначале смотрите на картинку с женщиной, они будут походить на женщину (по: Fisher, 1967).

Чтобы показать влияние контекста, стимульный объект не обязательно должен быть двойственным. Представьте, что человеку сначала показывают изображение какой-либо сцены, а затем на короткое время предъявляют для распознавания изображение однозначного объекта; в этом случае распознавание будет более точным, если этот объект соответствует сцене. Например, посмотрев на сцену кухни, испытуемый более часто дает верную идентификацию быстро предъявленного изображения буханки хлеба, чем такого же по времени изображения почтового ящика (Palmer, 1975).

Благодаря обработке по принципу «сверху вниз» мотивы и желания потенциально могут влиять на восприятие. При сильном чувстве голода, быстро взглянув на красный шарик на кухонном столе, можно распознать в нем помидор. Желание есть заставляет думать о еде, и эти ожидания комбинируются с входной информацией (красный круглый предмет), создавая в результате перцепт помидора. Возможно и отрицательное влияние мотивов на восприятие. Если мы считаем, например, что некто — соблазнитель детей, мы более вероятно расценим его невинное прикосновение к ребенку как сексуальное.

Влияние контекста и обработка по принципу «сверху вниз» имеют место и в распознавании букв и слов, играя важную роль при чтении. Читая, мы не отслеживаем строчку текста плавным непрерывным движением. На самом деле глаза совсем недолго задерживаются на месте, а затем перепрыгивают в другую позицию на строчке, снова ненадолго останавливаются, затем снова прыгают и т. д. Периоды, в течение которых глаза остаются в покое, называются фиксациями, и именно во время фиксаций зрительная система извлекает информацию. На количество и длительность фиксаций очень сильно влияет то, что известно о данном тексте, и, следовательно, объем привлекаемой обработки «сверху вниз». Если материал незнакомый — скажем, незнакомый научный текст, — объем обработки «сверху вниз» минимален. В таких случаях мы останавливаемся на каждом слове, за исключением некоторых функциональных слов вроде «и», «о», «тот» и т. п. По мере ознакомления с материалом становится возможным привлекать полученное знание для обработки по принципу «сверху вниз», и тогда зрительные фиксации становятся реже и короче (Just & Carpenter, 1980; Rayner, 1978).

Процессы типа «сверху вниз» и недостаточность входного сигнала. Обработка по принципу «сверху вниз» происходит даже при отсутствии контекста, если входной сигнал очень скудный или ослаблен. Предположим, что, находясь у подружки в квартире, вы в темноте заходите на кухню и видите в углу небольшой черный предмет. Вы думаете, что это, наверное, ее кот, но воспринимаемый сигнал слишком слаб, чтобы быть уверенным, и тогда вы начинаете представлять какой-нибудь конкретный признак кота— скажем, его хвост — и затем избирательно направляете внимание на тот участок предмета, где этот признак может скорее всего быть, если это действительно кот (Kosslyn & Koenig, 1992). Это — процесс обработки по принципу «сверху вниз», поскольку вы использовали определенное конкретное знание (что у кота есть хвост), чтобы сгенерировать ожидание, которое затем комбинируется со зрительным входным сигналом. Подобные ситуации довольно обычны для повседневной жизни. Иногда, если входной сигнал очень слабый, формируемые ожидания могут оказаться несостоятельными, скажем, когда вы наконец разберетесь, что этот якобы кот на кухне — на самом деле сумочка вашей подружки.

Нарушения процесса распознавания

Распознавание объектов обычно осуществляется автоматически и без усилий с нашей стороны, так что мы относимся к этому процессу как к чему-то само собой разумеющемуся. Однако иногда процесс распознавания дает сбои в тех случаях, когда люди страдают от повреждений мозга (вызванных несчастными случаями или такими болезнями, как сердечные удары). Агнозия — общий термин для обозначения нарушений или расстройств процесса распознавания.

Особый интерес представляет тип агнозии, называемый ассоциативной агнозией. Это синдром, при котором пациенты, страдающие от повреждений теменных долей коры, испытывают трудности при распознавании объектов только в тех случаях, когда эти объекты представлены визуально. Например, пациент может быть не в состоянии сказать, как называется расческа, если ему показать ее изображение, но может сделать это, если ему дать ее потрогать. Примером данного нарушения является следующий случай:

«На протяжении первых трех недель, проведенных в больнице, пациент не мог идентифицировать самые обычные предметы, предъявляемые ему визуально, и не мог определить, какая еда находится в его тарелке, пока он ее не попробует. Он мог сразу распознать объекты, когда трогал их, но когда ему показывали стетоскоп, он описывал его как «длинный шнур с круглым предметом на конце» и спрашивал, может ли это быть часами. Когда ему показали открывашку для бутылок, он ответил: «Возможно, это ключ». Когда его попросили назвать зажигалку, он ответил: «Не знаю». Он сказал, что он «не уверен», когда ему показали зубную щетку. При виде расчески он также сказал: «Не знаю». При предъявлении курительной трубки он ответил: «Какой-то прибор, я не уверен». Когда ему показали ключ, он сказал «Я не знаю, что это; может быть, напильник или какой- то инструмент»» (Reubens & Benson, 1971).

Какие же аспекты распознавания нарушаются при ассоциативной агнозии? Поскольку страдающие этим нарушением пациенты часто хорошо справляются с другими визуальными заданиями, не требующими распознавания, — например, нарисовать предмет или сказать, совпадают ли друг с другом два изображения, — нарушение вряд ли происходит на поздних стадиях распознавания, во время которых стимульный объект сопоставляется с хранящимися в памяти описаниями объектов. Возможно, хранящиеся в памяти описания объектов каким-то образом утрачиваются или блокируются (Damasko, 1985).

Некоторые пациенты, страдающие ассоциативной агнозией, испытывают проблемы с распознаванием только определенных категорий, а не любых объектов. Эти категориально­специфические нарушения представляют значительный интерес, поскольку, изучая их, мы можем узнать нечто новое о том, как функционирует процесс распознавания. Наиболее распространенным категориально-специфическим нарушением является утрата способности к распознаванию лиц, называемая прозопагнозией. (Мы кратко касались этой проблемы в гл. 1.) Во всех случаях, когда происходит такое нарушение, имеет место повреждение правого полушария, а нередко также и повреждения гомологичных зон левого полушария. Примером данного нарушения является следующий случай.

«Он не мог узнать присматривающих за ним врачей и сестер. «Вы, должно быть, доктор, потому что у вас белый халат, но как вас зовут, я не помню. Если вы заговорите, я вас узнаю». Он не узнавал свою жену, приходящую в приемные часы.... не узнавал на фотографиях Черчилля, Гитлера и Мерилин Монро. Увидев такой портрет он начинал анализировать его дедуктивно, пытаясь найти «критические» признаки, которые помогли бы ему дать правильный ответ» (Pallis, 1955).

Ко второму типу категориальных нарушений относится утрата способности распознавать слова, называемая чистой алексией (как правило, сопровождающаяся повреждениями левой затылочной доли). Пациенты, страдающие этим нарушением, обычно не испытывают трудностей с узнаванием природных объектов и лиц. Они даже могут распознавать отдельные буквы. Однако эти пациенты оказываются не в состоянии распознавать зрительно предъявляемые слова. Увидев слово, они пытаются прочитать его по буквам. Распознавание самых распространенных слов может занимать у них до 10 секунд, при этом время распознавания растет с увеличением числа букв в слове (Bub, Blacks & Howell, 1989).

Другие типы категориально-специфических нарушений включают проблемы с узнаванием живых существ — таких как животные, растения и пищевые продукты. В редких случаях пациенты оказываются неспособными распознавать и неодушевленные предметы, как, например, хозяйственные инструменты (Warrington & Shallice, 1984).

Некоторые предположения, выдвигаемые с целью объяснения категориально-специфических нарушений, касаются и распознавания объектов в норме. Одна из таких гипотез состоит в том, что нормальная организация системы распознавания базируется на различных классах объектов: одна подсистема служит для распознавания лиц, другая — для слов, третья — для животных, и так далее, и что эти подсистемы локализованы в различных участках мозга. Если пациент получил лишь местное повреждение мозга, у него может проявляться потеря памяти, относящаяся только к одной подсистеме, но не к другим. Так, повреждения специфических участков правого полушария могут приводить к нарушениям в работе подсистемы, ответственной за узнавание лиц, при этом функционирование других подсистем остается незатронутым (Damacio, 1990; Farah, 1990).