Главное меню

Реклама

Глава 5. Восприятие - Локализация

Содержание материала

 

Локализация

Чтобы знать расположение окружающих предметов, первое, что надо сделать, — это отделить объекты друг от друга и от фона. Затем перцептивная система может определять положение объектов трехмерного мира, включая их удаленность и характер движения.

Сегрегация объектов

Изображение, спроецированное на сетчатке глаза, является мозаикой из элементов различной яркости и цвета. Перцептивная система каким-то образом организует эту мозаику в ряд дискретных объектов, выступающих на некотором фоне. Такого рода организацией весьма интересовалась гештальт-психология — направление в психологии, возникшее в Германии в начале XX века. Гештальт-психологи особую важность придавали восприятию целостных объектов или форм; они предложили ряд принципов, по которым мы организуем воспринимаемые объекты.

Фигура и фон. В стимуле, который состоит из двух и более различных участков, мы обычно видим одну часть как фигуру, а другую — как фон. Участки, видимые как фигура, содержат интересующие нас объекты: они кажутся более твердыми, чем фон, и видятся впереди фона. Это простейший вид перцептивной организации. Рис. 5.4а показывает, что организация по принципу фигуры и фона может быть обратимой. Если вы посмотрите на эту картинку несколько секунд, то заметите, что в качестве фигуры можете воспринимать вазу или два профиля. То есть один и тот же контур можно видеть как часть одного или другого объекта. Тот факт, что вы можете делать это сами, говорит о том, что организация фигуры и фона является не частью физического стимула, а результатом работы нашей перцептивной системы.

 

Рис. 5.4. Обратимость фигуры и фона. Три паттерна, на которых можно видеть либо белую вазу, либо два черных лица. Обратите внимание, что мы не можем видеть обе организации одновременно, даже если вы знаете, что обе они могут быть восприняты. Если белая область меньше по площади (а), вы скорее будете видеть вазу; если же меньшую площадь занимает черная область (б), вы скорее будете видеть лица.

 

Заметьте также, что лица и вазу невозможно увидеть одновременно. Вы «знаете», что можете увидеть каждое из этих изображений, но вы не можете «видеть» и то и другое изображение в один и тот же момент. Вообще говоря, чем меньше по размерам рассматриваемая область или форма, тем более вероятно, что вы сможете увидеть ее как фигуру. Это можно продемонстрировать, сравнив рис. 5.4а, б и в. Вазу легче увидеть, когда меньше по размерам белая область, а лица легче увидеть, когда меньше черная область (Weisstein & Wong, 1986).

На рис. 5.5 показан более сложный вариант обратимости фигуры и фона. (Заметим, что отношения типа фигуры и фона могут восприниматься не только зрительно, но и в других модальностях. Например, можно слышать пение птицы на фоне уличных шумов или мелодию скрипки на фоне звуков остального оркестра.)

 

Рис. 5.5. Невольничий рынок с исчезающим бюстом Вольтера. Обратимая фигура находится в центре этой картины Сальватора Дали (1940). Две монашки, стоящие под сводчатым проходом, превращаются в форму бюста Вольтера.

 

Группировка объектов. Мы не только видим объекты на некотором фоне, но и группируем их определенным образом. Даже когда мы смотрим на простые паттерны из линий или точек, они объединяются в группы.

В качестве примера посмотрите на матрицу из точек, показанную на рис. 5.6а. Эти точки расположены на равных расстояниях друг от друга, поэтому их можно видеть как организованные в ряды и колонки и даже по диагональным линиям. Таким образом, перед нами неоднозначный паттерн, сходный по своим принципам организации с изображенными на рис. 5.4 и 5.5. Только одну из организаций можно видеть в каждый момент времени, и периодически происходит переключение между этими организациями.

 

Рис. 5.6. Гештальт-детерминанты группировки. а) Точки, расположенные на равных расстояниях, могут зрительно восприниматься как ряды, колонки и даже диагонали. б) Группировка в колонки по смежности. в) Группировка в колонки по цветовому сходству. г) Группировка в колонки по сходству формы. д) Группировка по (вероятному) продолжению. е) Группировка по замыканию (контура).

Гештальт-психологи предложили ряд детерминант, определяющих группировку такого рода точечных паттернов. Например, если сократить расстояния между точками по вертикали, как на рис. 5.6б, вы скорее всего будете видеть колонки. Такой тип группировки называется группировкой по смежности. Если вместо изменения расстояний между точками мы изменим цвет или форму элементов, мы получим организацию точек на основе сходства (рис. 5.6в, г). Если мы переместим точки так, чтобы они располагались вдоль двух пересекающихся линий, мы получим группировку по вероятному продолжению (рис. 5.6д). А если мы с помощью линий, состоящих из точек, оградим замкнутое пространство, мы будем видеть группировку по замыканию (рис. 5.6е). Обратите внимание, что в последнем случае мы видим ромб, ограниченный двумя линиями, несмотря на то что данный паттерн может быть описан как хорошо знакомая нам буква М, отраженная зеркально по вертикали, или как буква К, отраженная по горизонтали. Этот факт свидетельствует о значительном влиянии гештальт-детерминант. Такие детерминанты помогают нам образовывать наиболее стабильные, согласованные и простые формы, возможные в рамках данного паттерна.

Современные исследования визуальной группировки показывают, что гештальт-детерминанты оказывают сильное влияние на восприятие. Так, например, в одной серии исследований визуальные цели, являвшиеся частью более крупных паттернов, основанных на смежности, было значительно сложнее обнаружить, чем те же формы, воспринимающиеся как расположенные отдельно от общей группы (Banks & Prinzmetal, 1976; Prinzmetal, 1981). В другой серии исследований цели, отличающиеся по форме и цвету от нецелевых изображений, оказалось легче обнаружить, чем более сходные с ними (Triesman, 1986). Даже сходство между различными нецелевыми изображениями оказывает значительное влияние: цели тем легче обнаружить, чем больше сходство между нецелевыми изображениями, что заставляет цели «выскакивать» из фона, как отличные от него (Duncan & Humphreys, 1989). Наконец, существуют стойкие иллюзии, связанные с гештальт- детерминантами; например, люди оценивают расстояния между элементами, составляющими визуальные группы, как меньшие, чем расстояния между элементами, принадлежащими к различным группам (Coren & Girgus, 1980; Enns & Girgus, 1985). Все эти данные свидетельствуют о том, что визуальная группировка играет важную роль в организации нашего визуального опыта.

Хотя перцептуальная группировка изучалась преимущественно на примере зрительного восприятия, аналогичные детерминанты группировки, по-видимому, существуют и для слухового восприятия. Группировка по смежности с очевидностью проявляется при слуховом восприятии (хотя в данном случае речь идет о смежности во времени, а не в пространстве). Например, четыре удара по барабану с интервалом между вторым и третьим ударом будут восприниматься как две пары ударов. Аналогичным образом, известно, что замыкание также играет важную роль в восприятии музыкальных тонов и более сложных стимулов (Bregman, 1990).

Восприятие удаленности

Чтобы знать, где находится объект, надо определить его удаленность, или глубину. Хотя нам кажется, что восприятие глубины не требует усилий, это замечательное достижение, которое мы имеем благодаря особенностям физического строения глаз.

Признаки глубины. Сетчатка глаза, будучи отправным пунктом зрения, представляет собой двухмерную поверхность. Это означает, что изображение на сетчатке — плоское и никакой глубины у него нет вовсе. Этот факт привел многих интересующихся восприятием (и ученых, и художников) к мысли о признаках удаленности — двухмерных характеристиках, позволяющих наблюдателю делать выводы об удаленности предметов в трехмерном мире. Существует несколько признаков удаленности, которые в сочетании друг с другом позволяют определить удаленность воспринимаемого объекта. Эти признаки можно разделить на монокулярные и бинокулярные, в зависимости от того, относятся ли они к зрению одним глазом или двумя.

Люди, видящие одним глазом, могут достаточно хорошо воспринимать глубину при помощи монокулярных признаков. Пять таких признаков показаны на рис. 5.7. Первый из них — это относительная величина. Если изображение содержит участок с похожими объектами, различающимися по величине, человек интерпретирует меньшие объекты как более удаленные (рис. 5.7). Второй монокулярный признак — это перекрытие. Если один объект расположен так, что он загораживает от взгляда другой, то закрывающий объект воспринимается человеком как более близкий (рис. 5.7). Третий признак — относительная высота. [Имеется в виду расположение изображения относительно верха (низа) плоского поля зрения, а не высота одного объекта сравнительно с другим. — Прим. перев.] Если некоторые из сходных объектов видятся выше, они воспринимаются как более удаленные (рис. 5.7). Четвертый признак называется линейной перспективой. Когда параллельные линии кажутся сходящимися, они воспринимаются как исчезающие вдали (рис. 5.7).

 

Рис. 5.7. Монокулярные признаки удаленности. Все эти признаки используются художниками для изображения глубины на двухмерной поверхности. Все эти признаки также присутствуют на фотографиях природных сцен, а также на образе сетчатки глаза.

Пятым ключевым признаком являются собственные и падающие тени. В тех случаях, когда та или иная поверхность сцены закрыта от прямого солнечного света, на нее падает тень. Если тень падает на тот же самый объект, который загораживает свет, она называется собственной. Если же тень падает на другую поверхность, не принадлежащую отбрасывающему тень объекту, она называется падающей. Оба типа теней являются важными ключевыми признаками глубины сцены, сообщая нам информацию о форме объектов, расстояниях между ними и местонахождении источника света в сцене (Coren, Ward & Evans, 1999).

Эти признаки были известны художникам еще сотни лет назад, поэтому они называются изобразительными признаками, и на любой картине можно найти не один такой признак.

Еще один монокулярный признак имеет отношение к движению. Вы вероятно замечали, что при быстрой езде (например, в скором поезде) кажется, что более близкие объекты быстро движутся в направлении, противоположном движению, а более удаленные объекты движутся медленнее (хотя тоже в обратную сторону). Тем самым разница в видимой скорости этих объектов служит признаком их относительной удаленности; этот признак называется параллаксом движения.

Видение двумя, а не одним глазами имеет ряд преимуществ для восприятия глубины. Поскольку глаза находятся в разных местах головы, каждый из них воспринимает трехмерный объект несколько под другим углом, и следовательно, каждому глазу этот объект видится немного иным. При слиянии этих разных изображений и возникает впечатление глубины.

Этот феномен можно легко продемонстрировать, если держать указательный палец правой руки близко к лицу и рассматривать его сначала только одним открытым глазом, а затем другим. Термин бинокулярная диспарантность используется для обозначения различий образов, видимых каждым глазом. Диспарантность наиболее сильна для объектов, находящихся на близком расстоянии, и уменьшается по мере их удаления. Далее трех-четырех метров различие образов, видимых каждым глазом, становится настолько незначительным, что бинокулярная диспарантность утрачивает свою эффективность в качестве признака глубины. Однако для многих повседневных задач, таких как доставание предметов или обход препятствий, различие образов является важным признаком глубины.

Стереоскоп Холмса—Бейтса, изобретенный в 1861 году Оливером Венделлем Холмсом и изготовленный Джозефом Бейтсом, давал живое восприятие глубины. [Принцип стереовосприятия, основанный на бинокулярном параллаксе, впервые (1838 г.) сформулировал сэр Ч. Уитстон; он же построил первый зеркальный стереоскоп собственной конструкции. — Прим. ред.]

У людей и видов животных, обладающих бинокулярным зрением, зрительный отдел мозга использует бинокулярную диспарантность для размещения объектов в различных точках пространства в зависимости от того, насколько различаются образы объекта при сравнении. Если образы объекта для обоих глаз находятся в одном и том же месте, мозг делает заключение, что это то место, на котором фиксируется взгляд обоих глаз. Если различие между образами велико, как это имеет место при рассматривании пальца, помещенного перед самым лицом, мозг заключает, что объект находится значительно ближе.

Помимо того что бинокулярная диспарантность помогает нам воспринимать глубину окружающего нас мира, она может быть использована для создания иллюзии глубины, когда она фактически отсутствует. Одним из способов достижения такого эффекта является использования прибора, называемого стереоскопом, в котором каждый глаз рассматривает отдельную фотографию. В викторианскую эпоху такие устройства гордо демонстрировались в гостиных представителей среднего класса, как широкоэкранные телевизоры сегодня. И все же стереоскоп является не просто любопытным предметом старины. Тот же самый принцип бинокулярной диспарантности используется сегодня в детских игрушках, в «спецэффектах» стереокино, где зрители должны сидеть в очках с цветными или поляризационными фильтрами, и в популярных книжках и плакатах «Волшебный глаз». Принцип, лежащий в основе всех этих иллюзий, проиллюстрирован на рис. 5.8.


Рис. 5.8. Магия трехмерного зрения в иллюстрациях. Обычно, рассматривая изображение, например цветы, показанные слева (а), взгляд обоих глаз сходится в точке, принадлежащей плоскости картины. В этом случае оба глаза получают идентичные образы и поверхность выглядит плоской. Любая иллюзия трехмерного пространства основана на обмане зрения с помощью изображений, при разглядывании которых взгляд обоих глаз сходится в точке, не принадлежащей картинной плоскости, как на рис. справа (б). В этом случае оба глаза получают несколько различные образы. Если обмануть мозг, заставив его думать, что различные образы принадлежат одной и той же сцене, либо за счет сходства образов, воспринимаемых обоими глазами (серия книг «Волшебный взгляд»), либо направляя зрительные образы через призму (игрушки «Мастер видения»), некоторая несогласованность образов (диспарантность) будет устраняться за счет отнесения объектов к различным точкам пространства.

Восприятие направления. Идея признаков удаленности состоит в том, что наблюдатель замечает некоторый решающий признак (например, что один объект кажется больше другого) и затем делает из этого бессознательный вывод об удаленности объекта. Это понятие о бессознательном умозаключении ввел Гельмгольц в 1909 году. Оно продолжает оставаться ключевым понятием в исследованиях восприятия (Rock, 1983), хотя некоторые психологи предлагали другой подход к восприятию глубины.

Так, Гибсон утверждает (Gibson, 1979, 1966, 1950), что мы не строим умозаключений о глубине, а воспринимаем ее непосредственно. Чтобы оценить его идею, подумаем, где чаще всего человек ищет информацию о глубине. Гибсон полагает, что люди не ищут носящиеся в воздухе признаки объектов и не пытаются определить их относительную величину, перекрытие или относительную высоту, а ищут на самом деле информацию на самой земле. Лучший пример такой информации — градиент текстуры (рис. 5.8). Градиент текстуры возрастает, когда мы смотрим на поверхность в перспективе. По мере удаления поверхности элементы, составляющие ее текстуру, кажутся расположенными все плотнее и ближе друг к другу. Такой градиент создает очень сильное впечатление глубины.

В отличие от стандартных признаков удаленности, градиент распространен по огромной зоне видимости, и куда бы вы ни направились, вы всегда сможете по градиенту определить удаленность всякой другой точки. Следовательно, на сетчатке глаза информация о градиенте остается постоянной или, пользуясь термином Гибсона, инвариантной. Согласно Гибсону, восприятие глубины определяется непосредственным восприятием таких инвариантов. Так, при восприятии глубины какой-либо сцены нам не нужно обрабатывать информацию, содержащуюся в разбросанных повсюду признаках глубины: вместо этого можно непосредственно воспринимать информацию, которую дает градиент текстуры (Goldstein, 1989).

Восприятие движения

Чтобы успешно передвигаться в окружающей среде, надо знать не только положение неподвижных объектов, но также и траектории движущихся. Нам надо знать, например, не только то, что объект, расположенный в нескольких метрах впереди, — это мягкий бейсбольный мяч, но и то, что он приближается к нам с большой скоростью. Это приводит нас к вопросу восприятия движения.

Стробоскопическое движение. Что позволяет нам воспринимать движение? Первое, что приходит в голову, — это что мы видим объект движущимся, когда его изображение перемещается по сетчатке. Однако этот ответ оказывается слишком простым, поскольку движение мы видим даже тогда, когда на сетчатке ничего не движется. Это явление в 1912 году продемонстрировал Вертгаймер в своих исследованиях стробоскопического движения (рис. 5.9). Стробоскопическое движение проще всего получить, если делать вспышку в темноте и через несколько миллисекунд делать другую вспышку на небольшом расстоянии от первой. При этом будет казаться, что свет движется от одного места к другому, причем это будет неотличимо от настоящего движения.

Рис. 5.9. Стробоскопическое движение. Четыре кружка слева означают четыре лампочки (а). Если они вспыхивают одна за другой с небольшими темными интервалами, будет казаться, что непрерывно движется единственный источник света, как это показано в правой части рисунка (б). Это стробоскопическое движение. Его же мы видим в кино и по телевизору.

Движение, которое мы видим в кино, тоже стробоскопическое. Фильм — это просто последовательность неподвижных фотографий (кадров), каждый из которых немного отличается от предыдущего. Кадры проецируются на экран в быстрой последовательности с интервалами затемнения между ними. Скорость предъявления кадров имеет решающее значение. На заре кинематографа частота кадров равнялась 16 в секунду. Это было слишком медленно, и, как следствие, в первых фильмах движение казалось слишком быстрым, отрывистым и бессвязным. Сегодня частота кадров обычно равна 24 в секунду, причем, как правило, каждый кадр предъявляется несколько раз подряд, чтобы уменьшить эффект подергивания.

Индуцированное движение. Еще один случай восприятия движения при отсутствии движения на сетчатке — это явление индуцированного движения. Когда большой объект, расположенный вокруг маленького, движется, то может казаться, что на самом деле движется маленький, хотя он и неподвижен. Первым в гештальт-психологии это явление изучал Дункер в 1929 году. Он помещая испытуемых в темную комнату и предъявлял им небольшой светящийся круг внутри большего светящегося контура прямоугольника. Когда прямоугольник сдвигался вправо, испытуемые говорили, что круг движется влево. Это явление можно наблюдать в ветреную ночь, когда кажется, что луна пробегает за облаками.

Этот феномен также проявляется, когда нам кажется, что наша машина катится назад, когда мы останавливаемся у светофора, несмотря на то что мы давим ногой на тормоз. В этом случае индуцирующим стимулом часто является большой грузовик, который мы видим краем глаза, медленно двигающийся вперед. При этом нам кажется, что двигается наша машина, несмотря на то что у нас отсутствуют вестибулярные ключевые признаки такого движения.

Реальное движение. Разумеется, наш зрительный аппарат также восприимчив к реальному движению, то есть к движению объекта через все промежуточные точки пространства. Тем не менее анализ такого движения в обычных условиях восприятия отличается поразительной сложностью.

Одни траектории движения на сетчатке должны распознаваться как движение глаз по неподвижной сцене (как это происходит, когда мы читаем). Другие траектории движения должны быть отнесены к движущимся объектам (например, к птице, попавшей в зрительное поле). Кроме того, некоторые объекты, образы которых на сетчатке являются неподвижными, должны восприниматься как движущиеся (например, образ птицы, за полетом которой мы следим взглядом), тогда как другие объекты, образы которых на сетчатке движутся, должны восприниматься нами как неподвижные (например, образ фона, движущийся относительно нашего взгляда, следящего за полетом птицы).

< Рис. Для того чтобы поймать мяч и уйти от атаки соперника в спортивной игре, игроки должны обладать точным восприятием движения.>

Поэтому нет ничего удивительного в том, что результаты осуществляемого нами анализа движения являются в высшей степени относительными. Мы намного легче распознаем движение, когда мы можем видеть объект на фоне структурированного заднего плана (относительное движение), чем когда фон имеет однородную окраску и мы можем видеть лишь движущийся объект (абсолютное движение).

Определенные паттерны относительного движения могут даже служить значимыми признаками формы и типа трехмерных объектов. Так, исследователи обнаружили, что дисплеи, показывающие человеческое движение, как изображено на рис. 5.10, дают достаточную информацию, позволяющую наблюдателям определить, какой вид деятельности демонстрирует человеческая фигура, даже хотя она изображается с помощью 12 (а иногда и меньшего числа) световых точек, движущихся относительно друг друга (Johanson, von Hofsten & Janson, 1980). В других исследованиях, проводимых с использованием таких дисплеев, наблюдатели могли идентифицировать своих друзей и даже сказать, является ли демонстрируемая модель мужчиной или женщиной, видя лишь световые источники, прикрепленные к лодыжкам (Cutting, 1986).

 

Рис. 5.10. Паттерны движения человека. Перед вами пример типа наглядных материалов, используемых исследователями для изучения паттернов человека в движении. Расположение источников света, укрепленных на теле человека, указано на рисунке (а). Последовательность позиций движения, совершаемого танцующей парой, представлена на рисунке (б).

 

Еще одно важное явление, относящееся к реальному движению, — это избирательная адаптация. Она заключается в потере чувствительности к движению во время наблюдения за ним; избирательность этой адаптации заключается в том, что человек становится нечувствителен к наблюдаемому движению и к движениям с похожими параметрами, но не к тем движениям, которые значительно отличаются по скорости или направлению. Например, если человек смотрит на полосы, движущиеся вверх, он теряет чувствительность к движению вверх, но на его способность видеть движение вниз это не влияет (Sekuler, 1975). Как это происходит и с другими видами адаптации, человек обычно не замечает такую потерю чувствительности, но замечает вызываемое адаптацией последействие. Так, если несколько минут смотреть на водопад, а затем посмотреть на скалу рядом, то покажется, что она движется вверх. Большинство видов движения вызывают такой эффект последействия — движения в обратном направлении.

По поводу того, как мозг осуществляет восприятие реального движения, можно сказать, что некоторые параметры движения кодируются определенными клетками зрительной коры. Эти клетки реагируют на одни движения, не реагируют на другие, и каждая клетка сильнее всего реагирует на движение какого-либо одного направления и скорости. Лучшее подтверждение существования таких клеток получено в экспериментах с животными, где регистрировалась активность отдельных клеток во время предъявления животному стимулов с различными паттернами движения. В этих исследованиях были обнаружены клетки коры, настроенные на определенные направления движения. Есть даже клетки, настроенные специально на обнаружение объектов, движущихся в направлении головы, что, очевидно, полезно для выживания (Regan, Beverly & Cynader, 1979). Все-таки удивительно, насколько работа зрительной коры распределена между различными зонами и клетками.

Существованием специализированных клеток, обнаруживающих движение, можно объяснить эффекты избирательной адаптации и последействия наблюдаемого движения. Например, избирательная адаптация к движению вверх возникает из-за усталости клеток коры, специализированных на таком движении; а поскольку клетки, специализированные на движении вниз, работают как обычно, они начинают доминировать при обработке, создавая эффект последействия в виде движения вниз.

Однако неврологическая основа восприятия реального движения состоит не просто в активации конкретных клеток. Движение молено видеть и в темноте при слежении за движущимся светящимся объектом (например, за самолетом ночью). Поскольку глаза следуют за объектом, изображение на сетчатке совершает только небольшие нерегулярные движения (из-за неточного слежения взглядом), и тем не менее человек воспринимает равномерное непрерывное движение. Почему? Ответ, видимо, в том, что двигательные отделы переднего мозга посылают информацию о движении глаз в зрительную кору, что оказывает влияние на видимое движение. В сущности, моторная система информирует зрительную систему о своей причастности к отсутствию плавного движения на сетчатке, и тогда зрительная система исправляет этот недостаток. В обычных зрительных ситуациях есть и движения обоих глаз, и большие движения изображений на сетчатках. Задача зрительной системы в том, чтобы объединить информацию от этих двух источников и определить характер воспринимаемого движения.