以下は視覚を勉強しての感想的意見である


1.“What”と“Where”という分類の曖昧さ

たしかに二つの経路はあるのだろう。それが二つなのかどうかは別として(三つの経路モデルを提示しているものもある)…

しかし“What”と“Where”という分け方(特徴付け)は、現在可能な手段による観察結果を帰納的に分類したものでしかない。それは本質的なものではなく“そのように見える”だけであろうと、強く思う。

しかも“Where”という特徴付けは的を外れているように思える。非常に“英語的”な表現でもあり、我々があえて使う必要はないと思う。

以後は、この用語を用いず、腹側経路と背側経路の名で表現していく。

2.視覚情報の腹側経路と背側経路への分離の意味

文献を読んでみての印象だが、

腹側経路は大づかみに言うと「パターン化」の機能を果たしているようだ。それはいわば、脳内画像を圧縮、整理する画像処理ソフトのような働きではないだろうか。

画像の関心領域にフォーカスをあわせ、他の情報を最低限まで絞ることに主たる目的がある。

最終的に出来上がった画像はさらに高位に送られ、それを用いて“作業”が行われる。その際には作業用メモリーが必要なので、メモリーに無理なく載せられる程度まで圧縮したほうが良いだろう。

立体視、色付け機能などがいろいろ研究されているが、それは枝葉末節だろう。肝心なことは人間にとって“役に立つ”画像を作成することだ。それを「パターン化」と呼んでおく。

これに対し、背側経路は画像の“動画化”の機能を持つ。これは連続した画像を流すことにより、画像情報に時間軸を与えることである。静止画と比べた動画の長所は色々ある。思いつくままにあげてみよう。

1.絵の中の目的とするものが動く。「どこ」だけをとってみても、どこから、どこまで、どんな速度でと色々だ。

2.時間経過が分かる。いつから、いつまで、

3.変化がわかる。何が何へ、どのように、

4.見ている本人の変化がわかる(客観的座標があれば)。眼球がどの位置で、どの傾きで、どこを向いているかなど

3.腹側経路へ行く情報と背側経路へ行く情報は、情報の質が違う

V1,V2で処理された画像はV3で振り分けられて高位に送られる。腹側経路へは保存用のデータ、背側経路へは動画作成用のデータである。背側経路へ送られるデータは、肝心の対象さえ分かればいいくらいの強圧縮をかけられているだろう。白黒画像の可能性もある。

ただV3→V5の経路は実ははっきりしていない。1対1の対応ではなく、V4からも行っている可能性がある。

4.元々の視覚は腹側経路のみではないか

外側膝状体のことを書いていて、ふと思ったのだが、でき始めの動物では、視覚は外側膝状体で終わりだったのではないか。網膜の視細胞というのは元々は脳細胞だったそうだ。これが視神経という束になって外側膝状体に入る。そこで視神経は終わって、次の走者にバトンタッチする。

しかし外側膝状体というのは視床(前脳)の一部であり、ここから錐体路系(末梢運動神経の総称)にはチョクで神経が行っているはずだ。「見る、動く」これだけでも眼は立派に役割を果たしている。「あとは司、司でやってくれ」ということになれば勝負は早い。

元々の動物が生きる上での掟は「捕食すること、捕食されないこと」だから、余分なことは考えないほうが良いに決まっている。

それが、それだけでは生きて行けず、頭を使わなければ生き延びられない状況になれば、眼を「見る」だけの機能だけではなく、他のことにも利用しようということになる。だから、話が複雑になる。

私はそれが対象のパターン化であり、そのための一次視覚野から側頭葉へのループ形成ではないかと思う。それは繰り返される経験の記憶化であり、一種の学習だと思う。

考えて見れば、網膜の視細胞で撮影した画像は、すでに基本的にはデジタル情報だ。数億の視細胞が集合して一つの画像を作るのだから、最近のデジカメなど足元にも及ばないほどの画素数になる。

それを視神経の束にして、あまつさえシナプス接合さえして、一次視覚野に送ってそれをそっくりそのまま視覚野に再生するのはバカバカしい限りである。霊長類では大脳の後ろ3分の1が視覚情報の処理のためのものだ。一体これは何なのだろう。

5.一次視覚野はデータ圧縮のための装置

おそらくはその「バカバカしさ」に理由が隠されているのだろう。それは究極的には記憶するための処理なのではないかと、私は考える。一次視覚野に作られた画像はあくまでも「脳内画像」であり、網膜が形成するプライマリー画像とは違うものなのだ。

各種研究によれば、V1,V2でフォーカシングなど下処理をして、腹側経路を通じてV4に脳内画像が送られるという。フォーカシングというのは、逆に言えば関心領域以外の情報のアウトフォーカシングだ。私はこれはデータの圧縮ではないかと思う。PCM録音されたWAVファイルをmp3にエンコーディングするようなものだ。

V4はこれらの脳内画像をおそらくはパターン化して、最終処理したあと後下側頭野へと入っていく。そこで短期記憶として“RAM”に突っ込まれ、メモリー上の作業に関わっていく。我々は日常パソコンを作業する上ではメモリーの上で行っている。メモリーなしにパソコンは動かないのだ。だからメモリーの上で快適操作できる大きさの「脳内イメージ」まで減量しないといけない。

さらにそこから選択されたものが長期記憶として海馬(ハードディスク)に送られるのではないだろうか。

脳内画像のパターン化にはある種の意味付けというかシンボル化が施される。一説ではここで文字が解読されるという。これについては別の機会に勉強してみよう。

6.背側経路は視覚の機能に付加された機能ではないか

MT野へとつながる背側経路の主要な機能は「動画化」だと書いた。これはじつはどの文献にも書いてないことだ。

MT野に関する多くの文献で、重要な機能として“スピード感覚”が指摘されているが、これに論理的違和感を感じたのである。「そんなもの視覚じゃねぇよ」という反論である。

ただ観察されている事実は事実である。「一体スピード感覚を生じさせるメカニズムは何なのだ」と考えて行く内に、脳内画像に動きを与える作業なしにそのような機能は作り得ないという結論に達した。つまり動画化が本質であり、スピード感はその結果として得られる感覚である。

スピード感はものを見て識別するという視覚本来の機能ではない。スピードとか傾き(重力に対する)というのは全て時間の関数だ。そもそも視覚情報には時間に関わる情報はない。

網膜に映るリアル画像はまさに動画である。しかしこの動画は、そのままでは何の処理もできないし貯蔵も効かない。そこでいったん脳内画像に落とすのだが、素材としての脳内画像は基本的には二次元情報だ。ただの平面である。厚みもないし動きもない。これに厚みを与えるのは両眼視の統合による偽立体視だ。一方音というのは一次元情報で時間軸の上のみに存在する。サラウンドステレオで音の渦に包まれようともプレーヤーの再生を止めればそこに残るのは無だけだ。

7.脳内画像から動画を再構築する

そこから動画を再構築(リコンストラクション)するにはどうしたらよいか。

次元は違うが、我々はCT画像の再構築で同じ方法を用いている。CT画像を積み重ねて、擬似的に高さ要素を加え、3D表示画像をつくり上げるのである。動画は時間軸に画像を積み重ねて、擬似的に時間を創りだすのだろう。

ただCTは時間をかけて美しい画像をつくり上げるのだが、我々にはそんな余裕はない。基本的にはリアルタイムでやっていかなければならないのである。

このような厳しい状況を克服するためには、大きな作業用メモリー、素早い演算回路も必要だが、最大の手段は情報量の徹底した節約である。端的に言えば白地に1点だけ黒丸があればよい。そのためには物を“ものA”としてではなく“点A”としてみるシンボル化の作業が不可欠だ。その上で、画像をトレーシングペーパーのように重ね、“点A”をプロットしていく。そして100枚目の画像の“点A”との距離を測って、100で割るという作業になる。

絵が必要ならV4あたりからフィードバックして貼り合わせればよい。

こうして見ていくと、スピード感覚などという視覚との関連不明な枝葉末節より、視覚対象の思い切った単純化と視覚記憶の100枚重ねという機能のほうがはるかに本質的ではないか。

この頭頂葉経由のルートは、外側膝状体に対する視覚野の腹側経路がそうだったように、最初は本線ではなく脇道だったのかも知れない。

8.脳内画像を動画化することは時間軸を創設すること

むかし子供の頃、映画のコマ数は1秒に24枚だと聞かされたことがある。なぜなら人間の脳には1/24秒間残像が残るのだそうで、その残像が消えるときに次の絵を送れば、動画はシームレスとなりぎこちなさがなくなるのだという話だった。

こんなうろ覚えのあやふやな話を出発点にして議論を進めるのははなはだ恐縮だが、とりあえずお許し下さい。後で確認します。

これが事実とすると人間の脳内画像は1/24=0.04秒位に1枚の割合で作成されていることになる。だとすれば、脳内動画はそれ自体が立派な体内時計となる。V5では次々に画像を重ねることで、「擬似的な時間軸」を創造しているのではないか。

頭頂連合野はその情報をAIPを通じて受け取り、それを脳内クロック代わりにしていろんな行動(とくに連続技)をセットしているのではないだろうか。

背側経路は“Where 経路”と呼ばれているが,むしろ“When 経路”ではないか。画像にはWhen はないが、V5はそれを付け加えるのである。When はHow への足がかりともなるし、ひいてはWhy の足がかりともなる。(ケネディ暗殺事件におけるサプルーダー・フィルムを想起せよ)
もう一つは連続的な認知の足がかりとしての意義である。「見る→捕まえる」あるいは「見る→逃げる」から「見ながら捕まえ、あるいは逃げる」ことへの発展である。これが頭頂葉を介在させる「認知→行動」反応である。

9.背側経路の障害とゲルストマン徴候

ところでゲルストマン症候群の失行・失認だが、症例報告()でも示されているように、下位中枢の障害による失行・失認とはあきらかに症状を異にしている。「取れるはずなのに取れない」のである。
これは厳密な意味では失行・失認ではなく、“失時間”ではないのだろうか。時間と行っても1時間、2時間という時間ではなく、長くても1秒未満くらいの長さで、時間感覚がなくなる、映画のフィルムで言うとコマが飛んでしまうのである。
眼 をつぶっていても出来ること(体性感覚に基づく行為)ならスラスラと出来るのに、目を開けて対象を見つめながらやると失敗してしまう。いわば逆ロンベルグ現象みたいな現 象が起きるのではないかと想像する。(ロンベルグ現象というのは脊髄に障害があって歩行失調がある人が、開眼時には立っていられるのに閉眼すると突然立て なくなってしまう現象。これは歩行失調が視覚によって補正されていることを示す)
ゲルストマンによる失書の人は、書字ができないがキーボード入力は何の支障もなく出来るそうだ。そういえば私も、あまり字を書かなくなったから、カルテを書くときに漢字のヘンだけ書いて次の字に行ってしまったりすることがある。これはやばいぞ。


補) ザプルーダー・フィルム(Zapruder film): エイブラハム・ザプルーダーは現場近くで婦人服製造会社を経営していた。当日は、ベル・ハウエルの高級8ミリ・カメラを持参し間近でパレードを撮影していた。

12:30 ザプルーダー・フィルムによれば、エルム通りへのコーナーを回って,陸橋方向へ41メートル進んだ地点で,丘からの第1発がケネディの首に命中.続いてダルテックス・ビルからの第二発目が右肩下に命中.同時に教科書会社から発射された弾丸はコナリー知事の右肩口を直撃.右胸に貫通し右手首,左股に傷を与える.4発目はダルテックス・ビ ルから発射されたが大きく外れる.5発目は丘から発射され,ケネディの右後頭部を撃ち抜く.ここまで6秒間.
ここまで明らかな動画像を認められない人は、ゲルストマン症候群だ。

「失書・失算」症候群 (ゲルストマン徴候の不全型)

をお読みください。