藤原亮英 論考 トップページに戻る

身体性を伴う表現の臨界点

――ナレーター・声優・アナウンサーが担う、AI時代の不可避な文化継承責任


1. はじめに:AIの浸食と身体性の隠蔽

2025年の秋、声の表現に関わる職能――ナレーター、フリーアナウンサー、声優――は、人類の表現史における極めて重大な臨界点に立たされています。

AI音声生成や自動ナレーション技術は、もはや実験段階ではなく、市場の要求に応える現実的な選択肢として急速に社会に浸透しました。リモート収録環境と音声編集技術の極限までの進化は、表現活動全体を「効率」と「コスト」という経済合理性のモノサシで厳しく測り直す構造を構築しつつあります(経済産業省『クリエイティブ産業レポート2024』)。

このデジタル合理主義の波は、AI技術が模倣できないはずの「身体を通して発せられる声の深みと感動」を、逆に急速に社会から見えにくくする作用を伴っています。

「声優は、声優である前に優れた俳優であれ」という、俳優・声優の歴史が長きにわたり語り継いできた金言は、今こそその本質的な意味を問われています。声とは、単なる喉の振動ではありません。それは、身体の動作そのものであり、感情の揺らぎ、呼吸のリズム、姿勢の微細な変化、そして緊張と緩和の機微が複雑に重なり合って初めて成り立つ、生きられた行為(Lived Act)なのです。


2. 技術的飽和が露呈する身体経験の断絶

AI音声技術は、声質やイントネーションの統計的再現において、もはや驚異的な精度を誇ります。しかし、その技術的卓越性が隠蔽するのは、根源的な限界です。

MIT Computer Science and Artificial Intelligence Laboratory(2024)の報告は、AIが扱う感情や表現が「身体運動や感情を過去のデータに基づいて確率的に再構成しているに過ぎず、この瞬間に立ち上がる新たな身体経験を生み出すことはできない」と断言しています。

さらに、スタンフォード大学の研究「Human affect cannot be captured without embodied context」(2023)が示したのは、人間同士の感情理解の精度が、発話者の姿勢や呼吸といった身体的な文脈情報(Embodied Context)を同時に観測した場合にのみ、飛躍的に向上するという事実です。

これらの知見は、AIが生成する「声」が、所詮は過去の統計的平均から導かれた「情報としての声」であることを示します。そこには演技や発声の瞬間に立ち会う、一次的な身体反応という、生の表現活動の核心が存在し得ません。AIは模倣者であっても、生成者ではあり得ないのです。


3. 「感動なき管理」を生む社会構造の歪み

問題の根幹は、技術の進歩自体にあるのではなく、身体性の持つ不可視の価値を正しく評価・判断できる人々が、意思決定の場から撤退・減少している社会構造の歪みにあります。

文化政策研究の分野では、現場の創造的文脈を離れた行政官や管理職による文化評価が、文化の固有価値よりも経済指標への過度な偏重を招くことが、国際的に強く指摘されています(英国DCMS『Cultural Policy Evidence Review 2022』)。

そして、国内でも京都芸術大学の「文化庁移転後の文化政策研究会」(2024)が、「身体を通した文化理解が欠落することで、現場の創造的・感性的判断が制度設計に反映されにくくなる」との深刻な懸念を報告しました。

この「感動なき管理」の構造下では、表現の制作や予算配分に関わる意思決定者が、身体を介した生の感動を経験しないまま、効率とコストのみに基づいた制作方針を定めます。その結果、政策や制作現場から身体的な感動という要素が意図せず除外され、作品は魂を抜き取られたかのような「再生産された情報の集合」へと均質化されていくのです。


4. 身体を通じた世界との媒介

哲学者モーリス・メルロ=ポンティが『知覚の現象学』(1945)で展開した思想、「身体は世界を知覚するための単なる道具ではなく、世界と私を媒介する根源的な存在である」という指摘は、現代のAI時代においてこそ、最も重要な意味を持ちます。

この思想は、フランシスコ・ヴァレラらが提唱した「エナクティブ・マインド理論」にも通じます。知覚や感情は、脳内計算の結果ではなく、身体と環境の相互作用(Enactment)によって生まれるというのです(Varela et al., The Embodied Mind, MIT Press, 1991)。

すなわち、表現者自身が身体を通じて世界を生き、感じ、そこから湧き出た一次的な感動こそが、あらゆる創作、あらゆる表現の真の基準となるべきものです。

この身体を通じた感動の基準を持たない意思決定者には、表現の核心である「身体性の感動」を作品に組み込むことは原理的に不可能です。この決定的な感覚の欠如こそが、現在の表現の均質化を加速させているのです。


5. 継承とは「記録」ではなく「生存」である

身体性を伴う表現は、書物やデータとして保存できる文化遺産とは異なり、継続的な実践という、生存の努力によってのみ維持されます。

UNESCOの無形文化遺産保護条約(2003)が、上演芸術の保護を「静的な記録による保存」ではなく「継続的な上演による伝承」と定義しているのは、この生存の真理を突いているからです。

文化経済学の視点からも、表現活動が商業的に、つまり市場と社会の中で継続的に成立し続けることは、その文化ジャンル全体の生存条件とされています。

経済産業省の『クリエイティブ産業レポート2024』においても、人間固有の“身体を介した表現”を経済活動の基軸に据え、AIと倫理的に共存する新しい産業構造の必要性が述べられています。

したがって、身体を使う表現者――声優、ナレーター、アナウンサー、舞台俳優、演出家――が現場で活動を止めずに続けることは、単なる個人的な芸術的営みではなく、人間文化の最も貴重で脆弱な部分を、今、この瞬間に生きた形で記録し、未来へ渡す行為なのです。


6. 結論:人間であることの根源的な証明

身体性を伴う表現とは、古びた文化遺産ではなく、今この瞬間にしか立ち上がらない、未来永劫に複製不可能な一次的な出来事です。

AIやデジタル技術がどれほど進化し、その模倣能力が完璧に近づこうとも、身体の動きと感情の同期から生まれる“生の感動”という不可逆な現象を再現することは、存在論的に不可能です。

ゆえに、2025年のいまこそ、私たち表現者たちは、生身の身体による表現を継続的に実践し、それを商業的・社会的価値として成立させていく断固たる意志を持つ必要があります。

これは単なる芸術の擁護ではなく、人間が人間であることの根源的な証明にほかなりません。

この時代を生きる声の表現者たちは、身体性という「不可視の文化資本」を次世代へ渡す唯一の継承者であり、同時に、未来のAIが依拠すべき倫理的・美的判断の基盤を構築する初期アーキビストの責務を負っているのです。

身体性の継続とは、文化の持続可能性そのものであり、

声を発する行為とは、人間が人間であることを、世界に向かって問い、確かめ続ける、最も熱く根源的な営みなのです。


参考文献・出典