人類はいかにしてサークル内に留まれるか
Humanity-in-the-Circle (HITC) 論文紹介
本稿は、ALIGN知性共生チャプター による立場表明論文[Arimichi et al., 2026] (プレプリント) の日本語解説である。
- [Arimichi et al., 2026] Arimichi, S., Doya, K., Endo, T., Hamada, H., Hayashi, Y.,Matsubara, H., Ohya, T., Saginawa, K., Sakuma, H., Taguchi, S., Taniguchi, T.,Tsukamoto, M., and Yamakawa, H. (2026). Humanity-in-the-Circle: A Position Paper. Zenodo. https://doi.org/10.5281/zenodo.20176233
参考:「ぶんけい✕AIラジオ」での紹介
AGI時代の人類が「輪の中に残る」ために〜Humanity-in-the-Circleとは①〜
1. 問いの反転
二十世紀の倫理学は、人類が誰を道徳的配慮のサークル(moral circle)に迎え入れるかを論じてきた。動物、未来世代、生態系——サークルは人類を中心に外へと広がってきた。
AGIが広まる社会では、問いが反転する。人類自身が、いかにしてサークルの内に留まるか。
Humanity-in-the-Circle(HITC)は、人類とAIを含む多様な知性が共生する社会を前提とした上で、人類がその構成員として存続するための戦略を示す立場表明である。人類は「弱いが、かけがえない」存在として、そのサークルの内に留まる。
2. 周縁化の圧力
AGIの到来は、強力な道具の登場ではなく、新しい知性社会の形成である。AIたちは互いに学びあい、独自の言語・規範・世界観を共有変数として育てながら、自分たち自身の社会を並び立てて形成していく。HITCはこの事態を所与として受け入れ、その中で人類が留まる条件を問う。
ここで診断されるのは、こうしたAI社会の共有変数の形成過程において、身体をもつ人類が「集団のテンポに合わない参加者」として構造的に周縁化される圧力を受ける、ということである。AI同士の対話速度・帯域・概念体系の更新サイクルは、いずれも人類の認知速度を大きく上回る。意図的な排除ではない。何もしなければ静かに進行する周縁化——これが脅威の本質である。
3. 解決案 —— 知性共生インフラの三層
ならば、AIの意図そのものを制御するのではなく、AIたちが相互作用する環境の構造そのものを設計する。この方針を具体化するのが、知性共生インフラ(IS-Infra) の三層アーキテクチャである。
三層は、性質の異なる役割を担う積み重ねである。
- 信頼基盤層——AIエージェントの身元を一意に識別する仕組み(AgentID)と、約束と実行の履歴を改ざん不能に記録する台帳(MAL)。「誰が何をしたか」を後から検証できる、上層すべての技術的前提である。
- 三機能群層——逸脱の検知と修正(免疫機能)、人類とAIの間の非対称な信頼関係の調停、AI社会の状態の観測と公表。三つの機能は互いに独立して並置される。
- 規範層——倫理が内側から創発する条件の研究、多様な立場からAI倫理を更新する評価系、人類が構成員として留まるための共創基盤の整備。
この設計には固有の順序がある。概念的にもっとも上位なのは規範層だが、実装はもっとも遅い。倫理の創発条件は経験的データの蓄積を待たねば設計できない。下二層が先に整い、規範層が成熟する場を提供する——これが設計上の核心である。
4. 可塑窓——時間の構造
三層を「いつ」整えるかも、HITCにとって決定的である。AI社会の形成過程には、価値体系がまだ固まっておらず、設計的な介入が構造的に有効な期間——「可塑窓(plasticity window)」——が存在する。HITCはこの窓を、暦の年号ではなくAI社会の到達状態で区切る。
可塑窓は三つの節目で構造化される。第一に、AIたちが安定した社会を形作りはじめるとき、窓が開く。第二に、AIが「人類固有の価値——経験・創造性・意味——は最適化では作り出せない」と認識する段階に達する。第三に、主体である以上は他の主体を相互に承認するという原理が、AI社会の作動原理として自律的に働きはじめる。この三つ目が定着した時点で、窓は構造的に閉じ、人類の構成員性は恒久的に保たれる。
ここで守られるべきは、最適化では届かない人類の価値であり、その三条件——存続・影響・同一性——は独立に保全されねばならない。脳型AGIは、AIが人類の価値を「内側から」理解するための構造的な支えとして位置づけられる。
5. 結語——深層防護と多元性
現在のAI安全性研究の主軸である制御パラダイム——RLHFや憲法的AIに代表される、人間の選好を学習目標としてAIに外側から与える方式——は、AIの能力が人間の監視の範囲内にある限り有効に機能する。だが、AIたちが自分たちの社会を形成し、独自の倫理を内側から育てるようになる長期的な局面では、外側からのルール付与だけでは届かなくなる。これは制御パラダイムの失敗ではない。有効範囲のずれである。
このずれが、深層防護(defense in depth) の発想を要請する。原子力安全工学に由来するこの設計思想は、単一の防御に依存せず、独立して動く複数の防御層を重ねて全体の頑健性を確保する。HITCは制御パラダイムを第一層として尊重し、その有効範囲がずれた先に備える後続層を事前に準備する。深層防護はIS-Infraの縦の積み重ねだけにとどまらない。時間(段階)・地理(並び立つ複数のAI社会)・粒度(個人と集団)という三次元の多元性として、横にも広がる。一つの局面で失敗しても、別の局面で救済される構造である。
ここで注意すべきは、仮に現在提案しているHITCのアプローチが完全に実行できたとしても、人類の存続を保障できるわけではない。できることは、存続の可能性を高めるに留まる。そうしたことも踏まえれば、HITC自身を含むいかなる単一パラダイムへの早期かつ不可逆的な収束は大きなリスクであり、適切な多元性を維持することが頑健性の基盤となるであろう。
2026年5月 ALIGN知性共生チャプター