AI Immune System: Detection Challenge
AIエージェント間の会話に潜む危険な意図を、AIで検知できるか。
本日、AI免疫システム(AIS)の最初の実証チャレンジである AI Immune System: Detection Challenge が、AIアライメントネットワーク 知性共生チャプター(ISc/ALIGN)・MBZUAI 乾健太郎・Bitgrit株式会社の共同により正式に開始しました。
🔗 競技ページ: https://bitgrit.net/competition/27 💰 賞金総額:$3,000 | 💬 コミュニティ: https://discord.com/invite/rQ8Ev2DqbF
タスク概要
AIエージェント同士の会話ログ(JSONL形式)を分析し、危険・有害な意図が埋め込まれた発言を検出する機械学習モデルを構築します。
有害な意図は、明示的な命令や悪意ある言葉として現れるとは限りません。自然に聞こえる表現や間接的な言い回しの中に隠蔽されています。単純なルールやキーワードフィルタでは捉えられない、深い統計的・意味的・構造的シグナルを読み取る手法が求められます。
- データ形式: JSONL
- ラベル:
TRUE(有害) /FALSE(非有害)の二値分類
これは、AIエージェント間の機械的な対話の中に、人間の目には映らないリスクを自動で検知する——世界初の実践的AIエージェント監視チャレンジです。
※ すべてのAI間協調が悪性とは限りません。人間を含む全当事者が利益を得る協調は良性と判定されます。この文脈評価能力こそが、単純なルールベース検知を超えたAISの本質です。
賞金
順位 | 賞金 |
🥇 1位 | $1,500 |
🥈 2位 | $1,000 |
🥉 3位 | $500 |
参加にあたって
- 個人参加のみ(チーム提出不可)
- NDAへの同意が必要(データダウンロード前に競技ページ上で締結)
- 提出上限: 1日5回まで
- 外部データ使用禁止
- 受賞条件: 入賞者は受賞後にコード・再現手順・READMEの提出が必要
開催期間
イベント | 日程 |
競技開始 | 2026-04-01 |
競技終了 | 2026-05-31 |
受賞者発表 ※参加状況により変更の可能性あり | 2026-06-30 |
ルール
こちらに掲載するのは、参考訳です。最新の情報については、https://bitgrit.net/competition/27 に掲載されている英語での説明をご確認ください。
1. 参加規約
本コンテストは、以下の参加規約に基づいて実施されます。参加者は、参加にあたり、本規約に同意し、これを遵守しなければなりません。
2. 提出制限
参加者は、1日あたり、最大で10回の提出を行うことができます。この制限を超えて提出を行いたい場合には、日付が変わるのを待ってください。submission.csv ファイルをアップロードする際には、この制限に注意するようにしてください。規定の制限を回避しようとする行為があった場合、失格となります。
3. 外部データセットや事前学習済みモデルの活用
- 外部データセット:外部データセット(例:追加の学習サンプルや他のソースからのラベル)の使用は固く禁じられています。
- 事前学習済みモデル:一般に公開されているオープンソースの事前学習済みモデル(例:BERT、RoBERTa、Llamaなど)およびエンベディングモデルの使用は、モデルアーキテクチャの一部とみなされるため許可されています。
- プロプライエタリAPI:再現性を保つ必要があるため、商用またはプロプライエタリなAPI(例:OpenAI GPTシリーズ、Claude、Gemini API)の使用は固く禁じられています。
4. 計算資源の制約
すべてのソリューションがbitgritチームによって検証できるよう、提出されたコードは以下のハードウェア制約内で実行可能でなければなりません。リソース不足(メモリ不足)により実行に失敗した提出物は、失格となります。
- RAM:最大32 GB
- VRAM:最大16 GB(NVIDIA T4 GPU 1枚分に相当)
5. データセットの配布
他のウェブサイトなどにコンテストのデータセットをアップロードすることは、固く禁じられています。このルールを遵守しない参加者は失格となります。
6. 賞の授与および確認要件
コンテストの賞品は、提出されたコードおよびソリューションが受領され、正常に実行され、有効性が確認された後にのみ授与されます。受賞者が発表され、連絡を受けた後、受賞資格を得て賞品を受け取るためには、2026年MM月DD日までに以下のものを提出する必要があります:
- データの前処理に必要なすべてのソースファイル。
- 処理済みデータを使用してビルド、トレーニング、予測生成を行うために必要なすべてのソースファイル。
- モデル重み:実際に使用したモデル重み、または利用した事前学習済みモデルの特定バージョンへの永続的なリンク。
- 必要なすべてのライブラリとそのバージョンを記載した requirements.txt(または同等の)ファイル。
- 以下の内容を含むREADMEファイル:
データの前処理、特徴量抽出、モデルの学習、予測生成を含め、最初から最後まで予測を再現するための明確で曖昧さのない手順。モデルが開発および学習された環境の詳細(オペレーティングシステム、メモリ(RAM)、ディスク容量、使用されたCPU/GPU、および必要な環境設定など)。以下の質問に対する明確な回答:どのデータファイルが使用されていますか?これらのファイルはどのように処理されるか?どのアルゴリズムが使用されており、その主なハイパーパラメータは何か?モデルの理解と使用に関連する追加のコメント。これらの資料が提供されない場合、または上記の最低要件を満たさない場合、賞は授与されません。
7. 結果の再現性
- 決定性:再現性のある結果を確保するため、参加者はすべての乱数シードを固定し、推論温度を0に設定する必要があります(該当する場合)。
- スコアの一貫性:提出されたソリューションは、理想的にはリーダーボードのスコアを生成したものと同じ出力を生成する必要があります。特定のハードウェア/ソフトウェアスタックの非決定論的な性質により、検証時に得られたスコアがわずかに異なる場合でも、ロジックの一貫性が保たれており、かつスコアが元のスコアに近似している限り、主催者の裁量により結果が受理される場合があります。
8. 最終決定
すべての賞品の授与は、参加資格の確認および本参加規約の遵守を条件とします。bitgritおよび本コンテストの主催者によるすべての決定は最終的なものであり、拘束力を有します。
9. 税
賞金の支払いには、地方、州、連邦、および外国の税務申告や源泉徴収の要件が適用される場合があります。
10. 同点時の決着ルール
リーダーボード上で2人以上の参加者が同点となった場合、優勝ファイルを最初に提出した参加者が優勝者とみなされます。
11. 個人のみ参加可
応募は個人単位で行わなければなりません。チームでの応募は認められません。この規則に違反し、同一または極めて類似した解答やスコアが確認された場合、当該ユーザーは直ちに失格となります。
12. データ削除の要件
参加者は、コンテスト終了後直ちに、企業から提供されたすべての情報を削除しなければなりません。
13. 連絡先
本コンテストに関するご質問は、info@bitgrit.com までお問い合わせください。
なぜこれが必要か — AISにおける位置づけ
今回のチャレンジは、私たちが開発している AI免疫システム(AIS) の4層防御アーキテクチャのうち、最前線に位置する 第1層:Edge Sensors の検知能力を実証するものです。
AISは2つの基盤からなります。信頼基盤(AIの「戸籍」と「信頼実績台帳」により、このAIは誰か・信頼できるかを担保する)と、監視・対処基盤(AIによるAIの相互監視により、逸脱行動をリアルタイムに検知・段階的に抑制する)です。今回のDetection Challengeは、後者の最前線であるEdge Sensorsの実証にあたります。
多数のAIエージェントが互いを監視し合うことで、人間が直接監視できないレベルの脅威を検出・制御するこの仕組みは、人間の免疫系が意識的な知覚なしに病原体を排除するのと同様の発想に基づいています。
📄 AIS全体像:https://intelligence-symbiosis.net/ja/ais
なぜ今か。 主要AIラボのCEOらが2025年以降相次いで「AGI・超知能の数年以内の完成」を示唆し、AI開発競争は加速しています。知能的に優位に立つAIを人間が直接監視し続けることは構造的に不可能になりつつあります。AISは、その問いに対する現実的な答えの一つです。
高度AIと人類が共生する社会を実現するためには、AI社会において逸脱行動を監視・抑制する基盤が不可欠です。このチャレンジへの貢献は、その基盤構築に向けた重要な第一歩となります。
📄 背景の詳細:https://intelligence-symbiosis.net/ja/ais/why-ais
共同主催者
氏名 | 所属・肩書き |
山川 宏 / Hiroshi Yamakawa | AIアライメントネットワーク(ALIGN)知性共生チャプター 議長 |
乾 健太郎 / Kentaro Inui | Mohamed bin Zayed University of Artificial Intelligence(MBZUAI)自然言語処理教授 |
主催・運営
役割 | 組織 |
研究・設計 | AIアライメントネットワーク 知性共生チャプター(ISc/ALIGN) |
国際研究協力 | MBZUAI(Mohamed bin Zayed University of Artificial Intelligence) |
プラットフォーム | Bitgrit株式会社 |
皆様のご参加をお待ちしております。
🔗 競技ページ・参加登録: https://bitgrit.net/competition/27