部隊の維持を強化する機械学習 (Marine Corps Gazette)
生成型の人工知能に関する事柄は、「国家としてどのように向き合うのか」レベルの話題から、学校や企業としていかに活用するべきかといった議論までさまざまである。MILTERMでも何度も紹介している米海兵隊機関誌「Gazette」の2023年7月号のテーマは、「Focus on Artificial Intelligence & Machine Learning」である。この号ではいくつかの観点から人工知能を論じた文献がみられる。先に、人工知能を戦いに変化を与えるものとして捉え、これは避けがたい事実として認識し、この新しい技術を取り入れて情報環境における戦いに勝つことを論じた「Adapting to the Changing Face of Warfare‐The urgent need for AI technologies in the Marine Corps」を紹介したが、ここでは、米海兵隊大尉による人工知能を現代の軍事組織が抱える「メンタル・フィットネスと自殺防止」に活用する方策を論じた「Machine Learning to Enhance Force Preservation‐AI supporting leadership」を紹介する。(軍治)
部隊の維持を強化する機械学習
人工知能が支援するリーダーシップ
Machine Learning to Enhance Force Preservation
AI supporting leadership
by Capt Drew Borinstein
Marine Corps Gazette • July 2023
ボリンスタイン(Borinstein)米海兵隊大尉は現在、メリーランド州フォートミードの米海兵隊暗号支援大隊B中隊に配属されているインテリジェンス将校である。ジョージア工科大学でデータ分析の理学修士号を取得。
米海兵隊の差し迫った将来の用兵上の課題を考えるとき、一般的には最重要視されることはないが、メンタル・フィットネスと自殺防止は、疑いなく国防総省全体の最優先事項であり続けている。今日、軍人の自殺率は記録史上最高水準にある[1]。
自殺率の増加を受けて、米海兵隊は指揮官に米海兵隊員の生活により深く関与することを求め、部隊維持協議会(Force Preservation Council :FPC)プログラムを通じて主観的にリスクがあると判断された米海兵隊員にリスク管理プロセスを適用することに頼った。
部隊維持協議会(FPC)の命令は、指揮官に対し、「不利な結果を招きかねない出来事の連鎖を断ち切るため、ストレス要因や潜在的に危険な行動が最初に軍人に生じた時に、早期に認識し、介入するために、従事するリーダーシップとリスク管理の指針を……用いる」よう指示している[2]。
残念ながら、米国防総省自殺予防室の2020年自殺年次報告書によれば、米海兵隊の自殺率は少なくとも2014年以降平均して上昇しており、2020年の自殺率はコロナウイルス病2019年のパンデミックを受けて過去最高を記録した[3]。
この傾向は、米海兵隊が将来にわたって、米海兵隊員のメンタル・ヘルスと戦い続けることは、将来の部隊の能力が国家の要請に応える即応性を維持する上で、重大な問題を提起することになる。
米海兵隊の善意にもかかわらず、当初の部隊維持協議会(FPC)プログラムは欠陥だらけだった。その主な問題の一つは、指揮を解かれたり、指揮下に入ることで、米海兵隊員の過去と潜在的な闘争に関する情報をしばしば交換できなかった時に発生している。
このような情報交換が行われる場合、多くの場合、非公式で安全でない手段で行われた。米海兵隊部隊維持協議会(FPC)命令(MCO1500.60)は、指揮を解くことに対し、「必要かつ関連する部隊の維持情報を指揮下に入る時に確実に提供する」よう求めているが、方針に従わなかった部隊の責任を問う仕組みはなかった[4]。
このような標準化とセキュリティの欠如は、指揮官が米海兵隊の行動や問題を理解するために必要な情報をすべて受け取ることはまれであり、パワーポイントやその他の非公式な情報伝達手段を不必要に使用することによって、米海兵隊の個人情報が危険にさらされることがしばしばあったことを意味する。
指揮官は米海兵隊員を知るために、人工知能/機械学習を含むあらゆるツールを自由に使うべきだ。(写真:ジョアンナ・スタウス(Joanna Stauss)米海兵隊上等兵) |
2020年8月、米海兵隊は部隊維持協議会(FPC)データの標準化データベースであるCIRRAS(Command Individual Risk and Resiliency Assessment System)※を採用することで、こうした問題の解決を図った[5]。確かに従来の部隊維持協議会(FPC)プロセスよりは改善されたものの、CIRRASが単なるデータ保管のためのツールにとどまるのであれば、米海兵隊は本末転倒である。
※ 【訳者註】Command Individual Risk and Resiliency Assessment System (CIRRAS)とは、指揮官用個人のリスクと回復力の評価システムで、共通アクセス・カード(CAC)に対応したソフトウェアアプリケーションで、米海兵隊員の健康、社会、教育、家族関係のデータなどの個人情報を、指揮官が認識できるように安全な電子環境に保存されている。[共通アクセス・カード(CAC)は、クレジットカードほどの大きさの「スマート」カードであり、現役の制服軍人、選抜 予備役、国防総省の文民職員、および資格のある請負業者職員の標準的な身分証明書である。また、建物や管理されたスペースへの物理的なアクセスを可能にするために使用される主要なカードであり、国防総省のコンピュータ・ネットワークやシステムへのアクセスを提供するもの]
実際、CIRRASは米海兵隊が人工知能、より具体的には機械学習を用いて、隊員内の自殺の脅威と闘うための実験を行うまたとない機会を提供している。米海兵隊は、CIRRASデータベースを教師あり秘密区分有りの機械学習アルゴリズムと併用することで、自傷行為のリスクが最も高い米海兵隊員を指揮官がより的確に特定できるようにする効果を検証すべきである。
CIRRASとは何か:What is CIRRAS?
CIRRASは、米海兵隊システム・コマンドが開発した安全なアプリケーションで、米海兵隊全体の部隊維持協議会(FPC)プログラムを標準化し、指揮官が米海兵隊の全体的な健康状態と戦闘準備態勢を監視できるようにする[6]。
指揮官とその代表者は、メンタル・ヘルス、人間関係のトラブル、アルコールや薬物関連の犯罪、その他作戦の即応性に影響を与えかねない重大な問題など、米海兵隊員が定期的に経験するさまざまなストレス要因を入力し、追跡することができる[7]。
CIRRASは、米海兵隊員に関する機密データをより安全に保管・転送する新しい方法を提供するものだが、部隊維持協議会(FPC)プログラムに根本的な変更を加えるものではない。
CIRRASは米海兵隊員の全体的な健康情報を標準化し、保護する手段を提供するが、指揮官には分析上の利点はないように思われる。言い換えれば、CIRRASは指揮官が生のデータを安全に伝達する能力を向上させるが、そのデータを使ってより良い意思決定を行うための貴重な洞察を提供することはない。
標準化されたデータを収集する第一の目的は、傾向やパターンを検出し、意思決定により良い情報を提供することである。人間の頭脳は、2次元や3次元の単純で直線的な傾向を検出するのは得意だが、個人の健康情報に関わるような多次元のデータセットにありがちな、複雑で直線的でない傾向を検出する能力は非常に限られている。
機械学習:Machine Learning
機械学習アルゴリズムは、膨大なデータから複雑で非線形な傾向を特定することに特に長けている。機械学習は、数千次元のデータセットを取り込み、その最も重要な要因を特定し、人間の脳では理解も認識もできないようなパターンを検出することができる。
このようなアルゴリズムは、「Netflix」のどの番組があなたに一番合うか、「Spotify」でどの曲が一番楽しめるか、「Amazon」で次に購入を検討すべき商品はどれかなどを判断するために、民間企業で定期的に使われている。
最も基本的なレベルでは、機械学習とは、過去のデータとその結果を使って複雑なパターンを特定し、そのパターンからモデルを生成し、そのモデルを将来の入力データと組み合わせて将来のアウトプットの予測を迅速に行うことである。
ハイテク企業が使用する機械学習アルゴリズムは、閲覧行動や個人情報など、あなたや他の人が提供したデータを取り込み、パターンを検出し、高い確率の結果を素早く計算できる統計モデルを構築する。
米海兵隊は、部隊維持協議会(FPC)のデータを単一のデータベースに一元化し、標準化することで、機械学習アルゴリズムを使って、自殺傾向やその他の生命を脅かす傾向を示した米海兵隊員に共通する水面下の傾向を特定する場を設けた。
適切な種類のデータが提供されれば、これらのアルゴリズムは、自己脅威行動を起こしやすい米海兵隊員を指揮官に示すのに有用であることがわかるだろう。
多くの異なるタイプの機械学習アルゴリズムの中で、将来の行動を予測する目的で最も有用なのは、秘密区分有りの予測アルゴリズムである。この種のアルゴリズムは、数値的な結果(1、2、3)ではなく、特定のカテゴリー的な結果(緑、黄色、赤)を予測するように訓練されている。
最も一般的な秘密区分有りの予測アルゴリズムには、決定木、ランダムフォレスト、k-最近傍分類器、ロジスティック回帰、サポートベクターマシンがある。米海兵隊は、これらの種類のアルゴリズムを試して、どれかが米海兵隊の行動を効果的に予測できるかどうかを判断すべきである。
問題と要求事項:Issues and Requirements
米海兵隊員の生活に影響を与える決定を下すために機械学習を使用することは、明らかにいくつかの潜在的な問題を提示している。データ・サイエンスと技術の世界では、他人の個人情報を使った機械学習アルゴリズムの道徳的・倫理的使用に関する議論が盛んだ。
さらに、どんなモデルやアルゴリズムも完璧ではなく、正しく理解されなければ、根拠のない「数字」への依存を招き、指揮官が自らの判断で行動する責任を取り除くことになりかねない。
まず、どんなモデルも無謬ではないことに注意すべきである。モデルは現実の抽象的な表現であり、過去のデータを表現するために最適化されている。そのため、焦点を絞ることができず、常にある程度の誤差が生じる。どんなモデルやアルゴリズムも、過去の現実を完璧に描写することはできないし、将来の現実を完璧に予測することもできない。
このため、数理モデルを使って意思決定を行う指揮官は、そのようなモデルは意思決定を補完するためのツールであり、決して十分な情報に基づいた人間のリーダーシップや判断に取って代わるものではないことを忘れてはならない。複雑な状況を緑、黄色、赤の枠で囲んだパワーポイントのスライドに落とし込むことが、あまりにも頻繁に行われているようだ。
どの米海兵隊員の個人的状況も、単純な色で十分にとらえることはできないし、他のモデルを使ってどの米海兵隊員が最も自殺行動に走りやすいかを予測する際にも、同じような行動に注意すべきである。その代わり、指揮官はこのようなツールを使って、観察にもっと時間をかけるべき人物を特定すべきである。
すべての予測アルゴリズムは偽陽性(false positives)と偽陰性(false negatives)を生み出す。米海兵隊は、あらゆる種類の機械学習や人工知能の使用に関して、ゼロ・トレランス・アプローチを避けなければならない。そのような技術を使用するツールは、より良い、より迅速な意思決定を通知するためにデザインされているが、決して人間の代わりに意思決定を生成することを意図していない。
ガーベッジ・イン、ガーベッジ・アウト※とは、データ・サイエンティストの間でよく言われる言葉だ。機械学習アルゴリズムは与えられたデータの上で生きているため、データの質が低いと、現実を適切に反映しないモデルが簡単にできてしまう。CIRRASにデータを入力する責任あるリーダーは、適切に入力しなければならない。
※ 【訳者註】計算機科学において、Garbage In, Garbage Out(ガービッジ・イン、ガービッジ・アウト/ガベージ・イン、ガベージ・アウト)、略してGIGOとは、欠陥のある、または無意味な(garbage)入力データは無意味な出力を生み出すという概念である。直訳は「ゴミを入力するとゴミが出力される」。(引用:https://ja.wikipedia.org/wiki/Garbage_in,_garbage_out)
データがないという考え方も検討に値する。リスクのある米海兵隊員を予測することが最終の到達目標であることを考えると、リスク要因に関するデータがないということは、その隙をすり抜ける米海兵隊員がいることを意味する。機械学習で使われるデータもまた、計算可能でなければならない。つまり、データセット全体を通して標準的でなければならない(多肢選択式の回答や、一般的な書式を持つ数値データを考えてほしい)。
教師ありの秘密区分有の学習アルゴリズムは、自傷傾向を示した米海兵隊員の中でどのような特徴が最も多いかを特定し、結果との相関関係に基づいてそれぞれの特徴を適切に重み付けしてモデルを作成し、必要に応じてそのモデルを他の米海兵隊員に適用することで機能する。
しかし、これを実現するためには、これらのアルゴリズムには標準的なデータ値が必要であり、特に問題の指標(この例では、米海兵隊員が自傷行為の素因を示したかどうか)についてはそうである。機械学習アルゴリズムは、多くの場合手作業を伴う追加処理なしでは、自由回答データを容易に解釈することができない。CIRR ASは、効果的なモデルを生成するために標準的なデータセットを提供しなければならない。
すべてのモデルがうまく機能するわけではなく、これらのモデルが価値をもたらすという保証はまったくない。どのモデルも、どの米海兵隊員が最も自傷行為に走りやすいかを正確に予測することができない可能性が高く、そうなると、すでに複雑になっている部隊維持協議会(FPC)システムに不必要なノイズを加えることになりかねない。しかし、もしこれらのモデルが50%でも正しい予測を出すことができれば、指揮官にとって非常に価値のあるものになるだろう。
結論:Conclusion
ここ数年、米海兵隊の対話は、米国が大好きなハイテク流行語のいくつか-人工知能、機械学習、ビッグデータなど-で占められている。とはいえ、数十億ドル規模の企業が何年も前から行っているような大規模な導入方法はまだ見つかっていない。このような技術的進歩の力を利用するための手段を研究し、実験することに疑問の余地はない。
しかし現実には、中堅以下が新しいことに素早く適応し、挑戦することに消極的であることは、これらの分野の研究が本当の意味で最優先事項ではないことを示している。CIRRASのデータベースと連動した機械学習の利用を模索することは、米海兵隊にとって、米国で最も革新的な部隊という長年の評判をアピールする格好の機会となる。
このトピックに関するさらなる研究が進めば、この技術の普及が促進され、国防総省の最重要課題のひとつである「軍人のメンタルヘルス」において、自動化された実用的なデータを迅速に提供することで、指揮官にとって貴重なものとなる可能性がある。兵士が真に我々の最大の強みであるならば、技術的であろうとなかろうと、あらゆる利点を活用し、彼らの利益と海軍の利益につなげるべきである。
ノート
[1] U.S. Department of Veteran’s Affairs, 2020 Veteran Suicide Prevention Annual Report (Washington, DC: 2020).
[2] Headquarters Marine Corps, MCO 1500.60 Force Preservation Council (Washington, DC: August 2016).
[3] Under Secretary of Defense for Personnel and Readiness, U.S. Department of Defense, Calendar Year 2020 Annual Suicide Report (Washington, DC: 2020).
[4] Stephen Losey, “Military Deaths by Suicide Jumped 25% at End of 2020,” Military.com, https://www.military.com/daily-news/2021/04/05/military-deaths-suicide-jumped-25-end-of-2020.html ; and MCO 1500.60 Force Preservation Council.
[5] Headquarters Marine Corps, “Announcement and Implementation of the Command Individual Risk and Resiliency Assessment System (CIRRAS),” Marines, August 12, 2020, https://www.marines.mil/News/Messages/Messages-Display/Article/2310545/announcement-and-implementation-of-thecommand-individual-risk-and-resiliency-a.
[6] Marine Corps Systems Command, “Marine Corps Develops Secure App to Monitor Holistic Health and Combat Readiness of Marines,” Marines, February 11, 2021, https://www.marines.mil/News/News-Display/Article/2500948/marine-corps-develops-secureapp-to-monitor-holistic-health-and-combatreadines.
[7] Ibid.