「エビデンスベースド」という単語。ここ数年急に耳目に触れるようになった。
エビデンスベースドな教育をしようとか、エビデンスに基づく医療だとか、政策決定もお涙頂戴で煽る「エピソード」ベースドから脱却して科学的根拠をもつようにしようとか。使われ方はもろもろであるが、言葉が市民権を得てきつつある。
おそらくは、あの311の原発事故による農作物などの風評被害へのカウンターとして科学的根拠に基づいたうんぬんというところから裾野がひろがったのではないかと思う。きっかけは悲しいことではあるが、根拠に基づいた議論がなされるようになったのはよいことだとおもう。それが喩え下地程度のものだとしても。
エビデンスレベル
「エビデンス」という単語そのものは新しいものではない。十数年前からシステム系の納品物につきまとっていた単語である。法廷や医療でも見かけた。統計の世界ではEvidence based Policyは基礎となる考え方である。
エビデンスレベルについて、おさらいしてみよう。
この中で専門家個人による意見というのは、一番科学的根拠がないものとされている。
科学的根拠とは何かというと、再現性があること、同じ条件なら同じ結果を再現できると意訳してもよい。
はてさて、一番根拠がないものとされる専門家個人の意見により重要な決定がなされることが世の中にはいくつもある。
最近話題になった、東京オリンピックのエンブレムは専門家による審査員が評価しての採用だった。
また、フィギュアスケートの芸術点が世間の感性と大きくズレていて、審査員が買収されているのではないかなどの疑惑がでてしまうのは、その評価に科学的根拠を求めることができないからであって、疑惑の否定も肯定もできない。大抵はただ裏暗いだけで終わる。
違法ではないが、一部不適切とされる範囲で暗黙的談合が生まれるのは大人の事情だ。
これをあらゆるものを清廉潔白に、全くダメなものとして排除せよという主張をするつもりは無いが、一線を踏み越えて悪どいものは遡って追求できる程度には、エビデンスベースドであるべきだと思う。
統計「で」嘘を付いたり、御用学者の意見でサンプルバイアスが掛かりつづければ、長期的な視点で評価したときに悪害の程度が深刻な結果になってしまうことがあるからだ。
ハインリッヒの法則(※1)に照らせば、「1つの重大事故の背後には29の軽微な事故があり、その背景には300の異常が存在する」というが、ヒヤリハットという些細なエビデンスが特定個人、専門家の意見により、ささいなこととして恣意的に無視され隠蔽されれば、次に我々が知ることができるのは重篤な事故がおきてからになる。
エビデンスに基づかない決定
船の設計責任は問われる仕組みがある。naval architectというそうだ。
建築物の構造についても問われる仕組みがある。耐震偽装が発覚したとか、瑕疵担保責任とかだ。
ただ、法律や政策の制度設計については設計責任がないそうだ。(※2
なぜそのような決定に至ったか科学的根拠に基いていなければ、責任の取りようも取らせようもない。
「だって権威がそう言ったんだもん」
子供のような言い訳をするだけで世間は納得しなくても、法的違法性は問われない。都合のいいことを代弁してくれる御用聞きを連れてくればいいだけだ。
法律はいまのところ厳格にはエビデンスベースドではないので論理言語で記述することができない。だから運用形態も判事という「権威」により法廷で解釈され罪刑が決定されているにすぎない。自分で吐き出した実行結果をエビデンスにするという、涙ぐましい判例主義、前例主義だ。
だから、環境変化が発生しても過去に吐き出されたエビデンスに自縄自縛される。エビデンスレベルとしては最低の価値しかないものを最上位に置き続けざるを得ない。
計量できない価値
論評や好評などは評価項目をいくつかにわけて、点数などで保存したりすることで評価される。
感性は完全合意がありえないので、多人数による合議では決定され得ないので、代表者が好評して決定するというものは合理性がある。
しかし、視覚情報や音像、映像、一連の動作の美しさを専門家が付けた点数で残しても、それだけでは情報が欠落していて、好評からの、元の制作物の再現性は不可能といっていい。
土地は貨幣で交換できるという法的価値が制定されている。
しかし、この法的価値以外にも、先祖伝来だの、利水がどうで農地としての価値がどうだののような否定形価値がある。それら個々個別の価値を勘案すると大変なので、法律としては十把一からげにまとめているのだ。取引される経済的価値から、実際に認知される価値にはズレがある。
はてさて、回りくどく書いてきた。
どんな問題提起をしたかったかというと、実は「人工知能が権威の代わりになる」という未来を想定したときに何が必要かということだ。エビデンスベースドな人工知能のほうが科学的根拠にもとづいているので、ありうる未来だと考える。
そんな将来、人が感じる、美しさやのような現在は計量できない価値は、やがて人工知能により計量可能なものになる。なるはずだ。人間には計量できなくても、人工知能は絵画をベクトルの集合として分解することが可能だし、環境センシングなどにより大量のデータをエビデンスとして、類型化して、認知することができるようになるからだ。
で、問題。
我々の社会において、評価指標に科学的妥当性(エビデンスなど)を持ち合わせていないまま決定がされている分野がまだ多々ある。人工知能に食わせる、教師データが恣意的にコントロールされれば、人工知能同士の暗黙的な談合や衝突がおこる。人間がやっている今の失敗がとても短いイテレーション(繰り返し)のなかで増幅されるのだ。
細かなエビデンスを積み上げるセンシング、コミット、ロールバックの仕組みを作らずに、今の仕組みのままAIをサーキットさせれば、サーキットブレーカーを持たせないままフラッシュ・クラッシュを待つようなものだ。次に気がつくときは、重大な事故が起きてからになるんじゃねぇかなと思う。それは嫌だねぇ。どうすべぇ?
参考
根拠に基づく医療
ja.wikipedia.org/wiki/%E6%A0%B9%E6%8B%A0%E3%81%AB%E5%9F%BA%E3%81%A5%E3%81%8F%E5%8C%BB%E7%99%82
※1) ハインリッヒの法則
ja.wikipedia.org/wiki/%E3%83%8F%E3%82%A4%E3%83%B3%E3%83%AA%E3%83%83%E3%83%92%E3%81%AE%E6%B3%95%E5%89%87
※2)東京大学 人文社会系研究科 教授 松本 三和夫
第十回報告会 福島原発事故の背景にある「構造災」を考える
todai.tv/contents-list/sessions/radiation-effects/10-03
原発事故から5年
農学生命科学研究科の復興支援プロジェクト HP
www.a.u-tokyo.ac.jp/rpjt/index.html
孫正義×堀義人 トコトン議論 日本のエネルギー政策を考える
GLOBIS知見録