AIに聞いてみた どうすんのよ!?ニッポン


AIに聞いてみたどうすんのよ!?ニッポンという番組がNHKで放映された。
www.nhk.or.jp/special/askai/

この番組は「40代ひとり暮らしが日本を滅ぼす」というキャッチコピーで、放映前からSNS界隈で問題視されていたけれども、案の定なかなかの問題作で放映後はさらにTwitterなどを中心に多くの声があがった。

 

 

最近、政治界隈でくりひろげられるマスメディアの残り少ない信用を積極的に売り飛ばしていくポストトゥルースやら、オルトファクトだかの流れ、喧伝、扇動はちょっと目に余るが、だがまあ、政治界隈はイデオロギーや信念に基づいたり利害が直接結びつくのでわからなくもない。だが、誘導したところで利益を得る人もすくないであろう社会分析系の番組、しかもスポンサーへの利益誘導が必要でもないNHKで、魂を売り飛ばしていくのはさすがにここまで来たか感がある。

 

 

センセーショナルな見出しをつけても、視聴率がちょと上向いて物議をかもすぐらいの効果しかないと思うけれども、なんかもうそれぐらいの挟持なんだなと憐憫。

 

 

番組内でAIからの提言とされた5項目

01.健康になりたければ病院を減らせ
02.少子化を食い止めるには結婚よりもクルマを買え
03.ラブホテルが多いと女性が活躍する
04.男の人生のカギは女子中学生の“ぽっちゃり度”
05.40代ひとり暮らしが日本を滅ぼす

 

はぁ・・・。

番組の問題点を簡単に指摘すると、擬似相関でしかないものを因果関係にあるかのような文脈に載せてそれをAIがこう言っていますと発信してしまっていることだ。

 

過去30年分の社会データを700万件分食わせてディープラーニングさせたそうだ。
この簡単な触りからしか、手法が推測できないが、ほんとただディープラーニングで相関係数を出して、相関度が高いところをforce-directed graph(力学モデル)とかでネットワーク表示させただけなんじゃないかと思う。データを食わせるために整形するのは大変だけれども、別段新しいことをやっているようには見えない。

 

 

技術人が相関関係と因果関係の違いや、擬似相関を知らない程度の知性で相関を出せるわけはないので、本の執筆者が編集者に売れるためにタイトルを勝手につけられて泣くというような強烈な編集ハラスメントが番組でもおこなわれたのだろう。

 

 

おそらく、ディレクションの段階で安易な誘惑に負けた(負された)んだと思うが、だからといって「健康になりたければ病院を減らせ」とかをAIからご信託がありましたとかやってしまうのはモラルとしてアウトだ。完全に暗黒面に落ちている。

 

相関関係

 

例えば、小学生の学年(Y軸)があがるほど身長が高くなる(X軸)という分布はこのようになる。
このような関係を強い正の相関があるといい、小学生の学年は因果関係で言うところの原因で、身長が高くなるというのは結果だ。
因果を取り間違えると、学年をあげたければ身長を伸ばせという論になる。

グラフは適当。 bl.ocks.org/mbostock/3213173

 

相関関係の強さ

例えば、高校生ぐらいになると身長の伸びも緩やかになるので学年と身長などになると相関関係が弱くなる。なってばらつきが出て来る。こういうのを弱い相関があるという。

 

 

 

 

無相関

で、社会人の年数と身長ぐらいになると、ほとんどこの2つの指標は関係なくなるのでたぶん無相関となる。もしかしたら世代的な意味で逆相関はあるかもしれないが、ばらつく。

 

 

 

 

擬似相関

で、小学生の「身長」と「読み書きできる漢字の数」などを調べるとこういうようなグラフになるはず。
本当は学年の変化(潜伏変数)があって、この年令が身長と漢字の数に交絡しているので、この2つに相関が生まれているのだ。

 

 

 

 

 

 

擬似相関は慎重に取り扱えれば直接は観測できないものの兆しを観測することができる。

たとえば中国にはザーサイ指標なるものがあるそうだ。
1.ある都市に肉体労働者が出稼ぎで集まってくる。
2.肉体労働者は塩分補給のためザーサイを買う。
3.出稼ぎにくるほど経済が成長している。

 

  • 1→3(相関、因果)
  • 1→2(相関、因果)
  • 2→3(擬似相関)

 

3を誰よりも早く予見したいがために、2を先行指標として調査するのだ。
風が吹けば桶屋が儲かるというような、三段論法だ。直接統計などを取りにくい、因子を観測するために先行指標としてよくわからないものを採用することはままあることだ。

 

 

で、最初の問題に戻る。

「経済成長にはザーサイを売れ」とやってしまうのは、因果も取り間違えているし、しかもそれただの擬似相関だしみたいなトンチンカンな議論になる。

しかも番組がAIが提言したとするものは、過去データから抜き出した(バックテストからの)相関であって、おそらくそれは未来(フォワード)にはマッチしないような項目ばかりなのがさらに頭を抱えたくなる。

 

 

それを踏まえて、身も蓋もなくマーケティングAIを腐しておく。

 

 

×健康になりたければ病院を減らせ

○病人を追い出したければ病床数を減らせ

日本の入院という仕組みが健康寿命を著しく悪化させるエビデンスだとするのであれば、もしかしたら、あたりの相関かもしれない。
終末期医療で無為に点滴などしないで、十二分に枯れさせてから看取るみたいな話しが石飛幸三さんの 「「平穏死」のすすめ」にあるように、もしかしたら、
結構リニアな潜伏変数かもしれない。
バナナの売れ筋については高齢者の嗜好の問題じゃないかな。

 

×少子化を食い止めるには結婚よりもクルマを買え

○車が売れた時代には子供が生まれた

これは過去30年のデータを食わせたからでしょう。
子供が増えた時代は車が売れてた時代なので、相関が出ますよね。
それよりも一個手前にあった付加価値額のところはかなり本質的なところで、社会統計でみるとこの付加価値額が日本はずっと落ちてきているんだよね。酷いんだ。日本の停滞のほとんどがここに起因していると言ってもいいぐらい。
より労働生産性と付加価値創造に転嫁できる社会なら安泰だよね。

 

×ラブホテルが多いと女性が活躍する
○女性の社会進出でラブホテルの需要が増えた

これもどうなんだろうね。
昔から女性は活躍してたわけで、女性の活躍を年収とかで量るより狭義になっただけだと思う。

 

×男の人生のカギは女子中学生の“ぽっちゃり度”
○女子高生の栄養バランスが悪化すれば男の人生なんかままならない

炭鉱のカナリアとは言い得たり、そのまま擬似相関の先行指標であろうと思う。

 

貧困と肥満は確か世界的にもかなり強い相関があったと記憶している。
肉や魚、野菜、果物などは比較的高価で摂食する機会が減り、安価に腹が膨れるお米やパン、小麦、芋が中心の食生活になるからだ。炭水化物が主となる食生活は肥満につながりやすい。

 

 

これら食生活にビビットに影響を受けるのが育ちざかりの女子中学生なのだろう。
男子中学生は二次成長期だから皮下脂肪じゃなくて筋肉で消化されちゃうから女子中学生より反応がぬるいのだろう。

 

で、「経済の悪化」という隠れている潜伏変数があったとして、
これに起因して、子育て世帯の家計の悪化、炭水化物食生活になって、太る。
そんなところではないだろうか。
擬似相関だが先行指標としては悪くない。
男の人生のカギはとかいう文脈に載せてしまうのが、最悪なだけだ。

 

×40代一人暮らしが日本を滅ぼす。
○40代一人暮らしが増えるような社会は滅ぶ。

擬似相関な上に因果を取り間違えている典型的な例だ。
年齢というファクターを無視して「成績をあげたければ身長を伸ばせ」ぐらいのトンチンカンさだ。

なんかよくわからないけど日本が滅ぶようなファクターがあって、
それが機能するような状況では、40代一人暮らしが増える。ただそれだけだ。

で、全部それらはつながっていて、結局のところ日本の場合は付加価値額の減少でしょ。
中小企業の産業別付加価値額の偏差を算出すれば、今何がおこっているのかわかるよ。

 

 

価値あるものを作り出して、それを何に再投資して、次の価値を作り出していくかっていう社会の営みで、種籾を食い荒らしたり、稚魚を根こそぎ乱獲するような強欲な奴がいれば、滅びのフラグがどんどんたつだけだべさな。

 

AIのせいで終わらせてはいけない。