AI vs. 空気をよまない大人たち(1)


曰く、シンギュラリティはおきないそうである。

AI vs. 教科書が読めない子どもたち 著:新井 紀子国立情報学研究所教授の本を読んだ。奥付を読むと、2018/2/15発行で2018/3/27でなんと既に6刷りである。


私はこの本の印税は1円も受け取らないことを決めました。// 「教育のための科学研究所」に全額が寄付されます P.286

あとがきにこう書いてあってすごいなと思ったんだけど、印税を寄付扱いだと、税がエライコッチャになるんじゃないのとか、一般社団法人の代表理事だから職務著作になるのか?じゃあ寄付がわりの贈与とかできちゃうなとか、いらんことが気になった。

 

はてさて、本論にもどる。

AIは意味を解さないからシンギュラリティはおきないそうだ。だが、自分はこの本を読んでもそれでもシンギュラリティっておきるんじゃないという結論になってしまった。きっと、なにかを読めていないのだろう。

 

シンギュラリティアレルギー

マーケティング用語としてのAIやシンギュラリティに辟易して、アレルギーをおこす気持ちはわかる。最近ほんとひどい。AIの専門家として矢面に立たされ続ければ、シンギュラリティなどおきないと強弁したくもなるだろう。

 

「真の意味でのAI」の定義を自分自身よりも少しでも能力の高い「真の意味でのAI」をつくりだせることとし、その、厳密な意味での「技術的特異点」はこないと断言できるほどに、予断を持った未来しか見れなくなっているのは荒みすぎていると感じる。可哀想だ。数学では表せないからできないからという。では、世界は数学でできているという言葉はなんだったのか。

 

数学で定義できず、統計的手法しか「ものさし」がないので意味を理解できない。だから計算機が知性を獲得することはありえない。その上で、計算機でしかない機械が「真の意味でのAI」なることはない。まぁ、わかる。

だが、それでも、ある人工の知性体が自己より「能力の高い」複製体を作る未来は、そう遠くもないよね。
理由は後述する。

 

知性と計算機

AIは計算機ですから、数式、つまり数学の言葉に置き換えることのできないことは計算できません。では、私たちの知能の営みは、すべて理論と確率、統計に置き換えることができるのでしょうか。残念ですが、そうはならないでしょう。 P.118

はたして、AIが未来においても計算機上にあるという仮説は正しいのだろうか?

 

人間には知性があると仮定する。

現在までのところ人間が人間を工業的に生産することはできない。

しかし、倫理にさえ目をつむれば技術的、論理的には人工子宮や、3Dプリンターなどをつかって細胞の積層化技術など三次元組織体構築ができるようになったことなどをみてもわかるように、ある程度のところはできるようになってきていて、人間や、人間の脳機能のみを将来部品として再現することはそう遠くない未来にくるだろうことが予想される。

小脳をPEZYのスパコンで再現できたよみたいなシミュレートの話ではなく、生化学のほうね。ちょい前のSFよりも奇妙な段階に到達していて、ネズミの脳みそのなかに霊長類のタンパク質を再現したり、豚の中で人間の臓器をつくることもできるようになっているのを踏まえると、創作の世界だって、遠慮しちゃうような奇妙な現実に我々は生きている。

工業的に生産された人造人間は計算機なのであろうか?

これはおそらく否である。

人造人間は自分よりも賢い人造人間をつくることはできないだろうか?

これもおそらく否である。

では、人造人間には知性は宿り得ないと言えるのだろうか?

人間に知性があるとするのであれば、これも否定しきることも難しいんじゃないかな。

 

AIはノイマン型コンピューターで可動するものである前提は果たして必要なのだろうか?

量子コンピュータが登場し演算能力があがったところで知性の獲得にはなんの役立にもたたないと著者は考えるようである。しかし、有機化学合成や、無機、流体や粉体、遺伝子解析や、創薬なんかは、まさに組み合わせ爆発の世界で戦っていて、いままでえっちらと失敗を重ねることで、現時点でもっとも成功にちかいようなものをとりあえずの正解としてお金を時間と運に突っ込んできた世界である。演算能力の向上は、その繰り返しの速度を圧倒的にあげてくれることだろう。

 

のこぎりの性能向上について未来予測をしたところで、家が建つ予想にはなろうはずもない。のこぎりはあくまで、家を建てるための道具である。計算機も同様にただの道具にすぎない。

 

計算機は「真の意味でのAI」にはならないだろうが、AIをつくるのには十二分に役に立つ。

「真の意味でのAI」という目的達成のために「計算機」という道具に縛られすぎてはいないだろうか。無論、上記にあげたような人造人間もあくまで反例のひとつで、そのようなアプローチではないかもしれない。技術は複合かつ有機的に発展していくもので、ひとつの道具をとらまえてその道具の性能から未来に予断をもってしまうのは、ちと科学者としては寂しい。白いカラスは一匹いれば十分だ。

 

だって、人間は仕組みを完全に理解するより前に飛行機を飛ばしてしまう生き物なんでしょ。

 

 

2007年のアニメ、天元突破グレンラガンのメインシステムは敵大将の生首を生体部品として採用していて笑った。これを見ながらこのエントリーを書いたからこんな話しになった可能性は否定しきれない。10倍返しだ!

 

創作に意味の理解は必要か

直木賞を受賞するような小説を書いたり
新境地を開く楽曲を作曲したり
ピカソばりの傑作を描いたりする
意味を理解できないAIにそのようなことができるはずがない P.130

昨今の人工ダイヤモンドはいよいよもって鑑定士でも天然と人工物の区別がつかなくなってきたそうだ。

もし、何かに特化した「弱いAI」が、確率的に創作したものであっても、アウトプットを受け取る側の人間がその区別をつけられなくなったら、ではいったい本物と偽物の違いとはなんであろうか。出処や来歴?

訓練された人でも区別ができない精巧な偽物と本物の本質的違いとはなんであろうか。

マルセル・デュシャンの「泉」っちゅう便器をおいただけの前衛アートを見て、「○○は意味を理解できない」との作文に、○○にはいるのは、AIだろうかヒトだろうか、作者だろうか観客だろうか。正解は一意に決まるのだろうか。

もしかしたら、創作はオリジナルと、そのイミテーションのイテレーションなのかもしれないが、そんなことはオリジナルがつくれる側の人間がAIを書けるのだから、強いAIである必要すらないのではないか。

ここは弱いAIでもやがて到達できる領域なのではなかろうか。

うん。この項はまだ表現が難しい。まとめきれない。

 

AIは徹頭徹尾数学だけ?

「花子は太郎に好かれている」// その通りの意味を教える道具は少なくとも数学にはありません。// コンピューター上で動くソフトウエアに過ぎないAIは徹頭徹尾数学だけでできているのです P.138

計算機は意味を理解できないというが、ソフトウエアを記述するプログラムは意味を定義したり、動作を記述するための言語で、数学にはない時間変化に応答する方法も持ちあわせている。

 

一般的にBOTなAIをつくろうとしたら、

  • 外部環境などをスキャンする(センシング)
  • 取得できた情報に重み付けする(アルゴリズム)
  • 行動する(アクション、これがアクチュエータ/動作機構になればロボットになる)

簡単に言うと、これの繰り返しである。時間応答のなかで、外部環境の変化に応じて、振る舞いをアルゴリズムに従って変える。

この場合であれば「太郎」「花子」のオブジェクトを定義してあげて、太郎オブジェクトの花子への評価値に「好き」っていう状態を書き加えてあげればよい。

太郎.likes{花子}みたいに配列にぶっこんでいく書き方でもいいし、表現方法は山ほどある。

プログラム作成者ごとに、定義が違ったり、好きクラスを実装するのかとか、そのクラスが何を意味するのか、その後の動作もことなるので文面どおりの「その通りの意味」にはならないかもしれない。

でも、コンパイル(翻訳)も実行も必要ないなら、テキストをそのまま生で保持すればいいだけじゃ??ちゅうか・・・文面通りの意味ってなんだろう?

 

 

すこし横道にそれる。

かねてから思っているのだが、法律などは自然言語ではなく、なぜ論理型言語で書かないのだろうか。

霞が関言語、官僚言葉は比較的そのようになっているらしいが、コーディング規約のない、コード(法律)なんてクソコードだとおもう。不文律に従って成文化するなんてファンキーすぎやしないか。

コードがしっかりしていれば、裁判官や学者ごとのコンパイラによって解釈がわかれたりすることもないだろう。法律の継承関係や、定義がはっきりするから、附則ばかりの法律運用やめてリファクタリングもできる。

循環参照や日本の悪名高いダブルバインドされてて何もできないとかも、テストが書けて、顕在化できるしいいことづくめじゃないか。

法律が論理記述されれていれば、交通事故などぐらいであれば状況データや写真などを数枚食わせるだけでAIが裁判官をすることもできるようになるだろう。 そうなったときに、AIができないでことは、情状酌量の余地があるのかとか昨今はやりの感情を斟酌したり、忖度である。

 

制度なんてものは、数学のようにデジタルに定義できるようにつくっておいて、伸長が必要な情緒の部分は人間がやればいいのにと思う。

「AIってのは駄目だね、粋や酔狂もわからねぇ唐変木だ。」

ここからでいいんじゃないか。20年も経てば「あいつもだんだんわかってきたじゃねぇか」ってなるんじゃないの。だって、準備された教師データ群の比ではない量のデータが世界にはあって、フィールドにこそ神は宿るんだから。

 

 

他、リンクとか

・・・。長くなってるので、そろそろエントリーをわけようかな。

 

他、リンク。

一般社団法人 教育のための科学研究所
www.s4e.jp/

 

遺伝子操作によりマウスの脳を霊長類のように変異させることに成功
sign.jp/be8760e0


森友関係文章のPDFを文章にして比較する方法


NHKがまとめページにて変更後と変更前PDFを公開した。

www3.nhk.or.jp/news/special/moritomo_kakikae/

北朝鮮関連とか、まとめページをつくってくれるようになった。NHKのWEBの中の人がんばってるよね。

 

さて、森友関係については、いろいろ言いたいこともあるのだけど、まあ、いろいろな部分はおいておいて、無駄な労力をかける人たちが出る前に、ああ、既に一日経過しているので時遅しかもしれないけれども、変更前と変更後の文章の比較をおこなう方法を案内しておいたほうがよいように感じた。

 

 

画像やPDFのテキスト化

EvernoteやgoogleDriveを使えば自動でOCRしてくれるようになった。いい時代である。
電子データを印刷して、わざわざ汚れたスキャナで取り込んで作ったようなデータでも、再電子テキスト化してくれるのである。

やり方は簡単、ぶっこんで、開くだけである。一応やり方を書いておく。

アップロードして右クリック、Googleドキュメントで開く。以上だ。

こんな感じに上に画像。下にテキストが出る。

 

 

くそ汚れた画像のテキスト化

今回のような2ページ印刷されてたり、変なところに変な記号がはいっていたりすると、文字認識アルゴリズムがうまく動かないので、ページのスクリーンショットをとって画像にしてからOCRをかけることにする
スクショは別に何使ってもいいけれども、winの場合はGreen shotをつかっているので一応案内しておく。

www.vector.co.jp/soft/winnt/art/se505369.html

問題文書。いきなり1つ目の文章がくそ汚い。
汚すぎるのでPDFを拡大してから画像化する。

 

ここまで汚れていると流出経路を特定するために、わざと汚しているのかもしれないけれども、酷いね。省庁って、もしかして、わら半紙にガリ版刷りなのかなと思う程度に酷い。

ここまで汚いのは流石のgoogleさんも想定していないので、手前で画像的な加工が必要である。こういう汚れのときは画像編集ソフトでトーンカーブをつかおう。photoshopを使ってもいいが、うちみたいな貧乏人は無料のGIMPというフリーの画像編集ソフトもあるのでそれで案内する。photoshopでも編集方法は一緒ね。

 

こういう汚れ系はトーンカーブを右上を上に、左下を下にすれば結構落とすことができる。線画とかからデジタル化したいときにつこーたらいいよ。ただ、今回みたいに文字の濃さと同じぐらい汚いと無理だね。ほんとなんだろうFAX?

 

でも、ま、ひと手間でこれくらいにはなる。

ちっとも読み取れなかったのが、まああとは文章修正ぐらいでなんとかなる程度には読み取れるようにはなった。

 

 

変更部分比較

あとはテキスト化した文章を比較すればいい。diffとかcompareって呼ばれる機能。んー。atomのコンペアのプラグイン入れてとかいうのは説明するのがしんどいので、懐かしのDFとかでどうだろう。

www.vector.co.jp/soft/win95/util/se113286.html

 

変更されている行を色違いで出力してくれる。

・・・。これじゃわかり難い?

 

wordの変更履歴

まあこんな事をしなくても、文章を作成した元の電子ファイルが残ってりゃ、変更履歴ボタンを押されていれば、いつ誰がどこを更新したかなんて残っているんだけどね。eガバメントってなんじゃったんだろうね。

 

コード管理システム

誰かがgithubにあげればいいじゃないと言っていたが、githubのようなコード管理システムをつかえば、今回のような誰が、いつ、なにを改変したんだかわからないようなことで混迷することもなかっただろう。プログラムはコードと呼ばれるが、法律もコードと呼ばれる。公文書はなんだかわからないけど。人間の法律はコンパイル通りそうもないよね。

 

震災直後、写真に写り込んだ避難所の名簿を文字起こしするとかいう、ソーシャルな働きは価値があったと思う。今回も、PDFで公開された情報をgithubで市民団体とかが、登録したりして可読性を高めるとかいう動きはあってもいいかもしれない、が、そもそもが、無駄なことだと考えると残念でしかない。オープンデータとして提供されていれば、とか、もっといろいろできることもあろうに残念だ。

 

ドイツ連邦の法律がGitHubで管理されるようになったってお話しは、もうずいぶんと昔のニュースであったように思う。gitとかで管理されていれば履歴を追うことも、どこが変更されているかも、誰が変更したかも追うことができる。

github.com/bundestag/gesetze

右上のコミットログに表示されるように文章のフィンガープリント(指紋の意味ね)もあるので、誰かが悪意をもって差し替えるには、ちと困難なようになっている。文章の内容をシードにMD5などで暗号化(ハッシュ化)をおこなった結果なので、内容を書き換えると結果の暗号化も変わってしまうわけだ。

これらの暗号は文章を種に生成した不可逆なもので、暗号を複号しても文章にはできないが、同じ文章からは同じ暗号ができあがる。ま、言ってみれば、ある文章を15文字おきに拾い読みしたら同じ文章からは同じ文字列ができあがるよねみたいなもの。するってぇと、つまり、内容を秘匿にしたままフィンガープリントだけは公開しても、いいよねっていう運用ができる。

 

ちなみにこのようなテクノロジーは15~6年も昔からある技術である。ハッシュ値をさらにシードにしてチェーン化すれば、内容の連続性担保できるし、さらにそれを公開台帳に記しておけばいいんじゃねというブロックチェーン技術は、こういうところに根ざしている。ブロックチェーンだって技術的には7~8年ぐらい前のお話しだ。

話しがそれた。

で、今の技術で何ができるか。

電子化して誰かがつくった書類をわざわざ印刷して、押印して、さらに電子化するとかいうお役所仕事がなされている。で、なにかがおきたときにはどこにあるんだかわからないとか、俺の原本は108種類あるぞ!的なことがなされるわけだし、検証も労力がかかって無駄である。無駄である。無駄である。無駄である。無駄無駄無駄ァァアアァァアアアア!

 

無用の用と呼ぶには、あまりにも。やらなくてもいい仕事をやって仕事を増やす。よくないよね。

誰かの仕事がヘリますように。


あれから7年化石燃料の輸入額はどうなったか


原発を停止すると化石燃料の輸入額が増大して大変な貿易赤字になると言われていたことを覚えている人は多いとおもう。あれから7年。どうなったか。

エネルギー調査会などで議論ベースにあった資料によると、化石燃料の輸入額は27兆にまで達し、うなぎのぼりなグラフになっている。10兆円も増えるしもう大変!みたいな。

このグラフの元になっている財務省貿易統計から鉱物性燃料の輸入額のその後の推移をみてみよう。

白いところが鉱物性燃料の年度推移。うぇぃ。半分になっちゃってるよ。

経年データを追いたいので、統計局から2000年~ 2018年の元データにあたる。
データをExcelにおとしてグラフ化した。
いっとき、28兆近くまで膨らんだ鉱物性燃料の輸入額は、18兆、12兆、16兆。

 

 

 

感想

なんかグラフだけみると、東日本大震災とは関係なさそうな要因っぽよね。

まあ、こんなもんか。

 

ここ数日、財務省の文章書き換えどうこうが話題だけど。しょーもないなーと思う。統計が嘘をつくのではなく統計で嘘をつくとはよく言ったものだが、判断の材料となるものに恣意性を混ぜ込ませると、ろくなことないよね。
まー、よくない。

 

にしても、鉱物性燃料の変化原因はなんだろうね。
シェールガス革命がらみかなっと貿易統計ながめてたら、EUからの液化天然ガスが300%とかになってるのとかがあったので、EU方面もからんでるようだ。

 

 

原発について

車みたいな比較的単純な機械でさえ、まったく乗らないような状態で動態保存ってすげぇ難しいよね。原発なんて、動かさなくても維持コストばかみたいにかかるんだから、可動年数若いやつは動かせばいいじゃないとか思う。

ただ、伊方原発お前は駄目だ。

東南海地震が遠からずってタイミングに中央構造線の前上、しかも豊後水道側にある佐田岬半島からって、ここまでくるとわざとなんじゃないかなと思う。

10年前の冷蔵庫が、消費電力は1/3で、収納容積が増えているみたいな話しがあったけれども、短期の利潤のせいで、長期的に不合理な判断をするようなことはしちゃならねぇと思う。

まず、政治、単年度予算で動くってのをやめてもうちょっと計画的になってください。

今日は311、みなさまの未来も健やかならんことを。

 

 

参考資料

品目別輸入額の推移(年ベース)

クリックしてy2.pdfにアクセス

 

1.我が国のエネルギー需給構造が抱える課題 化石燃料への依存と貿易赤字
総合資源エネルギー調査会 原子力小委員会11回会合 参考資料2

クリックして011_s02_00.pdfにアクセス

 

普通貿易統計 2018年1月
www.e-stat.go.jp/stat-search/files?page=1&layout=datalist&toukei=00350300&tstat=000001013141&cycle=1&year=20180&month=11010301&tclass1=000001013201&tclass2=000001013203&result_back=1

2018年1月分 概況品別統計品目表 (輸入 1月:輸入9桁速報) “3” 鉱物性燃料
・・・品目をコード表示ででCSV提供ってひどいよね。。。

 

集計項目 22 鉱物性燃料 年別・月別 2000年~ 2018年(昇順)
www.customs.go.jp/toukei/srch/index.htm?M=27&P=1,,,5,22,1,,,,,,2000,2018,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,20