カテゴリー: 人工知能

  • Singularity is Peer

    ことしのエントリーことしのうちに。

    Singularityという言葉を一躍有名にしたレイ・カーツワイル2005年の著書に「Singularity is Near」という本がある。とても分厚い本で読むのに腰を据える必要がある内容だ。

     

    http://www.amazon.co.jp/gp/product/B009QW63BI/ref=as_li_ss_tl?ie=UTF8&camp=247&creative=7399&creativeASIN=B009QW63BI&linkCode=as2&tag=chams08-22
    が、なぜか日本語のタイトルは、「ポスト・ヒューマン誕生」で、がっかりタイトルここに極まれりである。

     

    ポスト・ヒューマン?

    ポスト・ヒューマンという語がでてくるのは、本文中おそらく一箇所だけで、それも、

    P495
    論者の中には、特異点のあとに来る時代を「脱人間」(ポスト・ヒューマン)と呼び、脱人間主義の時代になると予想している人もいる。
    「新たな」種の創造だという人もいる。
    特異点の根底にある転換は、生物の進化の歩みを一歩進めるだけのものではない。生物の一切をひっくり返そうとしているのだ

    「ポスト・ヒューマンなんてもんじゃねぇぞ」という論旨の中であり、だからこそのシンギュラリティという単語なのだが、まさにタイトルと論旨が逆・・・なんやこの邦題タイトル。ちょっと悲しくなる。
    で、Singularity is Nearが2005年だとすると、2016年はまさにpeer! 横に並んだところ、そしてティッピング・ポイント。今年は、ある程度の閾値をこえたところなんじゃないかとおもう。

     

     

    技術的特異点

    技術的特異点(Singularity)などないという人もいるが・・・。

    人がなんらかの機能を自分より高効率でこなせるような機能をデザイン設計するのが、人工知能だとする。
    人工知能がなんらかの機能を自分より高効率でこなせる機能をデザイン設計できるようになるのが、技術的特異点(Singularity)と定義すれば、本当に今年まさに見えているところだと思う。
    技術的特異点を超えるとAIはArtificial(人造の)じゃなくなる。
    それをなんて呼ぶかはわからないけれども、AIがAIを設計できるようになる。
    反復し繰り返すことをコンピューターは得意とする。
    その繰り返しのサイクルは人間よりも圧倒的に早い。
    なので、人工知能が自分よりも少しでも賢い人工知能をつくれるようになった瞬間、

    loop(AI^1.01)→∞
    loop(AI^0.99)→0

    AIの性能も発散しだす。

    人間は1世代繰り返すのに最短でも15年のライフサイクルが必要であるが、ハードウェア上の制約も「集積回路上のトランジスタ数は18か月(=1.5年)ごとに倍になる」という1965年に提唱されたムーアの法則も人間とは比べ物にならないサイクルである。演算上のloopはもっと短い。

     

    1950年代にトランジスタガールズと呼ばれる女工さんたちが、まさにハンドメイドしていたものが、現在のICチップはすでに完全無人化のもと製造がなされている。

    トランジスタガールズ


    http://www.shmj.or.jp/shimura/ssis_shimura1_24.htm

    そもそも塵ひとつ混じっただけで不良品になってしまう集積回路で、ホコリの固まりである人間が製造工程に立ち会うのは不良化の原因でしかない。そういう意味ではハードの部分は既に人の手を離れている。ソフトウエアの自己最適化はさらにちょっぱやだ。

     

     

    囲碁の世界と原子分子

    Google DeepMindによって開発されたコンピュータ囲碁プログラムAlphaGoと18回の世界王者。世界トップ棋士九段のプロ囲碁棋士 リ・セドルの間の囲碁五番勝負でAlphaGo側が4勝した衝撃はまだ記憶にあたらしい。

    Dwangoが開発している「DeepZenGo」が趙治勲名誉名人に初勝利し、さらにそれを正体不明のGod Moves(神の手)が初手天元とかふざけたことをかまして、圧倒するとかわずか1年の間に群雄割拠状態。

    1980年代の第2次人工知能ブームから、2010年代の第3次人工知能ブームになってから、2016年はまさにエポックだ。

     

    チェスの場合の数

    チェスの盤面は8マス×8マス 64盤
    最初においてあるコマを動かしていく、取られたコマは盤面上から無くなりキングをとれば勝ち。
    平均して30手~40手で1ゲーム(チェックメイト&リザイン)
    この盤面の局面数はおよそ「10の120乗」通り。
    1997年IBMのスーパーコンピューター「Deep Blue」 世界チャンピオン、ガルリ・カスパロフを相手に勝利した。
    現代ではコンピューターのガイド付きだったり戦局分析サポートがされたりしている
    (テレビ中継で有利不利が数字で表される)
    ディープ・ブルー
    http://gigazine.net/news/20160301-chess-game-visual-look/

     

    将棋の場合の数

    将棋の盤面は9マス×9マス 81盤
    敵コマの復活ありで、相手の王将をとれば勝ち。投了(決着がつくまでの手数)は100~150手程度。
    場合の数は「10の220乗」通り。
    2016/4 第1期電王戦二番勝負第1局、Ponanza電脳戦 の山崎隆之八段 Ponanzaの勝利(二局目は5月)

    「第1期 電王戦」、PONANZAが先勝
    http://www.itmedia.co.jp/news/articles/1604/11/news135.html

     

    囲碁の場合の数

    囲碁の盤面は19路×19路 361目
    石はどこに置いてもよく、相手の石を囲えば取れる。勝敗は自分の石が囲っている地所の大きさによる。
    オセロと違って、石の取り合いが発生するのでゲーム終了までの手数が決定されない。
    投了までは200~250手程度で「10の360乗通り」の局面があるとされる。

     
    えっと、10の360乗それってどんな数???
    いちばん馴染みのありそうな大きな数で、高校化学あたりで習う、アボガドロ定数を引き合いに出すと、6.02*10の23乗。
    1モル数あたりの原子の数だけど、常温で空気1molの体積はおよそ22.4リットル。

     

    計算計算っと、
    10^360通り=(6.02*10^23)^15
    22.4L^15=1.79*10^20L=1.79*10^17m^3
    (1000L=1m^3)

    ここでみんな大好き、大きな数の単位、ザ・東京ドーム!
    東京ドーム一杯分の体積は124万立方メートルなので

    1790*10^10÷124=14.4*10^10
    ちゅうことは、囲碁の局面の数は

     

    東京ドーム14.4兆個分にふくまれる空気の原子と同数!

     

    まさに天文学的数だよね。いや、計算適当ーなので、どっかでいいふらすときはちゃんと検算してね。
    ま、そんなわけで、囲碁はその複雑さからプロ棋士に勝てるようになるのは演算能力のハードの向上スピードからすると10年以上先とも言われていたんだけど、十数年分一気に前倒しされちゃったわけさ。

     

    囲碁や将棋は局面理解が必要なのでチェスの10の100乗倍以上複雑になると言われている。
    Ponanza(将棋)は1秒に10万局面を検討できるそうだけど、囲碁は1秒で300局面検討がせいぜい。
    1000台以上のプロセッサを束ねたクラウドサーバ、報道では30~60億分円の演算リソース(たぶん実費で1億2千万ぐらい)をぶっこんでいるんでないかと言われている。
    3千万の教師データ棋譜を学習させる→57.0%の確率で、人間の指し手を模倣し、計算に3ms(0.003秒)。
    一局300手で終わると考えると1.8秒(0.003*300*2)で1ゲームが終了する。
    一手5μ秒=0.000005秒でおわる軽量版同士を戦わせてそこから得られた3000万の新たな棋譜からさらに学習

     

    人間の対局が1局仮に1時間程度だとすると(プロのタイトル戦などでは各自の持ち時間が4時間~9時間)
    仮に1時間とすると3000 0000 h÷ 24÷365 =3,424年分不眠不休で指し続けた時間に相当。
    それってほぼ人類の歴史じゃんね・・・。
    まさにある分野においては人類の思索の歴史とPeerした瞬間。

     

    まとめ的なもの

    知性と呼ぶにはまだ言うべくもないけれど、AIはすでにいくつかの役割において、大多数の人間を上回るパフォーマンスを出せるようになってきていて、その領域を着実に広げつつある。

    複雑さのスケールから想像できるとおもうけど、人間には検知できないレベルの微細情報からの異物検査や異常検知、シミュレーション精度向上によって新素材の開発や創薬とかにもたぶんブレイクスルーがおきる。たぶんおきてる。
    ロボットの機能を駆動、センシング、ロジックの3つに大別すると、駆動は蒸気機関のときには既にもちろんのこと、2016年には局面理解が必要なロジックの部分も勝てなくなったと見ていい。生物がいま現在も勝っているのは周囲の空気を読む、センシング部分である。嗅覚、触覚などをとってもまだまだ生体と同等の性能を出すには、サイズ、費用ともに現在の延長線上をたどるだけであればまだまだ代替まで時間的猶予はありそうにもみえる。カメラ、音波、赤外線センサー、人間には真似できないものも多くあるが、まだまだ生物のそれはイオン分子いっこで駆動したりする、すばらしいものだ。
    しかして、人類。
    ATCGを4進数、ヒトゲノムは約31億塩基対よりなる。
    コンピューター01の2進数、8ビット=1バイト、4進数の31億は8進数の3,200,000=3.2MBであり、人間の設計図はフロッピーディスク2枚分。FDとかいっても、もう若い子には伝わらない感じだけど、iPhoneとかで撮影する写真1枚以下の容量でしかない。
    研究室でえっちらと寒天に遺伝子ながして合成してた細胞分子合成もとんでもなく安価に高速自動におこなえるようになった。遠からず分子生物を利用したセンサーが流通することだろう。それは菌糸類とか植物とかそういう倫理的にもライトなところからかもしれないし、いきなり人間をセンサーとして利用すべく後頭部にジャックをぶっ刺す攻殻な形かもしれない。
    2017年、Singularityがtearとにならずにdearとならんことを。

    メリークリスマス。

     

    参考

    人工知能の歴史
    http://blogs.itmedia.co.jp/itsolutionjuku/2015/07/post_105.html

    ネット上の超絶棋士「神の手」 囲碁界騒然、正体は?
    http://www.asahi.com/articles/ASJDM75CMJDMUCVL031.html

    AlphaGo対李世ドル
    https://ja.wikipedia.org/wiki/AlphaGo%E5%AF%BE%E6%9D%8E%E4%B8%96%E3%83%89%E3%83%AB

    人間を超えたアルファ碁(AlphaGo)は、どのようにして強くなったのか
    https://cakes.mu/posts/12685

    AlphaGo の論文をざっくり紹介
    http://technocrat.hatenablog.com/entry/2016/03/14/011152?1458093145366=1

    AlphaGoの運用料金は30億円以上?
    http://www.itmedia.co.jp/news/articles/1603/24/news058.html
    囲碁AIの勝利でさらに注目? 今年の将棋「電王戦」は“頂上決戦”
    https://thepage.jp/detail/20160408-00000010-wordleaf
    machine intelligence landscape
    https://www.oreilly.com/ideas/the-current-state-of-machine-intelligence-2-0

    億(10^8)→兆(10^12)→京(10^16)→垓
    10^23 千垓
    10^60 一那由他
    10^64 一不可思議
    10^68 一無量大数
    360乗は表せないのか・・・。
    https://ja.wikipedia.org/wiki/%E7%84%A1%E9%87%8F%E5%A4%A7%E6%95%B0

  • 東ロボくんとお受験

    東ロボくん、浪人生活辞めるってよ。
    東ロボくんとは、国立情報学研究所(NII)が人工知能に受験させて東大合格点を叩き出そうというプロジェクトである。現在は全国の69%の大学で合格可能性80%以上と判定されているが、昨年から点数が伸び悩み現在のアプローチじゃとどかないと諦念したそうな。

     

    求められる人材像

    テストはなんのためにおこなわれるか?一般には機能や性能を評価するためにおこなわれる。
    では大学入試テストは入学者にどのような資質を求めての試験なのか?

     

    高度経済成長期において、日本の大学は人材のQA(クオリティアシュアランス)、品質保証の役割を担ってきた。
    ベルトコンベアが発明された以降、規模の経済がよく効く時代には、決められた手順で決められたことをこなすことができる人材。期待される回答に素早く応じることができること。企業が求める人材像はそのようなものであった。試験が難しい大学にはより高い品質保証がされた学生が存在する可能性が高い。

    オートメーション化がすすみ大型装置産業から主体が移ると、一部の価値創造ができる人とその他大勢のための対人領域がのこされた。重要価値はコミュニケーション能力である。AO入試が機能しはじめた。

     

    大学の数と役割

    第二次大戦終了時には50もなかった大学が現在は国内で775、世界では1万以上もあるという。

    %e5%a4%a7%e5%ad%a6%e6%95%b0

    http://www.mext.go.jp/a_menu/koutou/kouritsu/
    つまらない言い方をすると、大学は学生の人材QAとしての場であるとともに、不採算な学術分野の研究人材を囲っておく場でもある。先行する英米上位校では、奨学金をとれるほどのめちゃめちゃ頭のいい子と、オツムはスカタンだけど年間数百万もの授業料を払うことができる経済力をもつご子息のマッチングさせる場などにもなってきているようだ。
    大学がもし勉学の場であるならば、25歳以上の社会人の学士入学などはもっと多くていいはずだ。
    日本は2%しかないので、勉学の場ではない。Q.E.D. 証明終了。

    %ef%bc%92%ef%bc%95%e6%ad%b3%e4%bb%a5%e4%b8%8a

    http://www.mext.go.jp/b_menu/shingi/chukyo/chukyo2/siryou/__icsFiles/afieldfile/2011/10/17/1311624_8.pdf

    大学で何かを学んだなんていうことはさして期待もされていないし、機能もしていない。社会人が使えるような知識は集積できていない。

     

    なぜ東ロボくんは東大を諦めるのか

    良いテストかどうかをみわける指標は次の3つであるという。

    • 信頼性:同じ人が同じような問題で何回でも同じような点数が取れるかどうか
    • 妥当性:用いる評価方法が測定対象となる能力や行動を測定できているか
    • 客観性:採点者間による結果の一致性。採点者が変わっても結果が同じかどうか

    日本の入学試験が測定したい能力ってそんなんでいいのかねという妥当性に疑問を覚えはするけれども、ペーパー試験の信頼性、客観性は高いんじゃないかな。その客観性、信頼性が高いペーパーテストで東ロボくんは国語や英語の偏差値が低い。AIでは文章理解に難があるからだという。
    文書解釈、認知には読み手側と書き手側の共通知、暗黙知に頼っている。「常識」が占める割合が多い。

    ほとんどの文章が不完全情報なので読み手の感受性によってどのような解釈になってもおかしくないはずであるが、文章外にある文化的なコンテクストで、それを解釈する必要がある。問題によって、本文の含蓄する情報の重み付けが変わる。

    受験の国語なんかは問題文と選択肢だけ読んで出現語彙のパターン解析したら本文とか読解できなくても正解だしたほうが正答率高くなるんじゃないかと思うんだけどどうだろう。そういうバットノウハウ、テクニック的なもので突破するのは是としなかったのかな?

    出題者の意図を察して応えてねという、回答者の善意によるおやくそくにより成り立っているだけにすぎないのだと思う。文章が読めてないのではなく、空気が読めてないのだ。

     

    人工知能にも解けるように、その文章問題を論理記述して整理したら逆に問題の客観性の部分で問題がみえてくるとおもう。文章問題の正誤答率なんて、If条件文の評価の書き方が誤読を誘発しやすいように、条件式が複雑化して難読化されているにすぎないのではないか。フールプルーフじゃなぁいんだよ。ネットショップでそんな商品説明したら、誤読されて意図しない注文続出だよね。「正しい答え」と「多くの人が答えそうな答え」が別れている時点で、ちょっと妥当性どうかなと思うんだよね。
    「文章を読んで答えなさい」は「文章を読んで(出題者が期待するものを)答えなさい」で、読むのは文章じゃなくて空気。

     

    もし「東」ロボくんじゃなくて「京」ロボくんだったら、「tan1°は有理数であるか?」とかの問題を解かなきゃいけないわけで、俺が開発者だっったらちょっと諦めようってなるのはわかるけど、AIでもフルスコアとれるまでいってほしかったなー。

    だって、こういうブログの文章だって、人間よりさきに検索エンジンのクローラーによって拾われて解析されちゃう時代なんだから、人間が書く文章の評価は先にAIがおこなうようになる時代がくる。AIによって受験問題も客観性、妥当性、信頼性を担保される。

     

    文章を読めるAIがつくれるかではなく、AIが読める文章を書けるかということに重きがおかれるようになる。

    AIで読める文章とそうでない文章では、文章が持つ価値が変わる。だって自動翻訳にもかけられないんだぜ?

    そんな時代になったら、美しい文章の意味も変わるんだろうね。

     

     

    参考

    AIで東大合格断念 「東ロボくん」偏差値伸びず
    http://www.nikkei.com/article/DGXLASDG14HI5_U6A111C1CR8000/
    AI研究者が問う ロボットは文章を読めない では子どもたちは「読めて」いるのか?
    http://bylines.news.yahoo.co.jp/yuasamakoto/20161114-00064079/

     

    衆議院議員 河野太郎公式サイト 研究者の皆様へ

    研究者の皆様へ

     

    ロボットは東大に入れるか Todai Robot Project
    http://21robot.org/

     

  • エビデンスレベルと人工知能と芸術点

    「エビデンスベースド」という単語。ここ数年急に耳目に触れるようになった。
    エビデンスベースドな教育をしようとか、エビデンスに基づく医療だとか、政策決定もお涙頂戴で煽る「エピソード」ベースドから脱却して科学的根拠をもつようにしようとか。使われ方はもろもろであるが、言葉が市民権を得てきつつある。
    おそらくは、あの311の原発事故による農作物などの風評被害へのカウンターとして科学的根拠に基づいたうんぬんというところから裾野がひろがったのではないかと思う。きっかけは悲しいことではあるが、根拠に基づいた議論がなされるようになったのはよいことだとおもう。それが喩え下地程度のものだとしても。

     

    エビデンスレベル

    「エビデンス」という単語そのものは新しいものではない。十数年前からシステム系の納品物につきまとっていた単語である。法廷や医療でも見かけた。統計の世界ではEvidence based Policyは基礎となる考え方である。
    エビデンスレベルについて、おさらいしてみよう。

    エビデンスレベル分類

    この中で専門家個人による意見というのは、一番科学的根拠がないものとされている。
    科学的根拠とは何かというと、再現性があること、同じ条件なら同じ結果を再現できると意訳してもよい。

     

    はてさて、一番根拠がないものとされる専門家個人の意見により重要な決定がなされることが世の中にはいくつもある。

    最近話題になった、東京オリンピックのエンブレムは専門家による審査員が評価しての採用だった。

    また、フィギュアスケートの芸術点が世間の感性と大きくズレていて、審査員が買収されているのではないかなどの疑惑がでてしまうのは、その評価に科学的根拠を求めることができないからであって、疑惑の否定も肯定もできない。大抵はただ裏暗いだけで終わる。

     

    違法ではないが、一部不適切とされる範囲で暗黙的談合が生まれるのは大人の事情だ。

    これをあらゆるものを清廉潔白に、全くダメなものとして排除せよという主張をするつもりは無いが、一線を踏み越えて悪どいものは遡って追求できる程度には、エビデンスベースドであるべきだと思う。

    統計「で」嘘を付いたり、御用学者の意見でサンプルバイアスが掛かりつづければ、長期的な視点で評価したときに悪害の程度が深刻な結果になってしまうことがあるからだ。

     

    ハインリッヒの法則(※1)に照らせば、「1つの重大事故の背後には29の軽微な事故があり、その背景には300の異常が存在する」というが、ヒヤリハットという些細なエビデンスが特定個人、専門家の意見により、ささいなこととして恣意的に無視され隠蔽されれば、次に我々が知ることができるのは重篤な事故がおきてからになる。

     

    エビデンスに基づかない決定

    船の設計責任は問われる仕組みがある。naval architectというそうだ。
    建築物の構造についても問われる仕組みがある。耐震偽装が発覚したとか、瑕疵担保責任とかだ。
    ただ、法律や政策の制度設計については設計責任がないそうだ。(※2
    なぜそのような決定に至ったか科学的根拠に基いていなければ、責任の取りようも取らせようもない。

    「だって権威がそう言ったんだもん」

    子供のような言い訳をするだけで世間は納得しなくても、法的違法性は問われない。都合のいいことを代弁してくれる御用聞きを連れてくればいいだけだ。

    法律はいまのところ厳格にはエビデンスベースドではないので論理言語で記述することができない。だから運用形態も判事という「権威」により法廷で解釈され罪刑が決定されているにすぎない。自分で吐き出した実行結果をエビデンスにするという、涙ぐましい判例主義、前例主義だ。

    だから、環境変化が発生しても過去に吐き出されたエビデンスに自縄自縛される。エビデンスレベルとしては最低の価値しかないものを最上位に置き続けざるを得ない。

     

    計量できない価値

    論評や好評などは評価項目をいくつかにわけて、点数などで保存したりすることで評価される。

    感性は完全合意がありえないので、多人数による合議では決定され得ないので、代表者が好評して決定するというものは合理性がある。

    しかし、視覚情報や音像、映像、一連の動作の美しさを専門家が付けた点数で残しても、それだけでは情報が欠落していて、好評からの、元の制作物の再現性は不可能といっていい。

     

     

     

    土地は貨幣で交換できるという法的価値が制定されている。

    しかし、この法的価値以外にも、先祖伝来だの、利水がどうで農地としての価値がどうだののような否定形価値がある。それら個々個別の価値を勘案すると大変なので、法律としては十把一からげにまとめているのだ。取引される経済的価値から、実際に認知される価値にはズレがある。

     

     

    はてさて、回りくどく書いてきた。

    どんな問題提起をしたかったかというと、実は「人工知能が権威の代わりになる」という未来を想定したときに何が必要かということだ。エビデンスベースドな人工知能のほうが科学的根拠にもとづいているので、ありうる未来だと考える。

     

    そんな将来、人が感じる、美しさやのような現在は計量できない価値は、やがて人工知能により計量可能なものになる。なるはずだ。人間には計量できなくても、人工知能は絵画をベクトルの集合として分解することが可能だし、環境センシングなどにより大量のデータをエビデンスとして、類型化して、認知することができるようになるからだ。

     

    で、問題。

    我々の社会において、評価指標に科学的妥当性(エビデンスなど)を持ち合わせていないまま決定がされている分野がまだ多々ある。人工知能に食わせる、教師データが恣意的にコントロールされれば、人工知能同士の暗黙的な談合や衝突がおこる。人間がやっている今の失敗がとても短いイテレーション(繰り返し)のなかで増幅されるのだ。

     

    細かなエビデンスを積み上げるセンシング、コミット、ロールバックの仕組みを作らずに、今の仕組みのままAIをサーキットさせれば、サーキットブレーカーを持たせないままフラッシュ・クラッシュを待つようなものだ。次に気がつくときは、重大な事故が起きてからになるんじゃねぇかなと思う。それは嫌だねぇ。どうすべぇ?

     

    参考

    根拠に基づく医療
    https://ja.wikipedia.org/wiki/%E6%A0%B9%E6%8B%A0%E3%81%AB%E5%9F%BA%E3%81%A5%E3%81%8F%E5%8C%BB%E7%99%82
    ※1) ハインリッヒの法則
    https://ja.wikipedia.org/wiki/%E3%83%8F%E3%82%A4%E3%83%B3%E3%83%AA%E3%83%83%E3%83%92%E3%81%AE%E6%B3%95%E5%89%87
    ※2)東京大学 人文社会系研究科 教授 松本 三和夫
    第十回報告会 福島原発事故の背景にある「構造災」を考える
    http://todai.tv/contents-list/sessions/radiation-effects/10-03

     

    原発事故から5年
    農学生命科学研究科の復興支援プロジェクト HP
    http://www.a.u-tokyo.ac.jp/rpjt/index.html

     

    孫正義×堀義人 トコトン議論 日本のエネルギー政策を考える
    GLOBIS知見録