AIが創る文章:人工知能じわる技術的特異点


人工知能についてあれこれ本を読んだり調べたりしたので、ブログにもちょろちょろっと書いていく。

自分みたいな商店街のおっちゃんがAIについて解説してなんになるんだという話しはおいておいて、ちょっと量が多いので数回に分ける予定。今回はAIの定義とさわりの部分とAI文章について書くよ。

 

AIにはいろいろな概念や定義があって、よくわからんよね。

  • Artificial intelligence ← 人工知能
  • Addisional intelligence ← 人間の拡張知性としての人工知能
  • Agri-Infomatics ← 農業×AI的な略語をAIに寄せた何か

などなど。その他大勢。

ここでは「Artificial intelligence」と限定するが、限定したとしても、マーケティングAI、弱いAI、強いAI、強いAIを超えるAIというようなそこから枝分かれしていたりする。

AIというと、アンドロイドやサイボーグのような未来SF的なものをイメージする人もいれば、ルンバに入っているアルゴリズムのような技術的なものを連想するひともいる。マーケティング用語としてのAIがちょっと目新しいアルゴリズムを載せただけのものをぐいぐい押してくるので混乱に拍車をかけている。

 
知能とは何か、知性とは何かがそもそもうまく定義できていない、もしくは暗黙知として共有されていない状態下で人工知能を定義しようというのに無理があるのだ。つまり、偉い人達はなんやら定義を言っているけれども実質人工知能についてはあんま共有できてないし、時代に応じて変わりそうだよねって状態だ。

 

 

日本語の自然言語処理

日経がやっている星新一賞というものがある。もう第三回を数えるそうだ。

スクリーンショット 2016-04-22 01.37.02

きまぐれ人工知能プロジェクト 作家ですのよ
www.fun.ac.jp/~kimagure_ai/results/index.html

この文章は実はAI(とされるもの)が作文したものである。

 

人間がプロットを作成し、それに沿ってコンピューターが作文するいわば人間とAIの合作だ。これが、コンテストの一次審査を突破したそうな。このAIもプロットを作る側の人間と同じところがやっているので、それってただの作文補助ツールじゃね?ということもできるが、まあ、まあ、まあ。

 
AIによる作文もここまできましたという例です。

作中の素数、フィボナッチと来てオチの数列の意味がわかんないので誰かおしえてください・・・。

 

もし、AIと人間が書いた文章と区別できなくなれば世界はスパムメールで再び溢れかえるかもしれないね。
この自動合成のあたりの手法に興味があって深掘りしたければ、マルコフモデル(これってマルコフニコフ則と関係あるのかな?)だとか、ワードサラダだの、ベイジアンフィルタだのをたどればいいんじゃないかな。

 

人工知能による自然言語処理

この分野、日本はとても遅れているように感じる。
海外ではプロスポーツの速報結果などは既に自動作文になって久しいし、大手新聞社も長文を読者の住所に応じて動的生成するなど意欲的な取り組みが絶えない。

business.newsln.jp/news/201511080445270000.html

 
記者の記名記事以外は感想ではなく客観的事実にもとづいて事実を報道することが求められるので、人間の介在は必要なくなっていくのも自然の流れだ。

この分野で日本が立ち遅れているのにはわけがある。
いや、別に報道と権力が近すぎて報道の自由がダメダメで、編集にある種の意図が介在しているからダメとかそういうところでは(今回は)ない。(youtubeでデビッド・ケイで検索してでてくる案件のことね)

 
日本語が他の語族体系と構成が遠く、アルタイ語族(ウラル・アルタイ諸語)に類する類語が韓国語ぐらいしかないために両方の話者を集めても1億5千万人程度しかおらず、正直あまり熱心に研究されているとは言いがたい状態にあるためだ。

インド・ヨーロッパ語族をはじめ多くの言語では単語ごとにスペースなどで区切られていて単語や文節がはっきりしている。逆に日本語は文意を探る前に形態素解析をしなくてはならない。

形態素解析をしてよしんば品詞ごとにわけられても、そこから正確な文意を汲み取るのが厄介なのだ。

「おみおつけとお味噌汁が違うものだなんて別にそんな事はなくはなくってよ。」

※この記事の最後に形態素解析したらどうなるかをつけておく
人間にはなんということもないふざけた一文なのに、どのような品詞構造になっていて、文法構造はどうだ、否定の係り受けはどうなっているんだとかを分解しようとすると心が折れる。「おみおつけ」は一体ぜんたいどんだけ丁寧語の接頭字なんだ!みたいな。

 

「人造寅次郎」というような適当に漢字を並べただけで自由に造語が容易につくれるのも厄介なところだ。言葉が音を表したものではなく、漢字圏は意味を表した表意文字なので単語が話者の発音に囚われず無限に作ることができる。

 

英語で最も長い単語は「floccinaucinihilipilification:無意味という意味」だという論があるが、発話時の音を共有している書き文字では話者がいない単語は概念共有できない。つまり有限個数である。
しかし、日本語は辞書にも載らない単語が今日も生まれ、今日も死んでいく。今後も辞書に乗ることもないであろう単語だらけなのだ。しかも「人造寅次郎」という単語である程度共通したイメージができちゃうのかもしれないところがさらに怖いところなのだ。顔文字で会話できたり、Lineのスタンプで会話できるのはこの表意文字に親しんでいるということに由来しているんじゃねぇかなと思っている。。

 
だけど、こういうのは暗黙知を共有していない日本語話者以外には通じないし、ましてやそれをプログラムのような論理的解釈の上にのせるのはとてもしんどいことなんだ。なんせ辞書で定義もされていない単語をつかって解釈をぶつのは論理記述屋のすることじゃぁない。

 

さらには日本語はオノマトペのような擬音語で済ませることも多く、「今日はぬらぬらヌチャヌチャした」なんて言えばなんとなく赤面する程度に非言語異存でばっちぐーなローコンテクストの文化背景なんだ。だいたいばっちぐーってなんなんだよ!言語のチートモードだよね。こんなの。

 

  • 話者が少ない
  • 他の語族で得たノウハウが使えない

これによって、日本語というものの扱いがもの凄く厄介になっている。
この問題はまたAI作文以外の項でも述べたい。
まだ分かち書きが難しかった頃は日本語の文章を全文検索することすら難しく、カカシだのナマズだのメカブだのなんだのと、実に独自進化を遂げているのである。ここには言葉を翻訳する以上のローカライズの労力が必要なのだ。

 
小説を書けるAIを自分もつくってみたくて、物語論(ナラトロジー)についてもちょっと調べたり、小説の作法をちょっとみたりしているのだが、そもそも日本語の資料も物語論についての体系的な研究も少くて(´・ω・`)

手動でできない事を自動でやってもろくなものにならないので、いま学習を詰んでいるところ。

 

 

おまけ

↓おみおつけの文をYahooの形態素解析にかけるとこんな感じ
developer.yahoo.co.jp/webapi/jlp/ma/v1/parse.html

<ma_result>
<total_count>18</total_count>
<filtered_count>18</filtered_count>
<word_list>
<word>
<surface>おみおつけ</surface>
<reading>おみおつけ</reading>
<pos>名詞</pos>
</word>
<word>
<surface>と</surface>
<reading>と</reading>
<pos>助詞</pos>
</word>
<word>
<surface>お味噌汁</surface>
<reading>おみそしる</reading>
<pos>名詞</pos>
</word>
<word>
<surface>が</surface>
<reading>が</reading>
<pos>助詞</pos>
</word>
<word>
<surface>違う</surface>
<reading>ちがう</reading>
<pos>動詞</pos>
</word>
<word>
<surface>もの</surface>
<reading>もの</reading>
<pos>名詞</pos>
</word>
<word>
<surface>だ</surface>
<reading>だ</reading>
<pos>助動詞</pos>
</word>
<word>
<surface>なんて</surface>
<reading>なんて</reading>
<pos>助詞</pos>
</word>
<word>
<surface>別に</surface>
<reading>べつに</reading>
<pos>副詞</pos>
</word>
<word>
<surface>そんな</surface>
<reading>そんな</reading>
<pos>形容動詞</pos>
</word>
<word>
<surface>事</surface>
<reading>こと</reading>
<pos>名詞</pos>
</word>
<word>
<surface>は</surface>
<reading>は</reading>
<pos>助詞</pos>
</word>
<word>
<surface>なく</surface>
<reading>なく</reading>
<pos>形容詞</pos>
</word>
<word>
<surface>は</surface>
<reading>は</reading>
<pos>助詞</pos>
</word>
<word>
<surface>なくっ</surface>
<reading>なくっ</reading>
<pos>形容詞</pos>
</word>
<word>
<surface>て</surface>
<reading>て</reading>
<pos>助詞</pos>
</word>
<word>
<surface>よ</surface>
<reading>よ</reading>
<pos>助詞</pos>
</word>
<word>
<surface>。</surface>
<reading>。</reading>
<pos>特殊</pos>
</word>
</word_list>
</ma_result>


日奈久断層から別府島原地溝帯の地震に変化か


今晩から明日にかけ瞬間最大風速35メートル、例年4月一ヶ月分の雨量が1日に降雨するという台風なみの暴風雨になると予想されている。緩んだ地盤に雨が入り込むので土砂災害が予想される。被災地では最大限の注意をされたし。

 

 

さて、震源が熊本から大分にまで広がりつつある。

 

2016-04-16 12_36_42-新しい通知

www3.nhk.or.jp/news/live/?utm_int=all_contents_tv-news_live

 

 

昨夜16日午前1時25分にマグニチュード7.3の地震が深さ10キロにて発生したのち状況が変わったと判断したほうがよさそうだ。(( www.jma.go.jp/jp/quake/20160416033614387-010000.html )) 震源の分布が16日午前9時頃から11時にかけて阿蘇山をまたいで大分県側に広がっている。

 

14日に熊本にて発生したマグニチュード6.4の地震は、布田川断層・日奈久断層のうち、日奈久(ひなぐ)断層帯(全長約81キロ)のうち北端にある高野~白旗区間(同16キロ)が活動したとされる。(( mainichi.jp/articles/20160416/ddm/001/040/137000c ))
地震で発生したエネルギーの関係から、14日のが前震で、16日未明の地震が本震ということになった。

 

阿蘇山をまたいで震源が連動しだしたことで、別府島原地溝帯というもっと広い面で考えなければならないようだ。午後にかけて震源地もだんだん阿蘇から東北側に移動しつつある。

 

2016-04-16 12_37_00-NHK NEWS WEB ニュース同時提供中

産総研 活断層データベース 起震断層
gbank.gsj.jp/activefault/cgi-bin/search.cgi?search_no=j024&version_no=1&search_mode=2

2016-04-16 11_51_02-産総研:活断層データベース

14日からおきている布田川断層・日奈久断層でおきている特定ひとつの断層でおきている地震だけだとは判断できなくなったといっていい。阿蘇山をまたいだ。(スクリーンショットは14:00のものだが、現在までにもっと多くの地震が発生している。)

専門家「これ以上の本震が今後あるかもしれない」 地震連鎖可能性否定出来ない
西日本新聞 4月16日(土)12時33分配信

headlines.yahoo.co.jp/hl?a=20160416-00010013-nishinp-soci

 

「震源、じわじわと東に」 別の活断層に影響の可能性
朝日新聞デジタル 2016年4月16日11時35分

www.asahi.com/articles/ASJ4J34VYJ4JULBJ00G.html

 

九州大学の地震情報をみてみよう。

この24時間での地震の発生状況だ。まさに別府島原地溝帯である。

2016-04-16 12_32_34-SEVO Seismicity Map (kyu_last1day)

www.sevo.kyushu-u.ac.jp/~hypo/hypomap/last1day_kyu.html

 

この7日間の地震発生状況。

2016-04-16 12_31_37-SEVO Seismicity Map (kyu_last7day)

www.sevo.kyushu-u.ac.jp/~hypo/hypomap/last7day_kyu.html

 

この30日の地震状況。

2016-04-16 12_30_50-SEVO Seismicity Map (kyu_last30day)

www.sevo.kyushu-u.ac.jp/~hypo/hypomap/last30day_kyu.html

30日でみると、結構広範囲で中央構造線沿いに動いていることがわかる。得に画像左下、九州南西の海洋上が特徴的。右下の海洋上は海溝部でプレートが沈み込んでいるところだ。

こうやってみると30日の間に南西から亀裂の伝達が東北方向に移動しているのが見える。

usgsで確認できる30日以上前のM2.5地震を確認するかぎり3月頃からおきている石垣あたりの地震から続いているのかもしれない。

2016-04-16 16_27_54-新しい通知

earthquake.usgs.gov/earthquakes/map/#%7B%22feed%22%3A%221460791525281%22%2C%22search%22%3A%7B%22id%22%3A%221460791525281%22%2C%22name%22%3A%22Search%20Results%22%2C%22isSearch%22%3Atrue%2C%22params%22%3A%7B%22starttime%22%3A%222016-01-01%2000%3A00%3A00%22%2C%22endtime%22%3A%222016-04-16%2023%3A59%3A59%22%2C%22maxlatitude%22%3A34.452%2C%22minlatitude%22%3A23.08%2C%22maxlongitude%22%3A132.759%2C%22minlongitude%22%3A119.663%2C%22minmagnitude%22%3A2.5%2C%22orderby%22%3A%22time%22%7D%7D%2C%22listFormat%22%3A%22default%22%2C%22sort%22%3A%22newest%22%2C%22basemap%22%3A%22grayscale%22%2C%22autoUpdate%22%3Afalse%2C%22restrictListToMap%22%3Atrue%2C%22timeZone%22%3A%22utc%22%2C%22mapposition%22%3A%5B%5B21.57571893245848%2C117.68554687499999%5D%2C%5B34.125447565116126%2C139.306640625%5D%5D%2C%22overlays%22%3A%7B%22plates%22%3Atrue%7D%2C%22viewModes%22%3A%7B%22help%22%3Afalse%2C%22list%22%3Atrue%2C%22map%22%3Atrue%2C%22settings%22%3Afalse%7D%7D

 

余震が連発しているが、7.2の余震にしては規模も間隔も短いので、今後も注意が必要だ。
中央構造線と布田川断層・日奈久断層における地震については前回のエントリー、先日書いている。

中央構造線と熊本直下地震

 

四国のスロースリップ観測状況

広島大学のATMOSもここ数日分を追ってみる。

tremor.geol.sci.hiroshima-u.ac.jp/day.cgi?&day=1&month=4&year=16&figtype=omap&area=e-shikoku

範囲は狭いが、四国東部の中央構造線上で体感できない(ゆっくり地震)スロースリップが観測されている。


 

大分などの潮位情報

地震と潮位は関係ないオカルトであることは前回のエントリーでも申し上げたが、貼っておく。

www.data.jma.go.jp/kaiyou/db/tide/suisan/suisan.php

2016-04-16 12_47_23-気象庁 _ 潮汐・海面水位のデータ 潮位表 大分(OITA)

大分県の潮位変動は今日あたりが最緩慢か。

 

四国西部、宇和島はこんな感じ・・・。

2016-04-16 12_49_15-スタート宇和島

四国、中部瀬戸内海側も16日あたりか。

2016-04-16 12_50_34-気象庁 _ 潮汐・海面水位のデータ 潮位表 伊予三島(IYOMISHIMA)

こちらは大阪方面の淡路島洲本。潮位変動はどちらかというと緩慢な印象がある。

2016-04-16 12_52_19-気象庁 _ 潮汐・海面水位のデータ 潮位表 洲本(SUMOTO)

潮位は、ただのオカルトなので科学的な立証でもされないかぎりは真にうけないこと。

 

建物被害、文化財

加藤清正が建てた熊本城の東十八間櫓や北十八間櫓が崩壊してしまったようだ。
こないだのブラタモリがありし日の姿になってしまった。阿蘇神社の楼門と拝殿も壊れてしまった。

熊本城の屋根瓦が吹き飛んだのは、昔の建物は瓦を吹き飛ばすことで免震構造にしてたということらしい。なるほど、たしかに、重量物をパージしていけば、建物の固有振動周期変えられるな。古式のエキスパンションみたいなものか。

橋の崩落、高速道路の立体交差の陸橋、ダム(こちらは防波堤のみの決壊だったようだ)などのダメージがあったようで、やはりこれも明日からの雨で予断を許さない。

 

 

噴火について

阿蘇山が小規模噴火したが現在までのところこちらはおいておいて問題はないのではないか。以前から活動がやや活発化していたところに、表層の断層地震で刺激されて噴火した程度なのではないかと考えている。311以降ひずみが溜まっているはずなのでいずれ破局噴火がおきるかもしれないが今回のそれとすぐに結びつけるのはよくないことのように思う。なんにせよM7じゃぁないな。

 

 

NHKの災害時サイマル放送

災害時ということで、テレビニュースのネット同時提供されている。

www3.nhk.or.jp/news/live/?utm_int=all_contents_tv-news_live

他のニュースや関係ない報道をすると停波するんだけど、なんか中国のグレートウォール下で報道をみているような気分になる。こんな感じなんだろうね。

 

人的被害

最後になってしまったが、文化財やモノの破壊などなんということではない。しかし、前途洋々これからという若者が亡くなるということについては言葉もない。お悔やみを申し上げる。
東海大学、阿蘇キャンパス農学部が。あったようだね・・・。
www.u-tokai.ac.jp/about/campus/aso/

南阿蘇村の道路が寸断し、1000人が大学に孤立した状態になっているそうだ・・・。

 

 

震源地が広がっている。自然災害は防ぐことはできない。

しかし、わずかな知識と心がけで立ち直り不能な被災者になることは拒否できる。

 

東京防災

www.bousai.metro.tokyo.jp/book/

 

どうか、地震のない地域の人たちも他人事にならずに。

中央構造線は熊本から静岡まで続いているのだから。

 


中央構造線と熊本直下地震


ただいま深夜。6両編成回送中の新幹線が車庫にもどる最中に全車両脱線したと報道をしている。災害中なのでNHKがサイマル放送を公開し、ネットでみれるようになっているのだ。明日あかるくなったときの被害の広がりが心配だ。

倒壊した建物の下敷きになった人たちがいるそうで、死者が2名でたと報道があった。直下に近いので被害は局所に集約されているものの、余震は本震を超える規模や揺れになるものがあるので今後も注意が必要だ。断層による地震だとおもわれるので今後もしばらく地震がつづくことが予想される。気象庁によれば1週間程度は警戒の必要があるそうだ。

 

 

活断層をみてみよう。

活断層データベース 起震断層・活動セグメント検索[GoogleMaps版]

gbank.gsj.jp/activefault/cgi-bin/search.cgi?search_no=j024&version_no=1&search_mode=2

スクリーンショット 2016-04-15 00.21.40

今回動いたのはこの活断層帯(布田川断層・日奈久断層)だとおもわれるが、すこし離れた地域、西側でも動いている様子なので、今後判明する未知の活断層もあるのかも。

 

 

USGSのデータを追う。

ここ30日ほどのM2.5以上の地震。結構活発になってます。

スクリーンショット 2016-04-15 00.01.03

スクリーンショット 2016-04-15 00.04.15

スクリーンショット 2016-04-15 00.19.08

※おそらくこの6.2のデータはプロット位置が間違っているのではないかな。

 

 

4/1の紀伊半島沖の地震以来この数週間、ゆっくり地震(スロースリップ)に特徴的なシグナルがでていたので東南海に注目していたのだけれども、まさか中央構造線のどんつき熊本でこれほど大きい地震がおきるとは考えてもなかった。

スロースリップについて簡単に説明しておくと、「ゆれない地震」のことである。プレートや断層が壊れることでおきるのが「揺れる地震」だけれども、これは壊れないまま静かに沈み込む地震。低周波で観測され2002年に提唱され観測が始まった。揺れないので人間の体感ではわからない。このスロースリップがおきていない箇所にプレート同士の固着域(アスペリティ)があるんじゃないかと言われている。アスペリティ部分が剥がれずれたときに巨大地震が発生する。

 

 

 

通常の地震と同じく断層すべりですが,そのすべり速度や破壊速度が通常の地震と比べて小さいことから,スロー地震と総称されています。このようなスロー地震は,南海沈み込み帯の他にカスケード沈み込み帯やサンアンドレアス断層などでも観測されています。

tremor.geol.sci.hiroshima-u.ac.jp/

 

 

広島大学がその微動ATMOS観測データを公開している。スロー地震観測された日の画像データを日付順にならべてみる。

 

ここ

4/1に紀伊半島沖で深さ10Km M6.0の地震が発生した

 

 

実はこのタイミングで、ATOMSを毎日見るようになり震源域が北のほうに移動したので、東海地震の発生を警戒していた。(警戒してもなにもできないんだけどね気になったんだよ)

 

 

下記に張っているのは紀伊半島付近の潮位情報だ。

潮の満ち干きや地殻潮汐は地震学者さんらには地震の発生とは「なんの関係もない」という結論になっているそうだ。が、311のデータなどで個人的にデータをデータベースにぶっこんでクロスしたりした範囲では大規模地震の発生についてはそんなこともねぇんじゃねぇかなと思ってんだけど、、、まあ証明するのは俺の役割ではないので、ま、素人のたわごと。ちゅうか粒度の設定をどうしたものかアイディアがないので相関とってないだけなんだけどね。そんなわけで、潮位と地震発生との関係は科学的根拠がないオカルトだけれどもあえて貼っておくね。

 

www.data.jma.go.jp/kaiyou/db/tide/suisan/

スクリーンショット 2016-04-15 00.08.36

4/1は下弦の月でした。

スクリーンショット 2016-04-15 00.10.48

たまたまですが潮位差があまり無い日です。

 

 

 

こっから、スロースリップの発生震源が紀伊半島から四国のほうに移ります。日付に注目してみてほしい。

四国の西部にうつって、おちついたのかなと思っていた・・・んですが。

 

 

 

・・・が!

 

わずか1ヶ所づつではるが、豊後水道を挟んでスロースリップが発生していますね。

正直注目するようなデータではないのだが、このデータ観測は広島大学がやっているので東海から四国までしかカバーしていないことを考えると、この数日の間、九州側でなにかがおこっていたのかがわからないのは悔しいところです。

 

 

ついでに、オカルトの潮位データを貼っておきますね。

こちらも「たまたま」だけれども4/14 干潮満潮の差がないタイミングでした。

スクリーンショット 2016-04-14 23.50.04 スクリーンショット 2016-04-14 23.55.09

4/14は上弦の月、満潮と干潮の差が少ない。きっとね相関係数だすには株価みたいに移動平均の粒度別でクロス日をとればいいとおもうんだよね。MACD的なやつで。うん。めんどくさいね。やりたい人がいたら言ってね、311のときにmysqlにぶっこんだ記憶があるからサルベージするよ。話しがそれた。もどすね。

 

 

 

で、このスロースリップの動きが中央構造線に沿ったものであるのを確認してほしい。

発生が予想される、東海地震、東南海地震、南海地震(もしくはそれらの連動)はこの中央構造線沿いに各部位が壊れることで発生すると予想されている地震なのね。

 

中央構造線というのは衛星写真で上からみても分かる程度にしっかりとみてとれる。浜松から熊本にかけての綺麗なラインがほら見えるでしょ。パレットナイフでひっかいたような筋が。実に地形って意味があるんだなと思うわけです。四国出身のひとにきいたらなんでも中央構造線って肉眼でも見えるらしいですぞ。まじでか。

スクリーンショット 2016-04-15 01.12.47

 

 

 

そう、それで、さらにオカルトになっちゃうんだけどさ。

紀伊半島のスロースリップ観測地点を見ると伊勢神社とか熊野古道とかあたりなんだよね。四国はちょっとごめんなさい霊場と呼ばれるところが多すぎてわからないのだけど、どうだろう。低周波地震発生域と霊場といわれるところって一致したりしてないかな?

人間に低周波を当て続けると幻覚幻聴を見たり聞いたりするという報告があったと思うんだけど、もしかしたらこの地震による低周波が所以となって霊場になったのかななんてことを、スロースリップの震源プロットをみてて思いました。水見みたいな古式神事祭礼にならえば低周波の発生も古来の方法で観測できなくもないし。ま、オカルトだね。

 

 

そ、地震がいつおきるのかどれくらの規模でおきるのかとかは予見予測するなんてのは全部オカルトなんだけど、ひとつだけ言えることは災害への自律的な準備、地域の準備、公共の準備は災害から発生する被害を著しく減らせるってことなんだ。なにをするまでもなく知識や心がけだけでね。

 

東京直下地震が発生したら11000人が死に、110兆円の経済被害がおきることが被害想定されている。東南海・南海地震では18000人が死に57兆円の経済被害が想定されている。

天地杞憂になることはないのだけれども、適切な知識をみにつけて準備をすることは無駄にはならないとおもうので東京防災へのリンクを貼っておきますね。

www.bousai.metro.tokyo.jp/book/