明るい日本の住所表記に安心してくださいはできますか


久しぶりにマサカリが飛んでくるネタらしい。
ネットショップを20年近くやってると、うちみたいな弱小零細でも何万何十万と住所処理を処理することになり言わずには居られない鬱憤もたまる。
つくづく日本語のシステム、データベース化は難しい。

英語であればアルファベット24文字と大文字小文字ぐらいなのでUpper()なりlower()なりでどちらかに統一すれば検索できる。
日本語は漢字、ひらがな、カタカナぐらい?
漢字は一般的なコンピューターシステムでサポートされているJIS系の第1~4に補助漢字までいれてだいたい約16,000字ぐらいが一般的なフォントで対応されている。
ということは、24文字を1万6千文字に増やした分だけ頑張らなきゃいけないのか! それは大変だね!!

・・・なんていう枠には収まらない。

だからこそ、地獄のフタを一度でも開けた人たちはマサカリを投げつけるのである。完全に理解した曲線のバカ山の能天気さは絶望の谷底からみると眩しすぎるのだ。
地獄に落ちてしまった亡者が手をのばすほどには。

16000文字÷24文字=666.66666666666倍

そこは決して開けてはいけない地獄のフタなのである。

分かち書きカカシ先生は脳みそを求めて旅に出る地獄

ちょいと前に話題になった動画に「変なAI」というのがあった。

雨穴さんの【科学ホラーミステリー】変なAI
www.youtube.com/watch?v=NAv0aScEQm0

このホラーミステリー的な動画では作中にAI「kakashi」というのが出てくる。カカシと聞くと、インターネット老人会の人たちはすこしざわざわする。

古い話し。

kakashi、実は2000年の頃に実在していて、かつては全文検索エンジンをつくるのに、kakashiやらnamazuやらをつかって分かち書き、インデックス化をしている時代があった。

分かち書きというのは、英語の場合は単語と単語の間がスペースで区切られているため、単語で検索することができるが、「日本語 は 文中 に 区切り が ない」ので、こんな感じ分解してやる。

チャセンやらメカブやら形態素解析が一般化する前までは突っ込まれたテキストをどこで区切るのかは実に大問題で、無計画な全探索などをおこなってしまうと一生かけても応答しないぐずのろ検索エンジンになってしまうのだ。そんな風に予め持っている手持ちの辞書と突き合わせて文章を細切れにして索引をつけておく必要があった。

愛知海部飛島新田竹之郷ヨタレ南ノ割

これは日本一長い住所から、あえて郡とか字の区切り文字表記を抜いたものであるが、日本人の何人がこれを正確に分かち書くことができるだろうか?線でも引いて区切ってみてほしい。

正解はこれ。

愛知県 海部郡 飛島村 大字飛島新田 字竹之郷 ヨタレ南ノ割

人間に難しいことはAIにも難しい。
2023年現在、だいぶ進化したとは言え、ChatGPTに日本語の文字数を尋ねるとおかしな答えが帰ってくることがある。夏を季語に俳句を読んでもらった。

2023年なうてのAI、ChatGPTさんは俳句を読めても、それが何文字ですか?みたいな人間には簡単に見える質問には満足に答えることができないことがある。ここに日本語の難しさがある。

もしかしたらこれは、GPTの学習が「日本語」ではなく、文字コードのバイナリで線形学習していることによる弊害かもしれない。存在しない「視覴」なる単語を使いだしたという騒動を見ているとその確信を強くするが、マルチモーダルを目指す過程に今この瞬間だけ見ることができるマルチバイト言語に現れた時代の徒花と考えれば、音数え 趣深し 梅雨の藍。

これはおもしろい。UTF-8とChatGPTのトークン:
視覴 e8 a6 96 e8 a6 b4 |25038|244|25038|112|
視覚 e8 a6 96 e8 a6 9a |25038|244|25038|248|
視聴 e8 a6 96 e8 81 b4 |25038|244|36735|112|
「覚」の前半と「聴」の後半がくっついたみたい t.co/oSpUfNxsUN— Haruhiko Okumura (@h_okumura) June 8, 2023

ちょっとだけ解説すると、文字コードのUTF-8のバイナリはリバースにスタックされてるので日本語化するときは読み込み順を逆にしてからエンコードしてやらにゃならない。U+07FFみたいなんがバイナリ読み込みするとFF07みたいに拾われてくるので07FFに結合してUTF-8でデコードする感じ。これはUTF-8が1-4バイトの可変長であることに多分由来しているんだろうけど詳しくは知らんし自分には荷が重いので、ここではそんな地獄もあるよと軽く触れる程度で終える。しらんけど。

地名の読み方無限地獄

日本語を分かち書くことはただでさえ難しいのに、さらに厄介なことに、固有名詞、地名はさらに輪をかけてそれを困難にする。

地名をなんと読むか、読めない地名をどこで区切るかは母語を日本語にする人にもとても難しい問題だ。
そのため表現も揺らぎやすい。
やがて同じ読みでもいくつも書き方が存在するようになる。

山手、山の手、山ノ手。

ひとつの書き方にいくつも読み方、ひとつの読み方に複数の書き方が存在するようになる。
山手と書いて、やまのてと読んだり、やまてと読んだり、どちらでも正解だったり、読み方が決まっていたり、あるいはどちらとも間違いだったりする。会社によって自治体によって運送会社によって正解が変わる。東京にも山の手はあるし神奈川にも神戸にもある。

これに方言も混じれば読み方がさらに増え、さらに書き方が増える。
こんな風にして地名は発散する。

昨年ニホンゴムズイという、アプリを習作がてら作った。
歴史的な経緯(?)から千葉県にはとてもむずかしい難読地名が多いのだけど、それを4択クイズにしただけのそんなにおもしろくもないゲームだ。

※ 今はAppleデベロッパライセンス切れ(?)でダウンロードできないけど、一応リンクだけ残しておく
apps.apple.com/jp/app/%E3%83%8B%E3%83%9B%E3%83%B3%E3%82%B4%E3%83%A0%E3%82%BA%E3%82%A4/id1608182925

我孫子市、富津市、酒々井町、東庄町

匝瑳市、鋸南町、八街市

読めるだろうか?

正解は・・・

我孫子市(あびこし)、富津市(ふっつし)、酒々井町(しすいまち)、東庄町(とうのしょうまち)、匝瑳市(そうさし)、鋸南町(きょなんまち)、八街市(やちまたし)

千葉県の基礎自治体だけをあげつらっても、ごらんの難読さ加減。

ちなみ、今ちらっとゲームのデータを見てきたのだけど、千葉県では地名に使われる漢字は常用漢字うち737文字しか使われておらず、1538が不使用となっている。逆に139文字は常用漢字以外の漢字が使われていた。

同表記なのに別の場所という例もある。

181-0016 東京都三鷹市深大寺と182-0012 東京都調布市深大寺は数キロと絶妙に離れているが連続した一体エリアではない。


調布深大寺にある植物公園は神代寺植物公園だの神代高校だの、神代とする別の漢字表記もある。
深大寺がお寺の名前に由来しいて、神代は神代村に由来しているわけだが、こんな風にすこしの区別付けのために漢字表記をあえて変えた。そしてその変更にはそれなりのこだわりがあったので放棄するわけにはいかない。
三鷹の深大寺と調布の深大寺はまだ自治体が別だからよかった。だが、もし合併したら?

630-8016 奈良県奈良市南新町(みなみしんちょう)(52~212番地)
630-8356 奈良県奈良市南新町(みなみしんまち)(1~32番地)

950-3323 新潟県新潟市北区東栄町(とうえいちょう)
950-3104 新潟県新潟市北区東栄町(ひがしさかえまち)

673-0012 兵庫県明石市和坂(わさか)
673-0012 兵庫県明石市和坂(かにがさか)

住所については、例外の枚挙には暇がないのである。
そして永遠に地名は増殖する。

なんかまだまだまだまだいい足りないが、長くなったのであと2回ぐらいはつづく

参考

とにかく日本の住所のヤバさをもっと知るべきだと思います
note.com/inuro/n/n7ec7cf15cf9c

住居表示に関する法律
elaws.e-gov.go.jp/document?lawid=337AC0000000119

愛知県海部郡飛島村大字飛島新田字竹之郷ヨタレ南ノ割は本当に日本一長い地名か?
dailyportalz.jp/kiji/140708164564


まちづくりと種まき


まちづくりに成功するとその成功がために失敗する。繁栄と衰退は糾える縄の如しである。衰退しっぱなしよりはいいのだが、今、三鷹はたぶんその移行期にある。

「100年先を見据えたまちづくりを考える 〜二子玉川の事例〜」という会が三鷹でやっていたので、どこで知って参加申し込みをしたのかも忘れてしまったが行ってきた。

法政大学 現代福祉学部 教授 保井美樹氏
二子玉川エリアマネジメンツ 代表理事 佐藤正一氏
二子玉川エリアマネジメンツ 事務局長 笠原徳広氏
まちづくり三鷹 代表取締役会長 内田 治氏

ミニ講演+トークセッション+懇親会という感じ。
二子玉川での取り組みや、現在の三鷹での状況、エリアマネジメンツなどについてお話しいただいた。
商業をやっている仲間からは三鷹については厳しい評価をきく。中央線界隈の複数の駅に出店している店長などは特に辛辣だ。曰く三鷹はまちづくりに失敗していると。次回不動産の更新どうしようか悩んでる人もいるし、実際出るのを決めてしまった人もいる。

駅前地区の再開発が進まず、向こう数年単位で厳しい状況が見えている。うまくいっても効いてくるのは数年はかかる。スーパーマーケットなど生鮮食料品屋の多くがなくなったため駅前通りの人の流れも変わってしまった。人口は年数千人単位で増えている、だが街を人が歩いていない。これってどういうこと?と。病気のようなもので、なってしまったものは緩和療法的な手しか打つ手がない。まちづくりも病気にならないよう健康でいたい。

街の中心がひとつしかない城下町が街のアップデートが難しいように、中心部がひとつだと、並行稼動や入れ替えが難しく更新が難しくなる。それがシステムではなく、耐久財だとなおさらだ。

今日、こんな記事が話題になっていた。

空き家地獄の時代「もうタワマンは法律で禁止すべきである」
news.livedoor.com/article/detail/16007393/

タワーマンションは例えば六本木ヒルズなどは300年持つような設計で立てているというが、現在の日本の戸建ての平均建て替え年数は、調査によってはわずか27年とか言われている実情が表しているように、住宅の構造寿命より先に建て替えがなされるケースが多い。

タワーマンションも、数十年、どんなに長くても百年も経てばそれらもいずれは更新の時期を迎える。築年数が行ったタワマンが低所得者用向けになってメンテナンスがろくされず火事をおこした惨事は、都市づくりとして先行するロンドン先輩が教えてくれているのだから、家電リサイクル法みたいに撤去用の引当金は公がデポジットしておおけよとは思う。だが、タワーマンションが日本で問題になるのは数十年後だろう。
目下、日本でこれから深刻化するのは今から数十年前に開発された団地やマンションなどの大型建築物である。日本の建築基準法は高度経済成長期、オイルショック後の1981と、阪神淡路大震災の2000年に大きく変わっている。数十年前にピカピカの新築として建った団地やマンションなどは、いまだ現存していてここに生活する人が一人でもいる以上、これらのケアがちょっとデリケートすぎるのだ。

古くて保全もできない建物とたいして距離もないところにタワーマンションが新たに建つ。街としてはちぐはぐな感がでてしまうのは否めない。駅というものに依存している以上、このようになってしまうのは致し方ないことなのかもしれない。

だが、100年というタイムスケールで考えるならば、本当はもっと俯瞰してみなければいけないいけないことがある。忘れられがちだが、最初に飛行機が飛んでから117年である。我々はそういう技術進歩のもとに生活しているのだ。技術や生活様式というものは変わる。

今から130年前、1889年(明治22年)中央線の元となる甲武鉄道が新宿駅立川駅間で開通した。
1930年(昭和5年)に三鷹駅ができたが、この頃、三鷹はまだ村である。日本の全国の人口は7,307万人だ。

国立社会保障・人口問題研究所
日本の将来推計人口(平成29年推計)
50年先の将来推計値までしかないが、わずか50年で日本人の数は100年前の人口になることが見えている。

resas.go.jp/population-future/#/graph/13/13204/2012/0/9.679480099505447/35.66837571/139.5558413

三鷹個別の推計でみると50年で倍になるか、減っても2万という恐ろしい推計になっている、ちょっとなんだこれ怖い・・・。

100年前。
鉄道が敷設される前は、移動の手段は徒歩や馬車であり、その中心は街道であった。街道沿いという生活の拠点、表を避けるために人があまり住んでいないところに中央線を引いたのだ。かくしてそれから駅が生活の中心になり、そして物流の主役はモータリゼーションになった。100年後はどこが表になるだろうか?オートパイロットのドローンとかが主役になるなら調布飛行場あたりかもしれないね。

今、三鷹の新川地区では、大深度の東京外かく環状道路がそこで地上の中央道と乗り入れるらしく開発が進められている。イーロン・マスクが進めるハイパーループ構想より、着実なところでTokyoの地下モータリゼーション網は実現するだろう。

だが、自動運転の車はどの道を通るの?とか、セグウェイ的なパーソナルモビリティはどのように処理するの?とか、ドローンの流通網とかができたらどこを飛ぶの?とか、そういう未来構想にはまったくの未着手だ。すごくもどかしい。

時間による効用が無視した街づくりがおこなれていると感じる。
今、1つの種を100種類でも植えておけば、それのなかのどれかが増えて100年後にはそれが街全体を食べさせてくれるかもしれない。しかし、もし10年後にそれでくおうと思ったら、1000本の実をつけることが既にわかった苗を植えなければいけなくなる。もし、今それを食おうとおもったら、人の口の数分どこからか買って来なければならない。
病気になる前なら、ほんの少しのケアで済んだものも、こじらせてしまったら大変だ。とかく公は問題がおきるまでことを放置しがちである。

それが役に立つか立たないか、価値があるかないかを有識者が判断できる時点で、種まきの時期は過ぎているのだが、確度をあげようとするために、どんどん取り掛かりが遅くなる。

リスクは一切受け付けないという人がいる。またその声は大きい。
リスクとは不確実性のことで、不確実性とは未来のことである。
未来を拒否して過去を語るだけの精神的老人になってはならない。

ぁぁ、本当は100年先の未来について書こうとおもったのだけどジジ臭くなってしまった。反省。


goosehouseと地域音楽


goosehouseというシンガーソングライターのグループがあるんだけども、今はあったんだけどって過去系なのかな?ミュージシャンにおなじみのレーベル移籍騒動みたいなのがあったようで、ごたごたしているようだ。ジョニーだけ残ったのがなんともらしくていいなと。ムーミン谷が最高の場所だと確認するために旅にでるスナフキンみたいだな。

地域で音楽ライブをやるにあたってクラウドファンディングを始めたので音楽についてちょろちょろ書く。
faavo.jp/tokyomitaka/project/3328

で、せっかくなのでgoosehouseについて書こうとおもって 、どうも2012年ごろに書きはじめたまま放置されてた記事をひっぱりだしてきた。「わしゃぁgoosehouseを褒めそやしたいのじゃ」というタイトルで、投稿直前まで書いてたのだけども、みたところ、いろんなミュージシャンの曲を聞いたり調べたりしようとして途絶えている。ということは、音楽聞いているうちにどうでもよくなっっちゃったんだとおもう。ありがち。でも、内容を読んで見ると2012年も2018年もあんま実態変わってねぇなと。

サカナクションのNFパンチ(NF将棋が好き)ちゅうyoutube番組の中で、若者集めて音楽について討論番組っぽいのをやってたりして、「CDって必要?」「ミュージックビデオって音楽?」こういう討論テーマがあった。曰く音楽をどのようにリリースしたらよいか、どんなメディアで聞いたらよくかわからない時代になってしまったそうである。聴衆者の受難であるだけでなく、作曲側、演奏側の受難の時代なんだそうだ。


music hackathon tokyo に参加したのはかれこれ一年前も前になる。もうすぐSpotifyが上陸するよと言っていたのに、まだ上陸する気配がない。もしかしたら天正遣欧少年使節団と一緒に旅立って、慶長遣欧使節とでも一緒に帰国するのかもしれない。だとしたら数年かかるのもいたし方のないことだ。

SpotifyやPandoraは音楽を無料または定額で聴き放題にするサービスなのであるが、日本には素敵な音楽著作権管理団体があるのでバテレン追放令下に入国するようになかなか上陸できない。国内でも開発者用アカウントを特別にアクティベートしてもらった人たちがいるのだが、便利すぎて手放せなくなったと聞いた。本当、わしもアクティベートしてもらえばよかったのぅと後悔している。


これは何年も前に書いたものなのだけど、結局Spotifyが日本で公開されたのは2016年9月なので、数年かかるは妥当な読みだったね。1600年の航海技術ではヨーロッパに行って帰ってくるのに7~8年かかってるけど、現代の日本でも先端潮流が入国するのには7~8年かかるみたい。なんじゃそりゃ・・・。

その音楽の流通の妨げのひとつになっていた悪名高い包括契約が最高裁で否定された、のも、今じゃ数年前の話しか・・・。ここの部分はまるっと削除っと・・・。

本来であれば、どの局でなんの曲がいつ掛かったかというのは管理団体がモニタ、記録して、権利者に見える状態で管理され著作権使用料が著作権者に払われるそうなのが、日本ではそうなっていない。著作権管理団体はほぼ独占寡占であるために、その管理を放送側におしつけることが可能でテレビ局やラジオ局、はたまたyoutubeやニコニコ動画に至るまでその管理がいらない包括契約が常態化されてきた。管理楽曲ごとにJASRAC使用許諾番号などを得てから放送などという手続きは現実的ではないし、e-Licenseなど他の著作権管理団体の管理する楽曲を流すことが難しい状態となっていた。

私的録音録画補償金制度は、カセットテープやMDに始まって、CD-R、DVD、Blu-ray、そして音楽がダウンロードするものになるようになると、パソコンやポータブルレコーダーのようなハードディスクを持つものについても課金を求めようとしている。コンテンツを保護するためにDRMのような暗号化が施され、それを煩わしいとストリーミングに移行してはまた新たな問題を産む。

結局なんじゃのかんじゃのと作り手側とそれを聞きたい側の途中になんか作り手側にも、聞き手のためにもならない余計なものが挟まる。

著作権は万国著作権条約ぐらいを起点とした70年程度の歴史しかない比較的新しい権利であるが、ここのところ、職務上の発明や著作をどのように扱うかという問題がうまれつつある。

音楽が商業化され、媒体を通して流通するモノ化すると、この職務上や契約上の作曲や作詞が、契約上の問題をうむようになった。ネット登場以前は、流通枠は固定されていたのでプロモーション費用を十分にかけられたメジャーレーベルのアーティストが市場を支配的に独占することができた。小資本とかが暗黙則を破ったら市場からしめだせば事は済むので、優越的地位は揺るぎようがなかった。

自分がgoosehouseを褒めそやしたかったのは、そういう時代の流れの中で、音楽に再び愉しみを呼び戻してくれたからだ。荒削りでも育つ様まで見れるのは面白い。
彼、彼女らの説明を簡単にしておくと、それぞれが独立したシンガーソングライター6~7人からなるグループで、それぞれがユニットを組んでカバー曲を披露したりしながら、やいのやいのと談笑する月一セッションライブをustreamからYoutubeLiveに流してきた。検索ヒット率が高いポピュラー・ソングを高めのクオリティで多人数でやるので、絨毯爆撃のように数を提供でき、youtube内の関連動画にあがってくる率や、Twitterの登場などもあってSEO的にもばっちりだ。ここらへんの作戦練ったひとすごいなとつくづく思う。

大人な邪推を言うと、どこかのレーベルとかの契約研修生とかをレッスン費用あたりとバーターで安く契約して、まあ、芽が出たらラッキーとかやってたのかなとか考えちゃうんだけど、まあ事実はわかりませんが、大人都合はともかくとして、なんにせよ当人たちが楽しそうだったのがいいよね。
まあ、脱退前は数ヶ月むっつりしてたりするのをみると、大人な事情が透けてみえたりもするのであれだけれども、体制を支える側の成功率や透視台効率を考えると、これもまぁしょうがないよね、と。同じことをメンバー変えてやってもなかなかマジックは生まれないし。成長したらインキュベーションからはできるだけ追い出していかないと育たないし。

でね、ここのところメンバーも固定化して、新旧の入れ替えもおきなかった。いつのまにかガチョウのインキュベーションからGooseという群れになった。巣立った卒業生も力をつけてきて、飛び立ったのが戻ってきたんだろうね。そりゃニルスも大慌てさ。

・・・で、ここからどうやって地域音楽につなげよう?

そう、goosehouseみたいに苦労しつつもある程度華やかな舞台に出れた子はよいとしても、そこに至れない子や、そこから数十年を経た人たちはどうなるか?

お向かいに俳優の橋爪功さんがやられている劇団の事務所があって、縁あって数年前から商店街でステージイベントをやるようになって気がついたんだけれども、地域には若くてこれからがんばりたい!っていうミュージシャンや、ベテラン勢まで、そういう人たちがごろごろ居るんですね。

音楽みたいなそれぞれの趣味が大きく異なるもので、大きな音がでるものを開放系の公共空間でやるのは、主催側としてはかなり頭がいたい問題が何ダースもくっついてきて、下げる頭も、首の筋肉もたりなくなるのですが、だけども、若い人たちとかに機会をつくるのは大人の役割ですよね。わしも大人になったもんだのぅ。また、60、70歳の年配者たちが楽しげに演奏してたりするのを見せるのも、当人達の楽しさだけじゃなくて、大切なことなんじゃないかと思うわけです。

あの大御所のバックバンドで演奏してたんだよとか、好々爺善としているけど、あの人、若いときスター誕生の優勝者してデビューしてたんだよとか、あっこのお店の女将は、大手レコード会社のボーカルオーディションでグランプリだったんだよとか。そういう諸先輩方が身近にいるのに、いままでは気が付きもしなかった。世阿弥も風姿花伝で時分の花と老木の花を例えてたけど、若い時分の消費されるだけの草花に目は移りがちだけど、葉もつけない枯木にまことの花を探すのは実に難しい。

公共施設はクラッシクみたいな格式高い演奏会をする場所はあるのだけど、小さなものはない。ライブハウスは吉祥寺や荻窪とかに吸われていってしまうし、まあ、演奏したいだけなら大人ならお金だせば借りられるけど・・・、でも、地域っていう横串でもなければ、世代やジャンルが交じる機会なんていうのはないですよね?

才能や練度は、もちろん人によって様々。
でも、音楽というものが再び形を変えつつある今、もう少し身近な音楽体験ができる、プラットフォーム造りというか原体験提供の機会は、これからますます重要になってくるんじゃないかと思う。オーディエンスとして消費するんじゃなくて、全員がミュージシャンになるぐらいでちょうどいいんじゃなかろうか。盆踊りのそれに近い。

正直クラウドファンディングでお金を集めても手数料で2割持っていかれてしまうし、お金集まらなくても運営できるように手はずは整えてはいるのだけど、それでも、わざわざクラウドファンディング化したのは、地域の片隅でその場に来た人たちだけが楽しかったねーのいっときのもので終わりにしたくなかったから。

ここは連雀町。グーズハウスの決め台詞「一人でも飛べるけどみんなと一緒だともっと飛べる」みたいに、「雀は一匹だとチュン、二匹だとチュンチュン、三匹だとチュンチュンチュン」みたいなのを標語にして頑張りたいと思います。

クラウドファンディングどんとおまちしております。
faavo.jp/tokyomitaka/project/3328

参考

Ustreamのライブアーカイブもおおよそすべて残っているので気に入ったひとはこちらも見るとすげぇ楽しめます。
www.ustream.tv/channel/playyouhouse?rmalang=ja_JP

2012年のカバーで俺がHOIに選んだのはメモによると
レーザービーム/Perfume(Cover)でした。
youtu.be/LVPcTo5nGnU

作り物で押し固めた音楽、Goose Houseをボロクソに批判したい。
basement-times.com/goose-house/

こういう批判もありますよね、ぼかぁ演奏後の「ありがとうございます」っていうのが、プロスポーツ選手がインタビューで間に挟む「そうですね」ぐらいに違和感はあった。