パングラム


[tag:]

先ほどの投稿に関連して。

パングラムに対して何文字を使うかにもよるが、 46文字だとすれば 46!=5502622159812088949850305428800254892961651752960000000000 であるから、55阿僧祇(あそうぎ)0262恒河沙(ごうがしゃ)2159極(ごく)8120載(さい) 8894正(せい)9850潤(かん)3054溝(こう)2880穣(じょう)0254𥝱(じょ)8929垓(がい) 6166京(けい)1752兆(ちょう)9600億(おく)0000万(まん)0000となる。
かの無量大数まであと10^12である。
というか阿僧祇の段階で10^56だから、モル数のさらに10^33倍とかもはや計り知れない。
これだけ使えるにしても、日本語として意味をなすパターンは極わずかだろう。

誰か自然言語処理のアルゴリズムを駆使して、46!通り中、少なくとも何通りが日本語としての 意味をなすかを計算してくれないだろうか。
素数の密度とどちらが薄いだろう。

2016-03-16 修正ついでに追記
素数定理によれば、x以下の素数の個数π(x)はπ(x)~x/ln(x)で近似される。
x=46!とすると、ln(x)≒133なので、133個に1つくらいの割合で意味の通るパングラムが 成立すれば素数と同じくらいの密度になる。
パングラムも単語レベルでの並び替えであれば意味が通る状態のまま行い易いから、 1つ見つけると結構多くなる。
意外とどっこいどっこいか。