« 昔話の計量テキスト分析――桃太郎&瓜姫(異常出生譚) | トップページ | 昔話の計量テキスト分析――狐女房(異類婚姻譚) »

2026年5月12日 (火)

昔話の計量テキスト分析――隣の爺(模倣者)

◆はじめに

以下はKH Coder(無償版:version 3.Beta.08e)を用いた昔話の計量テキスト分析である。昔話の類話の比較にツールを利用できないか試行してみた。

手持ちの資料が限られるため、分析の対象となる元データの文字数が少ないものの(※本来であれば5000字以上は欲しい)、分析自体は正常に処理されていると判断した。

KH Coderの操作に慣れる目的も兼ねて行った作業で、コーディングルールの記述の事例集、あるいは速習用のチュートリアルとしてでも読んで頂ければ……といったところである。

なお、KH Coderでよく用いられるのは共起ネットワークと対応分析とのことで、それ以外はおまけパートと思って頂いて構わない。操作に習熟するにはコーディングルールの記述に慣れるのが第一である。

◆ファイル

各ファイルをダウンロードしてKH Coderに読み込ませれば同様の分析が再現可能である。

ダウンロード - ca_009_tonarinoji.xlsx

ダウンロード - ca_009_codingrules.txt

ダウンロード - ca_009_codingrules_b.txt (※否定詞の比較検討用)

ダウンロード - kh_coder_startingedition_sagyotejunsho.txt (※作業手順書)

※「H5」とはHTMLでいうところのヘッダー(見出し)・レベル5で本文に相当すると考えればよい。
※[コーディング単位]は「文/段落/H5」から選べるが、状況に応じて適切と思われるものを選択する必要がある。処理が上手くいかないと感じた場合、コーディング単位を切り替えると上手く処理されるケースがままある。

※公式マニュアルでは「集計単位」という用語が使われている。共起関係について、

・「文」では一文単位での分析
・「段落」では段落単位の分析
・「H5」では表計算ソフトのセル単位とされ、改行を含めた一セルの中身全体が分析単位となる

※レファレンスでも索引で「コーディング単位」の項目は設けられていない。操作性に関わる重要項目であるものの、その仕様について不明瞭な感はある。
※当ブログの場合、表計算ソフトのフォーマットで読み込ませているからH5固定でいいだろうと思い込んでいたら、さにあらずだった。

◆あらすじ

・「ぶいが谷の酒」(未来社『石見の民話』)
昔あるところに良い爺さんと悪い爺さんがいた。良い爺さんがあるとき山の中で木を伐っていると、木を伐るたびに「ぶいぶいぶいが谷に酒が湧く」という音がする。ぶいが谷に行ってみると谷から酒が湧き出ていた。良い爺さんが飲んでみると、とても旨いので、夢中になって飲むうちにすっかり酔って寝込んでしまった。すると、猿がたくさん出てきて、ここに地蔵さんが寝ている。どこかへ持っていってお祀りしようと言って良い爺さんをかついで走っていった。その内に良い爺さんの金玉がぶらりと下がった。猿たちはこれを見て、ぶらりと下がった。何だろうと言ったので、良い爺さんはお香の袋と言った。しばらく行くと良い爺さんが屁をひった。ぷうんと出たのは何だろう。良い爺さんはお香の匂いと言った。良い爺さんは山の中のどこかへ連れて行かれて地蔵にされた。猿たちは爺さんを座らせると供物をたくさん供え、拝んでどこかへ行ってしまった。良い爺さんは猿がいなくなると供物を持って帰って近所の人たちに配った。隣の悪い爺さんはそれを聞いて、自分もそんな目に遭おうと思って、ぶいぶい谷へ行って酒を飲んで寝ていた。すると猿がまた出てきて悪い爺さんをかついで行った。その内に屁の方が先に出たので、悪い爺さんがおかしくてくすくす笑うと、猿たちは怒ってまた昨日の様に地蔵さまの真似をして供物だけをとって行こうとするふとい奴だと言って、よってたかってかきむしったので悪い爺さんは血だらけになってしまった。悪い婆さんは夕方になっても悪い爺さんが帰らないので山へ迎えに行くと遠くに悪い爺さんが見えた。悪い爺さんと同じ様に欲張りの悪い婆さんは悪い爺さんが赤いきれいな着物を着て帰ったと思って大喜びしたが、近寄ってみると、悪い爺さんは血だらけになってうんうん苦しんでいた。


・「屁ひり爺」(未来社『石見の民話』)
昔あるところに爺さんがいた。ある日お殿さまの山で木を伐っていたら、お殿さまの行列が通った。お殿さまが人の山で木を伐るのはどいつだと言った。爺さんは日本一の屁ひりじいと言った。それなら屁を一つひってみよとなり、ここには尻にとげがたってひられない、板の間は冷たくてひられない、畳はつるつるしてひられないとなり、毛氈ならひられるとなった。毛氈の上で錦ざらざら黄金ざらざら五葉の松原はスッポロポンのポンと大きな屁を見事にひった。お殿さまは大層喜ばれて、まさしく日本一の屁こき爺だ。褒美をとらせると言った。爺さんは褒美をもらった。それを聞いた隣の欲張り爺さんが自分も褒美を貰わねばと、お殿さまの山で木を伐っていた。お殿さまの行列が通って人の山で木を伐るのはどいつだと言った。欲張り爺さんは日本一の屁ひり爺と言った。それでは屁をひとつひってみせよとなった。ここには尻にとげがたってひられない、板の間は冷たくてひられない、畳はつるつるしてひられないとなり、毛氈ならひられるとなった。毛氈の上で錦ざらざら黄金ざらざら五葉の松原とやったが屁が出ない。そこで隣の爺さんは錦ざらざら黄金ざらざら五葉の松原はスッポロポンのポンとやったが、出たのは屁ではなく大きな黄色なのがポン。お殿さまは怒って、よくも嘘をついたなと一刀のもとに尻を切ってしまった。だから欲張りをして人まねをしてはいけない。


・「えんこうの一文銭」(未来社『石見の民話』)
昔あるところに川の東の岸と西の岸に一軒ずつ家があって、それぞれ爺さんと婆さんが住んでいた。東岸の爺さんは正直者で一匹の猫を飼っていたが貧乏なので十分食べさせることができなかった。ところがある日、竜宮さまがえんこうの一文銭をやるから天井の裏へ下げて祀れとお告げになった。朝起きてみると果たして東岸の爺さんの枕元にえんこうの一文銭がおいてあった。その一文銭を天井の裏に吊すと、これまで貧乏だった東岸の爺さんの家は日増しに身上が良くなった。反対に欲張りな西岸の爺さんの家は次第に身上が悪くなっていった。女はとかく口さがなく東岸の爺さんがえんこうの一文銭を授かってから日ごと身上が良くなったということを西岸の婆さんに話したので、これを聞いた西岸の爺さんは早速東岸の家へ行ってえんこうの一文銭を貸してくれないかと頼んだ。正直者の東岸の爺さんは長い間は貸せられないが一時なら貸してあげようと言って貸した。西岸の爺さんはその一文銭を持って帰って天井裏に吊しておくとその日から身上が次第に盛り返してきた。東岸の家は一文銭を貸した日からまた昔のように目に見えて貧乏になっていった。そこで西岸の爺さんに貸した一文銭を返してくれと催促にいったが、何とか理由をつけてどうしても返さないので、東岸の爺さんは困って戻ってきた。東岸の婆さんは考えあぐねた末に家の飼い猫に一文銭をとって来るようにいいつけた。猫は川が渡れないので困っていると、一匹の犬が来た。犬に訳を話して川を背負って渡してくだされと頼んだので、猫は犬に負われて川を渡ることができた。猫が西岸の家に行ってみると、鼠がいたので猫はすかさずこの鼠を捕って、お前の命を助けてやるから天井裏にある一文銭を取ってこいと頼んだ。鼠は天井裏に上がって一文銭を落として持ってきた。猫はそれを貰って、また犬に川を渡してもらうように頼んだ。犬の背に負われて川の中程まで来たとき、犬がくわえた物を落とすなよと言ったので猫はハイと返事した。その調子で一文銭が水の中へ落ちた。猫は泣かんばかりになって思案した。そうしたら空から一羽の鳶が下りて来たので猫は鳶を狙って咥えた。そして命を助けてやるからこの川に落ちた一文銭を探してこいと頼んだ。鳶は川の底にあるものは見えないので、川の上を泳いでいた鵜を咥えて、お前は水の底にいる鮎でも捕るのだから水の底に落ちた一文銭を拾ってくれと頼んだ。そこで鵜は川の端を上下したがちっとも見えないので大きな鮎を咥えてお前の命をとるのではない。この川に落ちているえんこうの一文銭を取ってくれ。お前は水の底を歩いて蟹とえびでさえ餌にするくらい水の底のことは達者だからと頼んだ。鮎は水の底を泳いでいくと果たしてえんこうの一文銭があった。それを拾い上げて鵜に渡した。鵜はそれを鳶に渡して鳶はそれを猫に渡した。猫はとうとう水の底から一文銭を拾い上げることができたので、喜んで歌にうたった。「猫に鼠に空たつ鳶に 川で鵜の鳥、鮎の魚」。犬は川を渡してくれたが大切な一文銭を水の中に落とすようなことをさせたので、この歌の仲間に入れていないそうだ。猫はえんこうの一文銭を持って帰って爺さんに渡したので東岸の家はまた次第に身上がよくなった。


・「とりつこうかひっつこうか」(未来社『石見の民話』)
昔、あるところに爺さんと婆さんがいた。爺さんは山へ木こりに行った。婆さんは後から弁当を持っていった。松の木原を通りかかると「とりつこうかひっつこうか」と声がした。恐ろしくなった婆さんは急いで爺さんのところへ行った。帰りはどうしようかと婆さんが言うと「とりつかばとりつけ、ひっつかばひっつけ、黄金、白金、大判も小判もひっつけ」と言えと教えた。そこで婆さんが帰りに松の木原を通りかかると「とりつこうかひっつこうか」と声がしたのでは婆さんは爺さんに聞いた通りに言った。そうしたら大判、小判、白金が手も足も動かないほどに引っ付いた。婆さんはうんうん唸って家に戻って、身体にひっついた黄金、白金、大判、小判をむしりとって大金持ちになった。これを隣の婆さんが聞いて、隣の爺さんを無理やり山へ木こりにやった。そして後から弁当を持っていった。松の木原を通りかかると「とりつこうかひっつこうか」と声がした。帰りにまた声がした。隣の婆さんは「とりつかばとりつけ、ひっつかばひっつけ」と言った。すると隣の婆さんの身体に松やにが一杯引っ付いた。そこへ六部さんが通りかかった。隣の婆さんがうんうん唸っているので具合が悪いのか訊いたところ、「具合どころではない。松やにだらけで手も足も動かされん」と言った。そこで六部さんがこの松やにを取るには家へ帰って大火を焚いて焙れと言った。そこで隣の婆さんは家へ帰って大火を焚いて焙った。そうしたら、隣の婆さんの身体に火がついて、隣の婆さんは焼け死んだ。人まねをして欲張るものではない。


・「舌切雀」(未来社『石見の民話』)
正直な爺さんと欲の深い婆さんがいた。爺さんは一羽の雀を可愛がって買っていた。いつも山に行くときには、雀や雀、行ってくると我が子に言うように別れをして行った。ある日婆さんは糊を煮ておいて川へ洗濯に行った。その留守に雀は糊をみんな食べてしまった。婆さんは帰ってみると糊がないので腹をたてて雀の舌を切って追い出した。爺さんは山から帰って今帰ったと何遍も呼んだが、雀の姿が見えないので婆さんに訊くと、婆さんは糊を全部食べてしまったので腹がたったから舌を切り取って追い出したと言った。爺さんは可哀想なことをした言って泣きながら舌切雀、舌切雀と言って山へ雀を訪ねに出かけた。すると馬を洗っている男がいたので、ここを舌切雀が通らなかったか尋ねると、馬を洗った汁を馬桶にいっぱい飲んだら舌切雀の行った方角を教えてあげると言った。爺さんは馬を洗った汁など何でもないと言って、その汁をガブガブ飲んだ。馬洗いは向こうの藪へ行ったと教えた。爺さんは藪へ行って探したがいないので、また山を越えて先へ進んでいった。すると谷川の傍で牛を洗っている男がいたので、ここを舌切雀が通らなかったか尋ねると、牛洗いは牛を洗った汁を牛桶にいっぱい飲んだら教えてあげると言った。爺さんは牛を洗った汁くらい何でもないと言ってその汁を飲んだので、牛洗いはこの曽根を下りて向こうの竹藪でタラタラ血を流した雀がいると教えてくれた。爺さんは喜んで、雀、お宿はどこだと訪ねていった。すると雀は口から血をたらしながら、お爺さんおいで、こちらでござると言って雀の宿へ案内した。そしてお茶やお菓子、色々とご馳走を出して、しまいに土産につづらをあげると言って重いつづらと軽いつづらを出した。爺さんは年をとったから軽い方がよいと言って小さいつづらを貰って帰った。婆さんはそれを見ると、長らく置いた雀だから、自分も行ったらつづらをくれるだろうと訪ねていった。途中婆さんはつづらが欲しいばかりに馬の洗い汁を馬桶にいっぱい、牛の洗い汁を牛桶にいっぱい飲んで雀の所へ行った。雀は婆さんを見ると、婆さん舌を切られて苦しい。今度あなたの傍へ寄ったら、羽でも切られてしまうかもしれないと言ってとりあわない。わざわざ訪ねてきた婆さんは雀のご馳走も食べられず、馬の洗い汁と牛の洗い汁で腹をだぶだぶさせながら、ようやく重いつづらを見つけ出し、これこれと言って取り上げて背負って帰った。早速開けてみると、中には汚いスズや茶碗のかけらに蛙や蛇の骨ばかり。宝どころか命が助かったのが何よりであった。しかし、悪いことをした婆さんはそれから病気になって死んでしまった。


・「榎の実ならいで金がなる」(未来社『石見の民話』)
昔、二人の兄弟がいた。弟は横着者で、兄の財産を皆もって分家した。兄は年取った母を養わねばならないのに、財産は皆弟に取られて貧乏していたので、除夜がきても餅もつけない有様だった。弟は餅をたくさん搗いたが兄へはひとつもやらない。兄はせめて母だけでも餅を食べさせたいと思って弟のところへ餅をもらいに行った。弟の家ではたくさん餅を並べていたが、兄に一つでも食えとは言わない。自分で搗いて食べさせたらいいだろうと言ってくれようとしなかった。兄はすごすごと戻ってきたが、つくづく情けなくなって自分は年の暮れになっても餅さえよく搗かぬと言って杵を海に捨ててしまった。すると竜宮から使いが来て兄を竜宮へ連れていった。竜宮では唐金の馬を一匹くれた。そしてこの馬に一日を米を五合ずつ食べさせよ。五合しか食べさせてはいけないと言った。兄は喜んで馬を連れて帰ると、米を五合食べさせた。すると馬は金を一升ひった。そして毎日五合ずつ食べさせたので、まもなく沢山の金が貯まった。それを聞いて弟がやって来て、いい馬を貰ったそうだが兄弟の間柄だ、少し貸してくれないかと言った。兄は正月の餅をせめて母に食べさせたいと思って弟のところに貰いにいったが、一つもくれなかったと言って馬を貸さなかった。すると母がそれでは二日だけ貸してやらぬかと言ったので、とうとう馬を貸してやった。そして決して一日に米を五合しか食わせてはいけないぞと言った。弟は馬を連れて帰ると、欲張りだから一日に一升の米を食べさせた。すると馬はぽっくり死んでしまった。弟は馬を背戸の柿の木の根元へ埋めた。兄は弟がいつまで待っても馬を返さないので、馬を戻すように弟のところへやって来た。弟は馬は死んだから柿の木の根元へ埋めたと言った。兄はお前が米を余計に食わせたからだと言って、大層力を落として柿の木の根元に埋めてある馬を掘りあてて持って帰り、自分の家の背戸の畑へ埋めて、墓印に榎を一本植えておいた。ところが榎には葉が出ないで黄金がいっぱいついて出た。それで「これのお背戸の三つ又榎 榎の実ならいで金がなる」というのだそうだ。


◆コーディングルール

※コーディングルールのキーワードは重要と判断したものを人力でピックアップしている。そのため、恣意性を伴う分析となる。

※活用形でなく基本形で入力する。

※[前処理]→[語の抽出結果を確認]でキーワードがどのように分節されているか検索すると結果の一覧[語の抽出結果]が表示される。

※[Result]から確認したい行をクリックして選択、画面下の[詳細表示]ボタンをクリックするとサブ画面が表示され、活用形や基本形が確認できる。

※昔話では「否定/肯定」「肯定/否定」と属性が変化することが多いと考え、否定詞「ない」「まい」「ぬ」「ん」、また禁止を意味する「な」を共通のコードとして設定している。

※「できる」「やる」「られる」「せる」といった動詞も共通のコードとして追加してみた。

※[関連語検索]で否定詞の共起語の一覧を表示させたところ、日本の昔話のように掌編レベルのボリュームだと、物語の動因となる箇所に関する語句が上位に表示される傾向が強いのではないか……といった印象があり、検証作業中である。

※無償版では強制抽出語の指定が機能制限で事実上使用できないため以下のような手法をとっている。


*爺さん
爺さん or 爺 or 'じい'
*ぶいが谷
'ぶいが谷' or 'ぶいぶい谷' or 谷
*欲張り
欲張り or ( 欲 and 深い )
*東
東 or 東岸
*西
西 or 西岸
*一文銭
'一文銭' or 銭
*猫
猫 or 飼い猫
*生き物
鼠 or 鳶 or 鵜 or 鮎
*ひっつく
ひっつく or 引っ付く
*真似
真似 or まね
*雀
雀 or '舌切雀'
*五合
'五合'
*一升
'一升'

*ない
ない
*ぬ

*ん

*るな
'るな'
*るまい
'るまい'

*できる
できる
*やる
やる
*られる
られる
*せる
せる

*あげる
あげる

*良い
良い
*悪い
悪い
*酒

*猿

*地蔵
地蔵
*屁

*香

*供物
供物
*隣

*血だらけ
血だらけ
*婆さん
婆さん
*殿さま
殿さま
*日本一
日本一
*褒美
褒美
*切る
切る
*いける
いける
*川

*岸

*家

*正直
正直
*貧乏
貧乏
*竜宮
竜宮
*えんこう
えんこう
*身上
身上
*貸す
貸す
*返す
返す
*犬

*渡る
渡る
*落とす
落とす
*歌

*声

*恐ろしい
恐ろしい
*とりつく
とりつく
*大判
大判
*小判
小判
*金持ち
金持ち
*松やに
松やに
*六部
六部
*火

*焼ける
焼ける
*死ぬ
死ぬ
*飼う
飼う
*舌

*追い出す
追い出す
*汁

*牛

*血

*宿
宿
*つづら
つづら
*重い
重い
*軽い
軽い
*病気
病気
*弟

*横着
横着
*兄

*母

*養う
養う
*餅

*馬

*米

*金

*ひる
ひる
*一日
一日
*埋める
埋める
*榎

*黄金
黄金


◆共起ネットワーク

・[ツール]→[コーディング]→[共起ネットワーク]でオプション画面が表示される。
・[コーディング単位]を[H5]に設定する。

※[描画する共起関係(edge)の選択]で「係数」を「0.2」から「0.3」に修正する。
※[強い共起関係ほど濃い線に]にチェックを入れる。

Jaccard係数が0.3以上はかなり強い共起関係にあることを示しているが、分析対象となる元データの文字数が少ないため係数が高めに出てしまう傾向にあるため、こうしている。

※Jaccard係数は共起関係(※ある言葉に続いて出てくる関係)の強さを表し 0≦係数≦1 の範囲の値をとる。

【Jaccard係数】
・0.1 →関連あり
・0.2 →強い関連あり
・0.3以上 →とても強い関連あり
※ただし、あくまで目安であって絶対ではない。

共起ネットワーク

ざっと確認したところ、共通するキーワードが中央のサブグラフ(バブルが島状に集まった一塊)に表示され、類話毎に異なるキーワードが上下のサブグラフに表示される形となっている。

※なお、各バブル間の距離や配置に意味はない。

◆対応分析

・[ツール]→[コーディング]→[対応分析]でオプション画面が表示される。
・[コーディング単位]を[H5]に設定する。

※[外部変数]は[タイトル]のまま続行。
※[差異が顕著なコードを分析に使用]で上位「40」とした。また[バブルプロット]にチェックを入れている。これらは文字の重なりを極力避けるためである。
※文字が重なって読みづらい場合、オプション画面の[コード選択]で不要なコードのチェックを外してもよい。

対応分析

x、y軸上の原点(0.0)から点線が伸び交差した箇所が原点となる。原点から離れるほど特徴的なキーワードだと分析される。

原点付近には「とりつこうかひっつこうか」では「ひっつく」「正直」「婆さん」、「舌切雀」では「爺さん」「雀」「あげる」といったキーワードがプロットされている。離れた位置にプロットされているのは「ぶいが谷の酒」では「ぶいが谷」「酒」「供物」、「屁ひり爺」では「日本一」「殿さま」「褒美」、「榎の実ならいで金がなる」では「五合」「一升」、「えんこうの一文銭」では「一文銭」「猫」「身上」といった辺りである。

◆解釈

隣人が善良な爺さん婆さんの模倣をしたところ、逆効果となってしまうタイプのお話である。隣人は主体の対立者なのか、もう一方の主体なのかといった点でも解釈が分かれるか。

◆階層的クラスター分析

・[ツール]→[コーディング]→[階層的クラスター分析]でオプション画面が表示される。
・[コーディング単位]を[文]に変更、実行するとデンドログラム(樹状図)で可視化される。

※キーワード指定しても可。

階層的クラスター分析・デンドログラム(樹状図)
階層的クラスター分析・デンドログラム(樹状図)

概ねストーリー展開に沿った形でクラスター化されている。

◆クロス集計

・[コーディング単位]を[文]に変更、[タイトル]で[集計]する。

クロス集計

クロス集計をかけたところ、「ぶいが谷」「一文銭」「ひっつく」といったキーワードでカイ(χ)2乗値で相関関係を示す結果(※マーク)が得られた。

クロス集計・バブルマップ

マップとして描画したところ、「猫」「一文銭」といったキーワードの残差が大きく(濃く)表示される結果となった。バブルとしては「爺さん」が大きく描画された。

◆KWICコンコーダンス

現状ではテキストマイニングのツールに文脈を読む性能はないため実際に該当箇所を読んで人力で判断する他ない。KWICコンコーダンスでキーワード指定すれば指定したキーワードがどのような文脈で用いられているか一覧で抽出される。

KWICコンコーダンス
KWICコンコーダンス・文書表示

◆関連語検索

・[集計単位]を[文]に変更、[集計]する。
・[Search Entry:]の一覧からキーワードを選択してダブルクリックすると[Result]に指定したキーワードの品詞や共起関係が表示される。

関連語検索

※[Result:]から行指定してダブルクリックするとKWICコンコーダンスに遷移する。
※[Result:]の一覧から範囲指定して[コピー]したものを表計算ソフトやテキストファイルにペーストすることも可能である。

[#直接入力]を指定して「赤い」といったキーワードで検索すると関連語が一覧で表示される。

関連語検索

◆属性の転倒

・「ない」の結果上位一覧

N 抽出語 品詞 全体 共起 Jaccard
1 言う 動詞  38 (0.260)  13 (0.361) 0.2131
2 名詞C  11 (0.075)  6 (0.167) 0.1463
3 貸す 動詞  7 (0.048)  5 (0.139) 0.1316
4 名詞C  11 (0.075)  5 (0.139) 0.119
5 食べる 動詞  12 (0.082)  5 (0.139) 0.1163
6 名詞C  4 (0.027)  4 (0.111) 0.1111
7 洗う 動詞  4 (0.027)  4 (0.111) 0.1111
8 名詞C  15 (0.103)  5 (0.139) 0.1087
9 見える 動詞  5 (0.034)  4 (0.111) 0.1081
10 名詞C  6 (0.041)  4 (0.111) 0.1053

欲深な者が善良な者の模倣をしたところ酷い目に遭う……といった粗筋となっている。

短いお話の中で属性の転倒を多用するのが昔話の特徴の一つと考えられる。

ここで「/」(スラッシュ)を「転倒」を意味する記号として用いる。スラッシュは様々な場面で用いられていて文脈依存的な記号という欠点もあるが、視覚的にはイメージしやすいと判断した。

・[悪い爺さん|婆さん:赤い/血だらけ]
・[欲張り爺さん|殿さま:屁/実]
・[東岸の爺さん|身上:良くない/上向く]
・[猫|一文銭:落とす/拾う]
・[隣の婆さん|松やに:ひっつく/火傷]
・[婆さん|つづら:がらくた/病気]
・[兄|馬:死体/黄金]

こういった風にお話を転がしていると分析できる。猫が咥えていた一文銭は川に「落とす/拾う」と転倒するが、それによって動物たちのリレーが発生する。

※なお、図式化には分析対象のテキストに含まれない語句も用いているので要注意。

※関連語検索、強制抽出語を設定しないと狙い通りに処理されないケースが見られる。

◆類似度行列

・[コーディング単位]を[文]に変更して[集計]。Jaccard係数がマトリクス形式で確認できる。

類似度行列

・ある列を選択して画面右下の[コピー(選択列)]をクリックすると、当該のキーワードに関するJaccard係数がコピーされるので、それを表計算ソフトにペーストするといった利用が可能となる。

※当ブログでは[コーディング単位]が[段落][H5]の場合、Jacccard係数が1.0~0.5といった結果がほとんどで、意味のない結果となった。

◆多次元尺度構成法

・[ツール]→[コーディング]→[多次元尺度構成法]でオプション画面が表示される。
・[コーディング単位]を[H5]から[文]に変更。
・[クリア]ボタンをクリックしてコード選択を一旦リセット、共起関係を確認したいキーワードを指定。
・次元を「2」から「3」に変更して実行、三次元のマップとした。

多次元尺度構成法

模倣者に関連したキーワードを指定したところ、「真似」が離れた位置にプロットされた。

※選択するキーワードによって相対的な位置関係は変わり得る。

※実行すると指定したキーワードの幾つかが除外されるとメッセージが表示される。テキストのボリューム不足のためか無償版の仕様によるものか判断がつかない。
※当ブログの事例では「文」以外、「段落」「H5」では除外されるキーワードが増える傾向となった。

◆自己組織化マップ

・[ツール]→[コーディング]→[自己組織化マップ]でオプション画面が表示される。
・[コーディング単位]は[文]で固定。

自己組織化マップ

記述内容が視覚的に整理され、類似性の高い内容が近くに配置される。概ねストーリーに沿った形で各クラスターが表示される。

※クラスター化の計算を繰り返すため処理に時間がかかるので要注意。
※クラスターの配置、距離に意味はない。

◆トピックの推定

・[ツール]→[文書]→[トピックモデル]→[トピックの推定]を選択。
・[集計単位]は[文]で固定。
・[OK]ボタンをクリックすると、[トピックの推定結果]画面が表示される。

トピックの推定

・各トピックで高い確率で出現する語句がリストアップされる。
・[#1]といった欄をクリックすると、文書検索画面が表示される。

トピックの推定・文書検索

◆ベイズ学習による分類

・[ツール]→[文書]→[ベイズ学習による分類]→[外部変数から学習]を選択。
・[分類の単位]を[文]に変更。
・[学習する外部変数]は「利用不可」。
・[OK]ボタンをクリックすると、ファイルの保存画面が表示されるので、任意のファイル名を記述して保存する。

・[ツール]→[文書]→[ベイズ学習による分類]→[学習結果ファイルの内容を確認]を選択。ファイル選択画面が開くので、先ほど保存したファイルを指定して開く。すると[学習結果ファイル]画面が開くので内容の確認を行う。

ベイズ学習による分類

※[学習結果を用いた自動分類]については割愛する。

※[トピックの推定]と[ベイズ学習による分類]は固有名詞などを強制抽出語としてあらかじめ指定しておかないと正確に分析されないケースが生じる。正式に利用したい際は有償版の購入をお勧めする。当ブログのはあくまでテストケースとしてのものである。

※[トピックの推定]と[ベイズ学習による分類]はコーディング・ルールに依らない分析手法となるが、筆者の能力的に追及はしない。

◆参考文献

・『日本の民話 34 石見篇』(大庭良美/編, 未来社, 1978)pp.113-115, 121-122, 134-136, 137-139, 152-155, 285-288.
・『動かして学ぶ!はじめてのテキストマイニング』(樋口耕一, ナカニシヤ出版, 2022)
・『社会調査のための計量テキスト分析 【第2版】 内容分析の継承と発展を目指して』(樋口耕一, ナカニシヤ出版, 2020)

|

« 昔話の計量テキスト分析――桃太郎&瓜姫(異常出生譚) | トップページ | 昔話の計量テキスト分析――狐女房(異類婚姻譚) »

昔話」カテゴリの記事