昔話の計量テキスト分析――蛇
◆はじめに
以下はKH Coder(無償版:version 3.Beta.08e)を用いた昔話の計量テキスト分析である。昔話の類話の比較にツールを利用できないか試行してみた。
手持ちの資料が限られるため、分析の対象となる元データの文字数が少ないものの(※本来であれば5000字以上は欲しい)、分析自体は正常に処理されていると判断した。
KH Coderの操作に慣れる目的も兼ねて行った作業で、コーディングルールの記述の事例集、あるいは速習用のチュートリアルとしてでも読んで頂ければ……といったところである。
なお、KH Coderでよく用いられるのは共起ネットワークと対応分析とのことで、それ以外はおまけパートと思って頂いて構わない。操作に習熟するにはコーディングルールの記述に慣れるのが第一である。
◆ファイル
各ファイルをダウンロードしてKH Coderに読み込ませれば同様の分析が再現可能である。
ダウンロード - ca_022_codingrules.txt
ダウンロード - ca_022_codingrules_b.txt (※否定詞の比較検討用)
ダウンロード - kh_coder_startingedition_sagyotejunsho.txt (※作業手順書)
※「H5」とはHTMLでいうところのヘッダー(見出し)・レベル5で本文に相当すると考えればよい。
※[コーディング単位]は「文/段落/H5」から選べるが、状況に応じて適切と思われるものを選択する必要がある。処理が上手くいかないと感じた場合、コーディング単位を切り替えると上手く処理されるケースがままある。
※公式マニュアルでは「集計単位」という用語が使われている。共起関係について、
・「文」では一文単位での分析
・「段落」では段落単位の分析
・「H5」では表計算ソフトのセル単位とされ、改行を含めた一セルの中身全体が分析単位となる
※レファレンスでも索引で「コーディング単位」の項目は設けられていない。操作性に関わる重要項目であるものの、その仕様について不明瞭な感はある。
※当ブログの場合、表計算ソフトのフォーマットで読み込ませているからH5固定でいいだろうと思い込んでいたら、さにあらずだった。
◆あらすじ
・「犬伏山の大蛇」(未来社『石見の民話』)
昔、邑智郡都賀村の都賀西に高橋備前守という城主がいた。備前守に仕える三十六人の小姓の中に松原千代坊師という十七八ばかりの勇士がいた。ある日集まって話をしていると年長の小姓が犬伏山の大蛇の話を持ち出して、誰か嘘かまことか見届けてくる者はいないかという話になった。返事をする者はいなかったが、千代坊が名乗り出た。千代坊は他の小姓たちから妬まれていたのである。大蛇を従えて帰ったら残り三十五人の大小を褒美として進ぜようという話になった。千代坊は褒美は断ったが、これは皆の企みだとすぐ分かった。千代坊は独り犬伏山に向かった。犬伏山に近い向山の出口に一軒家があって老人夫婦が住んでいた。夕方、そこに千代坊がやって来て水を一杯所望した。千代坊はこれから犬伏山を越えると告げた。老人夫婦はここから一里あまり奥に椿の大木があって、そこに年を経た雄雌の大蛇がいる。これまで夜に犬伏山を通って災難に遭った者は数え切れないと引き留めたが、千代坊は礼を言って山へ入って行った。だんだん暗くなり、山は次第に深くなった。椿の木の下で大蛇が出るのを待ち受けた。真夜中になって大蛇が下りてきた。千代坊は大蛇を真っ二つに斬った。次に雌蛇が下りてきた。これも一刀のもとに胴切りにした。夜が明けてきた。しかし、千代坊は大蛇の毒気を全身に浴びて身体が次第にしびれてきた。勇気を奮い起こして谷底へ下りて大蛇の耳を四つ切り取って元のところへ這い上がったが、毒が全身にまわり気を失ってしまった。夜が明けるのを待って老人たちが山へ登ってきた。そして倒れている千代坊を助け起こして家へ連れ帰って介抱をして城へ知らせた。千代坊が目を覚ましたときには乗り物で城中へ迎え入れられた後であった。千代坊の勇気に感心した備前守は三十五人の小姓たちを閉門にし、三十五の大小を改めて褒美に取らせた。千代坊は身体が回復すると暇を願い、都賀東の金東寺に入って坊さんとなった。そして名を教雲と改め仏道の修行にいそしんだ。その子孫は吾郷村に今も続いている。
・「蛇渕」(未来社『石見の民話』)
浜田ダムへ流れ込む長見川の上流約一キロのところに深さ三メートルの渕がある。昔、ある年の夏、子供たちは親たちが止めるのも聞かずいつものように渕へ泳ぎに出かけた。渕の水は青く澄んで青葉に涼しい風が渡っている。子供たちは大騒ぎをしながら時の経つのも忘れて泳ぎまわった。その内に夕暮れになった。その時子供たちは悲鳴を上げながら我先にと岸へ駆け上がった。いつの間にか渕の底から大きな蛇が頭をもたげて子供たちの方をじっと見ていた。子供たちはわめきながら村へ通じる山道をいっさんに駆けだした。「渕、大きな蛇」と子供たちのきれぎれな言葉を聞いた村人たちはびっくりした。話は伝わって下の村は大騒ぎになった。早速村人たちは鍬や鎌や竹槍などを手にもって長い列となって渕へ向かった。生暖かな夜風の吹く中を身じろぎもせず薄暗い水の面を見ている村人たちの頭の上ににわかに黒雲が湧き起こったと思うと、稲妻が光った。この鋭い光に照らし出された水面に大蛇の姿が見えた。男の一人が用意していた石を投げ込むと、てんでに鍬や鎌や竹槍を投げ込んだ。しかしそれは渕の面に空しく落ちるばかりであった。やがて一人の男が村に引き返すと、大きな弓と矢を持ってきた。男は弓を引き絞ると次から次に渕に向かって矢を射こんだ。村人たちがふと我に返った時には、辺りはすっかり暗くなって、渕の上がわずかに夕明かりに白く見えるばかりであった。それから何日か過ぎ、夏も終わりに近づいた。ある日真夜中から大雨が降り出し、雨は明くる日もその明くる日も夜も昼も降り続いた。長見川は濁流となって川下へ押し寄せた。その様子を見に出た一人の男はびっくりした。そこには川向こうの家の柱に巨大な尾を巻きつけて濁流から身を逃れようと必死にもがいている大蛇の姿があった。それを見ると恐ろしさを越えて、この巨大な蛇が激しい濁流と戦う痛ましい姿に心の痛みを感ぜずにはいられなかった。男は村へ駆け戻った。深い森を越えてどうどうと響く濁流の音とともに大蛇の最後のうめきがいつまでも耳について離れなかった。大蛇がそれからどうしたかは誰も知る者がない。大蛇が柱に巻き付いたという家には近頃まで大蛇の鱗を求めにくる人があったということだが、鱗は無いと言う。
・「魚切り渕の大蛇」(未来社『石見の民話』)
昔、村里を遠く離れた山の中にぽつんと一軒の家があった。寂しいところではあったが、山越えをする人は必ずこの家へ立ち寄って、お茶を飲ませてもらったり休ませてもらったりしていた。その家にはこうした人たちの世話をする親切な女中がいた。ある夕方、他の人と同じ様に茶を所望して一人の男が立ち寄った。女中がお茶を持っていくと、ゆっくりと飲み干し、しばらく休んでから立ち上がった。そして日もすっかり落ちて暗くなりかけた山道を灯りももたずに帰っていった。後には草履の音だけがかすかに聞こえた。次の日、昨日と同じ様な時間に男はまたやってきた。そしてお茶を所望してゆっくり飲むと、何を話すでもなくしばらく休んで夕闇の中へ消えていった。それから男は毎日の様に夕方になるとやって来てお茶を飲んでは帰っていった。何日か経って女中はあの男はいったいどこに住んでいるのだろうと思った。毎日来るところを見るとそんなに遠くでもないようだし、毎日お茶を飲みに来るというのもおかしい。そういえば暗い山道を灯りも持たずに帰ってゆくのも変だ。そこである日、いつもの様にやって来た男に思い切って毎日来るが、一体どこに住んでいるのか尋ねた。男はにやにや笑いながら、この道をずっといった所だと言って家の後ろにある小さな道の方へ目をやりながら答えた。女中はここの道をずっとと言えば、魚切りという渕の辺りという事になるが、そこには昔から大蛇が棲んでいると言われているから近づく人もない。まして家などあるはずはないのだがと不審に思った。気にかかるので何とかしてこれを知りたいと思った。色々考えた末に男が帰るときにそっと着物の裾に糸のついた針をつけておき、後から糸を頼りに辿っていこうと思いついた。何も知らない男はその日もやってくると、お茶を飲んで夕闇の中を帰っていった。女中はそっと着物の裾に針を刺した。あくる朝、女中は糸を頼りにどんどん山道を登っていった。しばらく歩いたところ遙かにどうどうという水音が聞こえてきた。あれは魚切りの渕だと思いながら糸を辿っていくと糸は渕の中へ入っていった。男はこの渕に棲む大蛇であったという。
・「河野十内」(未来社『石見の民話』)
昔、鍋石に河野十内という力の強い人がいた。これは天狗に力を授かったものと言うことで、向う倍力と言ってどんな力の強い人が来ても十内はその倍の力がでるのだった。あるとき大阪から三人の力持ちが十内と力比べをしようと言ってやって来た。ちょうど十内は留守で奥さんが一人留守番をしていた。力持ちは十内が留守だということを聞くと、玄関に腰を下ろして休んでいた。すると、そこに曲がった大きな鉄の棒が立てかけてあった。奥さんは旦那さまと言ったら杖を曲げておいてと独り言を言いながら手でつるつるとしごいた。すると曲がっていた棒は何のこともなくまっすぐになった。三人の力持ちはそれを見て、おかみさんさえあの通りなら、主人はとても我々の及ぶところではないと言ってこそこそと逃げ帰った。十内は「もとよのみや」という家に住んでいたが、家を普請する時、奥さんは青竹をすこいで縄のようにして、竹の節がめきめきと割れるのを差し出すと、十内はそれで屋中竹を縛りつけたと言うことで、近年まで竹で縛った屋中竹が残っていたという。昔、芸州の八幡では毎年広島へ萱を年貢の代わりに納めていた。十内は、お前たちは萱を丈夫な輪をもって荷造りしておけ、自分が一荷に負うていってやると言った。皆は十内のいう通りにしたが、中に一人、とても手に合うまいと思って、そのおいこ縄(背負う縄)を自分の家の柱に引っかけておいた。十内は道中の村々に何月何日河野十内が萱を負うて出るから用心しておれとふれをしておいた。その日になると、十内は八幡中で納める萱を一まとめにして、ごっそごっそ負うて出たので、道ばたの木や小屋などは皆箒で撫でたように倒れ、おいこ縄を家の柱に結わいつけておいた家は家ごとどんどん引きずって広島の町へ出たので、広島の町も大変傷んだ。それから広島へ萱を出すことは止めになった。漁山の浅間さんの足ガ鞍にはうわばみがいた。ある日十内はうわばみ退治に出かけた。すると大きな木が倒れていたので、それに腰をかけて休んでいた。十内は鉄砲を足先にかけていたが、小さな蛇が指先を舐めていると思っていたところ、いつの間にか膝まで呑んでいた。そこで十内はドカンと一発鉄砲を口の中へ撃ち込んだので、うわばみは一発で死んでしまった。うわばみの死骸の下には白銀の花が咲くといって、下の土まで人が金を出して買って帰ったという。あるとき百姓が「とりのす」で堆肥を一荷ずつ負うていくのを見て十内は自分が蹴散らしてやろうといって足で田毎に蹴散らしてやった。ところが十内の力はその時から無くなってしまった。堆肥は不浄の物だから、それを天狗が嫌って力を取り上げてしまったのだった。
・「そばの登城」(未来社『石見の民話』)
昔、津和野の城主亀井隠岐守の家中に豊田平内という百二十石取りの侍がいた。平内は蕎麦が大変好きだった。ある年の夏、用事があって供を一人連れて隣の長門国徳佐へ行った。津和野の町を出はずれると野坂の峠へ差しかかった。この峠は約一里半、片側は木がいっぱい茂り、片側は切り立った絶壁である。ちょうど夏の暑い日中のことで、しばらく登ると一人の樵夫がふんどし一つになって道ばたの木陰で昼寝をしていた。すると、さっと生臭い風が吹いて上から大きな蛇が下りてきて樵夫を頭から呑みはじめた。平内も供のものもびっくりした。あまり恐ろしいので身体がすくんで樵夫を助けることも逃げることもできない。ただ、物陰から様子を見ているばかりであった。その内に蛇は樵夫をすっかり呑み込んでしまった。大きな蛇ではあったが、なにしろ一人呑んだので腹がはち切れるばかりに膨らみ、いかにも苦しそうであった。しばらくすると蛇はするすると谷底へ下りていった。平内もようやく元気を出して、その跡をつけていった。蛇は谷底へ下りると水のほとりに茂っている青草を喰いはじめた。すると腹はだんだん小さくなって元のようになり、蛇はするすると山の中へ入って見えなくなった。平内はこれを見て、蛇の食べた草は腹がいっぱいになったときこれを治す神薬であろうと思って、そこらにある蛇が食べた草をとって、腰の印籠に入れた。それから峠を登り、徳佐へ行って用事を済ませて帰った。その年の大晦日になった。平内の家でも年越しの蕎麦を祝った。平内は大好きなので、歩くこともできないほど食べた。一夜明けると元旦である。平内はお正月のお礼にお城へ登らなければならないので麻上下をつけて御殿へ行ったが、まだ早いので誰も来ていない。そこで控えの間で待っていた。ところが昨晩の蕎麦が腹いっぱいで苦しくてたまらない。ふと思い出したのは印籠に入れておいた、野坂の峠の薬草のことであった。さっそく腰の印籠からつまみ出して一口頬張った。しばらくたって第二番目に登場した椋五郎左衛門が控えの間へ入って見ると、一人の侍が座っている。挨拶をしたがいっこうに返事がない。不思議に思ってよく見ると、九枚笹の定紋の麻上下をつけて、大小を差してきちんと座っているのは人間ではなくて蕎麦であった。大勢集まってよく調べてみると、神薬の効き目が強くて身体が溶け、蕎麦だけが残ったのだった。
・「野の池」(未来社『石見の民話』)
須川谷は匹見川のほとりにある、たった七軒ほどの村であった。後ろは切り立った険しい山で、この上に野の池という大きな池があった。川向こうの舟つけの喜左衛門という男が猟に行って、この池のほとりへ来ると、お婆さんが洗い物をしていた。喜左衛門はこんな人里はなれた山の中にお婆さんがいるのはおかしいので、きっと化物に違いない、撃ってやろうと思った。ところが持っている玉は普通の猟に使う玉なので、家へ帰って鉄の二重玉を込めてきた。喜左衛門が池のほとりへ来てみると、お婆さんはいなくなって、向こうから大きな蛇が箕の様な口を開けて池の上を波立たせながらやってきた。喜左衛門はその口めがけて鉄砲を一発撃ち込むと、家へ帰ってはんどうに一杯水を飲んだが、すぐ死んでしまった。蛇はもがき苦しんで池の中をのたうちまわり、とうとう池の縁を破って下の谷底へずり落ちて死んだが、誰も知らなかった。それから何年か経った後のことである。須川谷の川向こうの家へ毎年のように広島の方から来て宿を借りる反物屋がいた。あるとき反物屋がその家の子供が白い石の様なものを持って遊んでいるのでよく見ると、大きな蛇の骨だった。反物屋はびっくりして、これはどこで拾ったかと尋ねると、向こうの谷へ行けば幾らでもあると子供は言う。そこで向こうの谷へ行ってみると沢山ごろごろと転がっていた。反物屋は大喜びでそれを皆拾い、反物はその家へ預けて帰った。蛇の骨は薬になり、とてもいい値で売れるので反物屋は大儲けをした。そこの家では何時まで経っても反物屋が来ないので、預けていった反物を一反出し二反出しとうとう皆使ってしまった。ところがそこへひょっこり反物屋がやってきた。反物屋は思いがけない大儲けをしたので、この家へ礼を言ったり、蛇の骨の残りでもあれば拾って帰ろうと思ったのである。しかしその家ではびっくりした。あんまり来ないので、置いていった反物をきれいに使ってしまったところに来たのだから、これはきっと反物を取りに来たのに違いない、大変なことになったと思った。そして反物屋を前の池へ突っ込んで殺してしまった。それからこの池はいつも血の様に赤く濁っていて、その家では良くないことが絶えないということである。蛇がずり落ちて死んだ谷は蛇落谷と呼ばれている。野の池は今でも雨の降った後などには水がたまって、葦が茂っている。
◆コーディングルール
※コーディングルールのキーワードは重要と判断したものを人力でピックアップしている。そのため、恣意性を伴う分析となる。
※活用形でなく基本形で入力する。
※[前処理]→[語の抽出結果を確認]でキーワードがどのように分節されているか検索すると結果の一覧[語の抽出結果]が表示される。
※[Result]から確認したい行をクリックして選択、画面下の[詳細表示]ボタンをクリックするとサブ画面が表示され、活用形や基本形が確認できる。
※昔話では「否定/肯定」「肯定/否定」と属性が変化することが多いと考え、否定詞「ない」「まい」「ぬ」「ん」、また禁止を意味する「な」を共通のコードとして設定している。
※「できる」「やる」「られる」「せる」といった動詞も共通のコードとして追加してみた。
※[関連語検索]で否定詞の共起語の一覧を表示させたところ、日本の昔話のように掌編レベルのボリュームだと、物語の動因となる箇所に関する語句が上位に表示される傾向が強いのではないか……といった印象があり、検証作業中である。
※無償版では強制抽出語の指定が機能制限で事実上使用できないため以下のような手法をとっている。
*都賀
'都賀'
*備前守
'備前守'
*千代坊
'千代坊'
*犬伏山
'犬伏山'
*大蛇
大蛇 or 蛇 or 'うわばみ'
*大小
'大小'
*長見川
'長見川'
*農具
鍬 or 鎌 or 竹槍
*尾
尾 or 尻尾
*山超え
'山超え'
*茶
茶 or お茶
*食べる
食べる or 食う or 呑む
*鍋石
'鍋石'
*漁山
'漁山'
*平内
'平内'
*樵夫
'樵夫'
*薬
薬 or 薬草
*須川谷
'須川谷'
*喜左衛門
'喜左衛門'
*谷底
'谷底' or 谷
*反物屋
'反物屋'
*雨
大雨 or 雨
*ない
ない
*ぬ
ぬ
*ん
ん
*るな
'るな'
*るまい
'るまい'
*できる
できる
*やる
やる
*られる
られる
*せる
せる
*小姓
小姓
*妬む
妬む
*企み
企み
*老人
老人
*夫婦
夫婦
*雄
雄
*雌
雌
*斬る
斬る
*毒
毒
*耳
耳
*城
城
*坊さん
坊さん
*渕
渕
*子供
子供
*親
親
*悲鳴
悲鳴
*村人
村人
*弓
弓
*矢
矢
*濁流
濁流
*男
男
*柱
柱
*巻きつける
巻きつける
*鱗
鱗
*女中
女中
*毎日
毎日
*裾
裾
*針
針
*糸
糸
*十内
十内
*力
力
*強い
強い
*天狗
天狗
*授かる
授かる
*退治
退治
*撃つ
撃つ
*死ぬ
死ぬ
*不浄
不浄
*無くなる
無くなる
*津和野
津和野
*侍
侍
*蕎麦
蕎麦
*峠
峠
*青草
青草
*腹
腹
*溶ける
溶ける
*池
池
*猟
猟
*骨
骨
*儲ける
儲ける
*反物
反物
*殺す
殺す
*血
血
*良い
良い
◆共起ネットワーク
・[ツール]→[コーディング]→[共起ネットワーク]でオプション画面が表示される。
・[コーディング単位]を[H5]に設定する。
※[描画する共起関係(edge)の選択]で「係数」を「0.2」から「0.3」に修正する。
※[強い共起関係ほど濃い線に]にチェックを入れる。
Jaccard係数が0.3以上はかなり強い共起関係にあることを示しているが、分析対象となる元データの文字数が少ないため係数が高めに出てしまう傾向にあるため、こうしている。
※Jaccard係数は共起関係(※ある言葉に続いて出てくる関係)の強さを表し 0≦係数≦1 の範囲の値をとる。
【Jaccard係数】
・0.1 →関連あり
・0.2 →強い関連あり
・0.3以上 →とても強い関連あり
※ただし、あくまで目安であって絶対ではない。
ざっと確認したところ、共通するキーワードが中央のサブグラフ(バブルが島状に集まった一塊)に表示され、類話毎に異なるキーワードが上下のサブグラフに表示される形となっている。
※なお、各バブル間の距離や配置に意味はない。
◆対応分析
・[ツール]→[コーディング]→[対応分析]でオプション画面が表示される。
・[コーディング単位]を[H5]に設定する。
※[外部変数]は[タイトル]のまま続行。
※[差異が顕著なコードを分析に使用]で上位「40」とした。また[バブルプロット]にチェックを入れている。これらは文字の重なりを極力避けるためである。
※文字が重なって読みづらい場合、オプション画面の[コード選択]で不要なコードのチェックを外してもよい。
x、y軸上の原点(0.0)から点線が伸び交差した箇所が原点となる。原点から離れるほど特徴的なキーワードだと分析される。
原点直下には「ない」といったキーワードがプロットされている。離れた位置にプロットされているのは「犬伏山の大蛇」では「妬む」「千代坊」「斬る」、「河野十内」では「漁山」「鍋石」、「蛇渕」では「悲鳴」「長見川」「尾」といった辺りである。
◆解釈
蛇が登場するお話である。人を襲う、あるいは獲物として狙うものが多いが、「魚切り渕の大蛇」では人に化けた大蛇が茶を好む描写となっている。また、三輪山神話型のお話ともなっている。
◆階層的クラスター分析
・[ツール]→[コーディング]→[階層的クラスター分析]でオプション画面が表示される。
・[コーディング単位]を[文]に変更、実行するとデンドログラム(樹状図)で可視化される。
※キーワード指定しても可。
概ねストーリー展開に沿った形でクラスター化されている。
◆クロス集計
・[コーディング単位]を[文]に変更、[タイトル]で[集計]する。
クロス集計をかけたところ、「食べる」「子供」「男」といったキーワードでカイ(χ)2乗値で相関関係を示す結果(※マーク)が得られた。
マップとして描画したところ、「千代坊」「犬伏山」「力」「強い」「反物」「殺す」といったキーワードの残差が大きく(濃く)表示される結果となった。バブルとしては「千代坊」「大蛇」「反物」が大きく描画された。
◆KWICコンコーダンス
現状ではテキストマイニングのツールに文脈を読む性能はないため実際に該当箇所を読んで人力で判断する他ない。KWICコンコーダンスでキーワード指定すれば指定したキーワードがどのような文脈で用いられているか一覧で抽出される。
◆関連語検索
・[集計単位]を[文]に変更、[集計]する。
・[Search Entry:]の一覧からキーワードを選択してダブルクリックすると[Result]に指定したキーワードの品詞や共起関係が表示される。
※[Result:]から行指定してダブルクリックするとKWICコンコーダンスに遷移する。
※[Result:]の一覧から範囲指定して[コピー]したものを表計算ソフトやテキストファイルにペーストすることも可能である。
[#直接入力]を指定して「裾」といったキーワードで検索すると関連語が一覧で表示される。
◆属性の転倒
・「ない」の結果上位一覧
| N | 抽出語 | 品詞 | 全体 | 共起 | Jaccard |
| 1 | 来る | 動詞 | 9 (0.061) | 5 (0.217) | 0.1852 |
| 2 | 思う | 動詞 | 11 (0.074) | 4 (0.174) | 0.1333 |
| 3 | 知る | 動詞 | 5 (0.034) | 3 (0.130) | 0.12 |
| 4 | 大蛇 | 名詞 | 15 (0.101) | 4 (0.174) | 0.1176 |
| 5 | お茶 | 名詞 | 6 (0.041) | 3 (0.130) | 0.1154 |
| 6 | 飲む | 動詞 | 6 (0.041) | 3 (0.130) | 0.1154 |
| 7 | 山 | 名詞C | 7 (0.047) | 3 (0.130) | 0.1111 |
| 8 | 池 | 名詞C | 7 (0.047) | 3 (0.130) | 0.1111 |
| 9 | 蛇 | 名詞C | 18 (0.122) | 4 (0.174) | 0.1081 |
| 10 | 見る | 動詞 | 11 (0.074) | 3 (0.130) | 0.0968 |
・「ぬ」の結果上位一覧
| N | 抽出語 | 品詞 | 全体 | 共起 | Jaccard |
| 1 | 灯る | 動詞 | 2 (0.014) | 2 (0.400) | 0.4 |
| 2 | 暗い | 形容詞 | 4 (0.027) | 2 (0.400) | 0.2857 |
| 3 | 山道 | 名詞 | 4 (0.027) | 2 (0.400) | 0.2857 |
| 4 | 稲妻 | 名詞 | 1 (0.007) | 1 (0.200) | 0.2 |
| 5 | 感ずる | 動詞 | 1 (0.007) | 1 (0.200) | 0.2 |
| 6 | 起こる | 動詞 | 1 (0.007) | 1 (0.200) | 0.2 |
| 7 | 激しい | 形容詞 | 1 (0.007) | 1 (0.200) | 0.2 |
| 8 | 光る | 動詞 | 1 (0.007) | 1 (0.200) | 0.2 |
| 9 | 黒雲 | 名詞 | 1 (0.007) | 1 (0.200) | 0.2 |
| 10 | 止める | 動詞 | 1 (0.007) | 1 (0.200) | 0.2 |
蛇を退治したその後……といった粗筋となっている。
短いお話の中で属性の転倒を多用するのが昔話の特徴の一つと考えられる。
ここで「/」(スラッシュ)を「転倒」を意味する記号として用いる。スラッシュは様々な場面で用いられていて文脈依存的な記号という欠点もあるが、視覚的にはイメージしやすいと判断した。
・[千代坊|企み:退治/しびれる]
・[老人|千代坊:引き留める/救出する]
・[渕の蛇|大雨:いる/行方不明]
・[女中|糸:男/大蛇]
・[十内|うわばみ:呑まれかける/撃つ]
・[平内|薬:体/蕎麦]
・[反物屋|骨:儲け/殺害]
こういった風にお話を転がしていると分析できる。千代坊は小姓たちの企みによって大蛇退治に差し向けられるが「危機/退治」と転倒させる。毒によってしびれて動けなくなるものの救出され「危機/脱出」とも転倒する。
※なお、図式化には分析対象のテキストに含まれない語句も用いているので要注意。
※関連語検索、強制抽出語を設定しないと狙い通りに処理されないケースが見られる。
◆類似度行列
・[コーディング単位]を[文]に変更して[集計]。Jaccard係数がマトリクス形式で確認できる。
・ある列を選択して画面右下の[コピー(選択列)]をクリックすると、当該のキーワードに関するJaccard係数がコピーされるので、それを表計算ソフトにペーストするといった利用が可能となる。
※当ブログでは[コーディング単位]が[段落][H5]の場合、Jacccard係数が1.0~0.5といった結果がほとんどで、意味のない結果となった。
◆多次元尺度構成法
・[ツール]→[コーディング]→[多次元尺度構成法]でオプション画面が表示される。
・[コーディング単位]を[H5]から[文]に変更。
・[クリア]ボタンをクリックしてコード選択を一旦リセット、共起関係を確認したいキーワードを指定。
・次元を「2」から「3」に変更して実行、三次元のマップとした。
千代坊が大蛇を退治するくだりに関するキーワードを指定したところ、「毒」「妬む」が離れた位置にプロットされた。
※選択するキーワードによって相対的な位置関係は変わり得る。
◆自己組織化マップ
・[ツール]→[コーディング]→[自己組織化マップ]でオプション画面が表示される。
・[コーディング単位]は[文]で固定。
記述内容が視覚的に整理され、類似性の高い内容が近くに配置される。概ねストーリーに沿った形で各クラスターが表示される。
※クラスター化の計算を繰り返すため処理に時間がかかるので要注意。
※クラスターの配置、距離に意味はない。
◆トピックの推定
・[ツール]→[文書]→[トピックモデル]→[トピックの推定]を選択。
・[集計単位]は[文]で固定。
・[OK]ボタンをクリックすると、[トピックの推定結果]画面が表示される。
・各トピックで高い確率で出現する語句がリストアップされる。
・[#1]といった欄をクリックすると、文書検索画面が表示される。
◆ベイズ学習による分類
・[ツール]→[文書]→[ベイズ学習による分類]→[外部変数から学習]を選択。
・[分類の単位]を[文]に変更。
・[学習する外部変数]は「利用不可」。
・[OK]ボタンをクリックすると、ファイルの保存画面が表示されるので、任意のファイル名を記述して保存する。
・[ツール]→[文書]→[ベイズ学習による分類]→[学習結果ファイルの内容を確認]を選択。ファイル選択画面が開くので、先ほど保存したファイルを指定して開く。すると[学習結果ファイル]画面が開くので内容の確認を行う。
※[学習結果を用いた自動分類]については割愛する。
※[トピックの推定]と[ベイズ学習による分類]は固有名詞などを強制抽出語としてあらかじめ指定しておかないと正確に分析されないケースが生じる。正式に利用したい際は有償版の購入をお勧めする。当ブログのはあくまでテストケースとしてのものである。
※[トピックの推定]と[ベイズ学習による分類]はコーディング・ルールに依らない分析手法となるが、筆者の能力的に追及はしない。
◆参考文献
・『日本の民話 34 石見篇』(大庭良美/編, 未来社, 1978)pp.93-96, 262-264, 265-267, 297-299, 350-351, 370-371.
・『動かして学ぶ!はじめてのテキストマイニング』(樋口耕一, ナカニシヤ出版, 2022)
・『社会調査のための計量テキスト分析 【第2版】 内容分析の継承と発展を目指して』(樋口耕一, ナカニシヤ出版, 2020)
| 固定リンク
「昔話」カテゴリの記事
- 昔話の計量テキスト分析――嫁と姑(2026.06.06)
- 昔話の計量テキスト分析――木こり(2026.06.05)
- 昔話の計量テキスト分析――馬鹿息子(2026.06.04)
- 昔話の計量テキスト分析――馬鹿婿(2026.06.02)
- 昔話の計量テキスト分析――古猫(2026.06.01)

















