<?xml version="1.0" encoding="utf-8"?>

<rdf:RDF
  xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
  xmlns:dc="http://purl.org/dc/elements/1.1/"
  xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
  xmlns:content="http://purl.org/rss/1.0/modules/content/"
  xmlns:cc="http://web.resource.org/cc/"
  xmlns="http://purl.org/rss/1.0/">

<channel rdf:about="https://woodenplane.air-nifty.com/log/">
<title>薄味</title>
<link>https://woodenplane.air-nifty.com/log/</link>
<description>本館は島根県石見地方の神話・伝説・昔話・神楽ネタ中心で。変人のワードサラダ。





</description>
<dc:language>ja-JP</dc:language>
<dc:creator></dc:creator>
<dc:date>2026-04-19T08:27:27+09:00</dc:date>


<items>
<rdf:Seq><rdf:li rdf:resource="https://woodenplane.air-nifty.com/log/2026/04/post-3cf0a9.html" />
<rdf:li rdf:resource="https://woodenplane.air-nifty.com/log/2026/04/post-e47a17.html" />
<rdf:li rdf:resource="https://woodenplane.air-nifty.com/log/2026/04/post-a77a46.html" />
<rdf:li rdf:resource="https://woodenplane.air-nifty.com/log/2026/04/post-b453ad.html" />
<rdf:li rdf:resource="https://woodenplane.air-nifty.com/log/2026/04/post-1d4160.html" />
<rdf:li rdf:resource="https://woodenplane.air-nifty.com/log/2026/04/post-623a69.html" />
<rdf:li rdf:resource="https://woodenplane.air-nifty.com/log/2026/04/post-519ff7.html" />
<rdf:li rdf:resource="https://woodenplane.air-nifty.com/log/2026/04/post-b78b83.html" />
<rdf:li rdf:resource="https://woodenplane.air-nifty.com/log/2026/04/post-f4cfef.html" />
<rdf:li rdf:resource="https://woodenplane.air-nifty.com/log/2026/04/post-ad017d.html" />
</rdf:Seq>
</items>

</channel>

<item rdf:about="https://woodenplane.air-nifty.com/log/2026/04/post-3cf0a9.html">
<title>昔話の計量テキスト分析――えんこうの手紙</title>
<link>https://woodenplane.air-nifty.com/log/2026/04/post-3cf0a9.html</link>
<description>未来社『石見の民話』より「えんこうの手紙」とその類話についてKH Coderで計量テキスト分析を実施した。</description>
<content:encoded><![CDATA[<p>◆はじめに</p>
<p>以下はKH Coder（無償版：version 3.Beta.08e）を用いた昔話の計量テキスト分析である。昔話の類話の比較にツールを利用できないか試行してみた。</p>
<p>手持ちの資料が限られるため、分析の対象となる元データの文字数が少ないものの（※本来であれば5000字以上は欲しい）、分析自体は正常に処理されていると判断した。</p>
<p>KH Coderの操作に慣れる目的も兼ねて行った作業で、コーディングルールの記述の事例集、あるいは速習用のチュートリアルとしてでも読んで頂ければ……といったところである。</p>
<p>なお、KH Coderでよく用いられるのは共起ネットワークと対応分析とのことで、それ以外はおまけパートと思って頂いて構わない。操作に習熟するにはコーディングルールの記述に慣れるのが第一である。</p>
<p>◆ファイル</p>
<p>各ファイルをダウンロードしてKH Coderに読み込ませれば同様の分析が再現可能である。</p>
<p><a href="https://woodenplane.air-nifty.com/log/files/ca_pb_041_enkonotegami.xlsx" target="_blank" rel="noopener">ダウンロード - ca_pb_041_enkonotegami.xlsx</a></p>
<p><a href="https://woodenplane.air-nifty.com/log/files/ca_pb_041_codingrules.txt" target="_blank" rel="noopener">ダウンロード - ca_pb_041_codingrules.txt</a></p>
<p><a href="https://woodenplane.air-nifty.com/log/files/kh_coder_startingedition_sagyotejunsho.txt" target="_blank" rel="noopener">ダウンロード - kh_coder_startingedition_sagyotejunsho.txt</a> （※作業手順書）</p>
<p>※「H5」とはHTMLでいうところのヘッダー（見出し）・レベル5で本文に相当すると考えればよい。<br />※[コーディング単位]は「文／段落／H5」から選べるが、状況に応じて適切と思われるものを選択する必要がある。処理が上手くいかないと感じた場合、コーディング単位を切り替えると上手く処理されるケースがままある。</p>
<p>※公式マニュアルでは「集計単位」という用語が使われている。共起関係について、</p>
<p>・「文」では一文単位での分析<br />・「段落」では段落単位の分析<br />・「H5」では表計算ソフトのセル単位とされ、改行を含めた一セルの中身全体が分析単位となる</p>
<p>※レファレンスでも索引で「コーディング単位」の項目は設けられていない。操作性に関わる重要項目であるものの、その仕様について不明瞭な感はある。<br />※当ブログの場合、表計算ソフトのフォーマットで読み込ませているからH5固定でいいだろうと思い込んでいたら、さにあらずだった。</p>
<p>◆あらすじ</p>
<p>・「えんこうの手紙」（未来社『石見の民話』）<br />明治の中頃、大田市の鳥居村に喜三郎という魚商人がいた。ある日出雲の国との境の邑智郡の奥へ行って、帰りに小原村の江川のほとりを通ると、手ぬぐいを深く被った女がなれなれしく声をかけてきた。静間を通って大田へ帰るのかと訊くので、その通りと答えると、手紙を渡して、それを静間の神田の渕へ投げ込むように頼まれた。魚商人は手紙を受け取った。魚商人は川合の町まで帰ると、岩谷屋という店で酒を一杯飲んだ。そして主人に先ほどのことを話すと、静間川の神田の渕はえんこう（河童）の住処だと言って、その手紙を見せろとなった。そこで手紙を開くと、人間の文字ではなくみみずののたくった痕のようなものが書いてあった。これは江川のえんこうが化けたもので、魚商人をとるようにと神田の渕のえんこうに合図したのに違いないとなった。震え上がった魚商人は店主に相談して手紙を焼いてしまった。魚商人は川合から道をかえて長久を通って家へ帰った。それからは用事があっても静間川の方へは決して行かなかった。</p>
<p><br />・「カッパの手紙」（日本標準『島根のむかし話』）<br />とんとん昔、ある男が西郷の町へ用事があって川端を歩いていた。そうしたら、道端に婆さんが立っていた。婆さんはその男に、まことに済まないが、八郎橋の所に自分のような婆さんが立っているから、この手紙を渡してくれと頼んだ。男は承知して受け取った。西郷の町で用事が済んで、もう一軒寄り道した。そうしたら、そこの家の者が喜んで、これはよく来た。久しぶりだ。上がりなさい。帰り道は日が暮れてしまう。泊まって明日帰りなさいと引き留めた。いや、八郎橋の所に婆さんがいるから、それにこの手紙を渡さないといけないと言って断ったところ、それはおかしい。あの八郎橋の方には家がない。まてよ、その手紙を見せなさいと言った。手紙の裏表を見ると何も書いてない。中を開けてみると、これも何もない。ははあ、やはりそうか。この手紙はこうすれば出ると言って水の中に浸けた。そうしたら、ここではまだ日があるから獲れない。そこで獲れ。そこで獲れなければ上に渡せと書いてあった。ほら、この通りだ。これは危ないところだった。お前はカッパに命を獲られるところだった。手紙を渡したのは年寄りカッパに違いない。まだ日が高いものだから、お前を狙えなかった。だから八郎橋のカッパにそこで獲れと手紙にしたものだ。まあ、今夜はここでゆっくりして泊まっていきなさいと言った。男はびっくりした。それで、その晩は泊まってあくる日帰った。</p>
<p><br />◆コーディングルール</p>
<p>※コーディングルールのキーワードは重要と判断したものを人力でピックアップしている。そのため、恣意性を伴う分析となる。</p>
<p>※活用形でなく基本形で入力する。</p>
<p>※[前処理]→[語の抽出結果を確認]でキーワードがどのように分節されているか検索すると結果の一覧[語の抽出結果]が表示される。</p>
<p>※[Result]から確認したい行をクリックして選択、画面下の[詳細表示]ボタンをクリックするとサブ画面が表示され、活用形や基本形が確認できる。</p>
<p>※昔話では「否定／肯定」「肯定／否定」と属性が変化することが多いと考え、否定詞「ない」「まい」「ぬ」「ん」、また禁止を意味する「な」を共通のコードとして設定している。</p>
<p>※[関連語検索]で否定詞の共起語の一覧を表示させたところ、日本の昔話のように掌編レベルのボリュームだと、物語の動因となる箇所に関する語句が上位に表示される傾向が強いのではないか……といった印象があり、検証作業中である。</p>
<p>※無償版では強制抽出語の指定が機能制限で事実上使用できないため以下のような手法をとっている。</p>
<p><br />＊鳥居村<br />'鳥居村'<br />＊魚商人<br />'魚商人'<br />＊帰る<br />帰る or 帰り<br />＊ほとり<br />ほとり or 川端<br />＊川合<br />'川合'<br />＊主人<br />主人 or 店主<br />＊開く<br />開く or 見せる<br />＊えんこう<br />'えんこう' or カッパ<br />＊静間川<br />'静間川'<br />＊獲る<br />獲る or とる<br />＊婆さん<br />婆さん or 年寄り<br />＊八郎橋<br />'八郎橋'</p>
<p>＊ない<br />ない<br />＊ぬ<br />ぬ<br />＊ん<br />ん<br />＊るな<br />'るな'<br />＊るまい<br />'るまい'</p>
<p>＊江川<br />江川<br />＊女<br />女<br />＊手ぬぐい<br />手ぬぐい<br />＊静間<br />静間<br />＊神田<br />神田<br />＊渕<br />渕<br />＊手紙<br />手紙<br />＊店<br />店<br />＊酒<br />酒<br />＊みみず<br />みみず<br />＊痕<br />痕<br />＊化ける<br />化ける<br />＊合図<br />合図<br />＊焼く<br />焼く<br />＊道<br />道<br />＊かえる<br />かえる<br />＊用事<br />用事<br />＊近づく<br />近づく<br />＊男<br />男<br />＊西郷<br />西郷<br />＊寄り道<br />寄り道<br />＊家<br />家<br />＊書く<br />書く<br />＊水<br />水<br />＊浸ける<br />浸ける<br />＊命<br />命<br />＊狙う<br />狙う<br />＊泊まる<br />泊まる<br />＊あくる日<br />あくる日</p>
<p><br />◆共起ネットワーク</p>
<p>・[コーディング単位]を[H5]に設定する。</p>
<p>※[描画する共起関係（edge）の選択]で「係数」を「0.2」から「0.3」に修正する。<br />※[強い共起関係ほど濃い線に]にチェックを入れる。</p>
<p>Jaccard係数が0.3以上はかなり強い共起関係にあることを示しているが、分析対象となる元データの文字数が少ないため係数が高めに出てしまう傾向にあるため、こうしている。</p>
<p>※Jaccard係数は共起関係（※ある言葉に続いて出てくる関係）の強さを表し 0≦係数≦1 の範囲の値をとる。</p>
<p>【Jaccard係数】<br />・0.1 →関連あり<br />・0.2 →強い関連あり<br />・0.3以上 →とても強い関連あり<br />※ただし、あくまで目安であって絶対ではない。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_041_con_enkonotegami.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="共起ネットワーク" src="https://woodenplane.air-nifty.com/log/images/ca_pb_041_con_enkonotegami.png" alt="共起ネットワーク" width="480" height="360" border="0" /></a></p>
<p>ざっと確認したところ、共通するキーワードが中央のサブグラフ（バブルが島状に集まった一塊）に表示され、類話によって異なるキーワードがそれぞれのサブグラフとして周辺に表示される形となっている。</p>
<p>※なお、各バブル間の距離や配置に意味はない。</p>
<p>◆対応分析</p>
<p>・[コーディング単位]を[H5]に設定する。</p>
<p>※[外部変数]は[タイトル]のまま続行。<br />※[差異が顕著なコードを分析に使用]で上位「40」とした。また[バブルプロット]にチェックを入れている。これらは文字の重なりを極力避けるためである。<br />※文字が重なって読みづらい場合、オプション画面の[コード選択]で不要なコードのチェックを外してもよい。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_041_ca_enkonotegami.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="対応分析" src="https://woodenplane.air-nifty.com/log/images/ca_pb_041_ca_enkonotegami.png" alt="対応分析" width="480" height="374" border="0" /></a></p>
<p>x、y軸上の原点（0.0）から点線が伸び交差した箇所が原点となる。原点から離れるほど特徴的なキーワードだと分析される。</p>
<p>原点付近には「えんこう」「手紙」「用事」といったキーワードがプロットされている。未来社版では「静間」「女」「焼く」といったキーワードが原点から離れてプロットされている。日本標準版では「婆さん」「八郎橋」「浸ける」といったキーワードが特徴的とされている。</p>
<p>◆解釈</p>
<p>舞台は異なるがほぼ同じ展開である。えんこうの手紙を見破る方法は異なっている。</p>
<p>◆階層的クラスター分析</p>
<p>・[コーディング単位]を[文]に変更、実行するとデンドログラム（樹状図）で可視化される。</p>
<p>※キーワード指定しても可。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_041_hca_enkonotegami.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="階層的クラスター分析・デンドログラム（樹状図）" src="https://woodenplane.air-nifty.com/log/images/ca_pb_041_hca_enkonotegami.png" alt="階層的クラスター分析・デンドログラム（樹状図）" width="480" height="965" border="0" /></a> <br /><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_041_hca_gs_enkonotegami.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="階層的クラスター分析・デンドログラム（樹状図）" src="https://woodenplane.air-nifty.com/log/images/ca_pb_041_hca_gs_enkonotegami.png" alt="階層的クラスター分析・デンドログラム（樹状図）" width="480" height="965" border="0" /></a></p>
<p>概ねストーリーに沿った内容でクラスター化されている。</p>
<p>※当ブログの場合、[コーディング単位]が[段落][H5]だと、コードを全て選択するとエラーが返される結果となった。</p>
<p>◆クロス集計</p>
<p>・[コーディング単位]を[文]に変更、[集計]する。</p>
<p>※「タイトル」で集計をかけた。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_041_crt_enkonotegami.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="クロス集計" src="https://woodenplane.air-nifty.com/log/images/ca_pb_041_crt_enkonotegami.png" alt="クロス集計" width="480" height="345" border="0" /></a></p>
<p>クロス集計をかけたところ、「魚商人」「神田」「渕」といったキーワードでカイ（χ）2乗値で相関関係を示す結果（※マーク）が得られた。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_041_crt_bm_enkonotegami.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="クロス集計・バブルマップ" src="https://woodenplane.air-nifty.com/log/images/ca_pb_041_crt_bm_enkonotegami.png" alt="クロス集計・バブルマップ" width="480" height="679" border="0" /></a></p>
<p>マップとして描画したところ、「魚商人」「帰る」といったキーワードの残差が大きく（濃く）表示される結果となった。バブルとしては「魚商人」「手紙」が大きく描画された。</p>
<p>◆KWICコンコーダンス</p>
<p>現状ではテキストマイニングのツールに文脈を読む性能はないため実際に該当箇所を読んで人力で判断する他ない。KWICコンコーダンスでキーワード指定すれば指定したキーワードがどのような文脈で用いられているか一覧で抽出される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_041_kwic_enkonotegami.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="KWICコンコーダンス" src="https://woodenplane.air-nifty.com/log/images/ca_pb_041_kwic_enkonotegami.png" alt="KWICコンコーダンス" width="480" height="274" border="0" /></a> <br /><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_041_kwic_doc_enkonotegami.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="KWICコンコーダンス・文書表示" src="https://woodenplane.air-nifty.com/log/images/ca_pb_041_kwic_doc_enkonotegami.png" alt="KWICコンコーダンス・文書表示" width="480" height="509" border="0" /></a></p>
<p>◆関連語検索</p>
<p>・[集計単位]を[文]に変更、[集計]する。<br />・[Search Entry:]の一覧からキーワードを選択してダブルクリックすると[Result]に指定したキーワードの品詞や共起関係が表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_041_rws_enkonotegami.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="関連語検索" src="https://woodenplane.air-nifty.com/log/images/ca_pb_041_rws_enkonotegami.png" alt="関連語検索" width="480" height="452" border="0" /></a></p>
<p>※[Result:]から行指定してダブルクリックするとKWICコンコーダンスに遷移する。<br />※[Result:]の一覧から範囲指定して[コピー]したものを表計算ソフトやテキストファイルにペーストすることも可能である。</p>
<p>[＃直接入力]を指定して「酒」といったキーワードで検索すると関連語が一覧で表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_041_rws_enkonotegami_02.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="関連語検索" src="https://woodenplane.air-nifty.com/log/images/ca_pb_041_rws_enkonotegami_02.png" alt="関連語検索" width="480" height="452" border="0" /></a></p>
<p>◆属性の転倒</p>
<p>・「ない」の結果上位一覧</p>
<table width="432">
<tbody>
<tr>
<td width="72">N</td>
<td width="72">抽出語</td>
<td width="72">品詞</td>
<td width="72">全体</td>
<td width="72">共起</td>
<td width="72">Jaccard</td>
</tr>
<tr>
<td>1</td>
<td>書く</td>
<td>動詞</td>
<td> 3 (0.075)</td>
<td> 3 (0.273)</td>
<td>0.2727</td>
</tr>
<tr>
<td>2</td>
<td>渡す</td>
<td>動詞</td>
<td> 5 (0.125)</td>
<td> 3 (0.273)</td>
<td>0.2308</td>
</tr>
<tr>
<td>3</td>
<td>手紙</td>
<td>名詞</td>
<td> 12 (0.300)</td>
<td> 4 (0.364)</td>
<td>0.2105</td>
</tr>
<tr>
<td>4</td>
<td>違い</td>
<td>ナイ形容</td>
<td> 2 (0.050)</td>
<td> 2 (0.182)</td>
<td>0.1818</td>
</tr>
<tr>
<td>5</td>
<td>日</td>
<td>地名</td>
<td> 3 (0.075)</td>
<td> 2 (0.182)</td>
<td>0.1667</td>
</tr>
<tr>
<td>6</td>
<td>橋</td>
<td>名詞C</td>
<td> 4 (0.100)</td>
<td> 2 (0.182)</td>
<td>0.1538</td>
</tr>
<tr>
<td>7</td>
<td>八郎</td>
<td>人名</td>
<td> 4 (0.100)</td>
<td> 2 (0.182)</td>
<td>0.1538</td>
</tr>
<tr>
<td>8</td>
<td>獲る</td>
<td>動詞</td>
<td> 5 (0.125)</td>
<td> 2 (0.182)</td>
<td>0.1429</td>
</tr>
<tr>
<td>9</td>
<td>化ける</td>
<td>動詞</td>
<td> 1 (0.025)</td>
<td> 1 (0.091)</td>
<td>0.0909</td>
</tr>
<tr>
<td>10</td>
<td>開く</td>
<td>動詞</td>
<td> 1 (0.025)</td>
<td> 1 (0.091)</td>
<td>0.0909</td>
</tr>
</tbody>
</table>
<p>見知らぬ女から手紙を預かったが、立ち寄った先の主人にそれはえんこうの手紙だと見破られる……といった粗筋となっている。</p>
<p>短いお話の中で属性の転倒を多用するのが昔話の特徴の一つと考えられる。</p>
<p>ここで「／」（スラッシュ）を「転倒」を意味する記号として用いる。スラッシュは様々な場面で用いられていて文脈依存的な記号という欠点もあるが、視覚的にはイメージしやすいと判断した。</p>
<p>・［えんこう｜手紙：依頼／合図］<br />・［商人｜手紙：預かる／焼却］<br />・［主人｜手紙：見破る／焼却］</p>
<p>こういった風にお話を転がしていると分析できる。</p>
<p>えんこうの手紙を預かった男は「危機／阻止」へと転倒される。</p>
<p>◆類似度行列</p>
<p>・[コーディング単位]を[文]に変更して[集計]。Jaccard係数がマトリクス形式で確認できる。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_041_sm_enkonotegami.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="類似度行列" src="https://woodenplane.air-nifty.com/log/images/ca_pb_041_sm_enkonotegami.png" alt="類似度行列" width="480" height="295" border="0" /></a></p>
<p>・ある列を選択して画面右下の[コピー（選択列）]をクリックすると、当該のキーワードに関するJaccard係数がコピーされるので、それを表計算ソフトにペーストするといった利用が可能となる。</p>
<p>※当ブログでは[コーディング単位]が[段落][H5]の場合、Jacccard係数が1.0～0.5といった結果がほとんどで、意味のない結果となった。</p>
<p>◆多次元尺度構成法</p>
<p>・[コーディング単位]を[文]に変更して実行。<br />・共起関係を確認したいキーワードを指定。<br />・次元を「2」から「3」に変更して実行、三次元のマップとした。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_041_mds_enkonotegami.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="多次元尺度構成法" src="https://woodenplane.air-nifty.com/log/images/ca_pb_041_mds_enkonotegami.png" alt="多次元尺度構成法" width="480" height="480" border="0" /></a></p>
<p>えんこうの手紙を預かるくだりに関連したキーワードを指定したところ、「女」が離れた位置にプロットされた。</p>
<p>※選択するキーワードによって相対的な位置関係は変わり得る。</p>
<p>※実行すると指定したキーワードの幾つかが除外されるとメッセージが表示される。テキストのボリューム不足のためか無償版の仕様によるものか判断がつかない。<br />※当ブログの事例では「文」以外、「段落」と「H5」では除外されるキーワードが増える傾向となった。</p>
<p>◆自己組織化マップ</p>
<p>[コーディング単位]を[文]に変更して実行。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_041_som_enkonotegami.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="自己組織化マップ" src="https://woodenplane.air-nifty.com/log/images/ca_pb_041_som_enkonotegami.png" alt="自己組織化マップ" width="480" height="480" border="0" /></a></p>
<p>記述内容が視覚的に整理され、類似性の高い内容が近くに配置される。概ねストーリーに沿った形で各クラスターが表示される。</p>
<p>※当ブログの事例では「文」以外、「段落」と「H5」ではエラーが返される結果となった。<br />※クラスター化の計算を繰り返すため処理に時間がかかるので要注意。<br />※クラスターの配置、距離に意味はない。</p>
<p>◆トピックの推定</p>
<p>・[ツール]→[文書]→[トピックモデル]→[トピックの推定]を選択。<br />・[集計単位]を[文]に変更。<br />・[OK]ボタンをクリックすると、[トピックの推定結果]画面が表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_041_ter_enkonotegami.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="トピックの推定" src="https://woodenplane.air-nifty.com/log/images/ca_pb_041_ter_enkonotegami.png" alt="トピックの推定" width="480" height="293" border="0" /></a></p>
<p>・各トピックで高い確率で出現する語句がリストアップされる。<br />・[＃1]といった欄をクリックすると、文書検索画面が表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_041_ter_doc_enkonotegami.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="Ca_pb_041_ter_doc_enkonotegami" src="https://woodenplane.air-nifty.com/log/images/ca_pb_041_ter_doc_enkonotegami.png" alt="Ca_pb_041_ter_doc_enkonotegami" width="480" height="360" border="0" /></a></p>
<p>◆ベイズ学習による分類</p>
<p>・[ツール]→[文書]→[ベイズ学習による分類]→[外部変数から学習]を選択。<br />・[分類の単位]を[文]に変更。<br />・[学習する外部変数]は[書名]に変更する。<br />　※「タイトル」のままでもよし。<br />・[OK]ボタンをクリックすると、ファイルの保存画面が表示されるので、任意のファイル名を記述して保存する。</p>
<p>・[ツール]→[文書]→[ベイズ学習による分類]→[学習結果ファイルの内容を確認]を選択。ファイル選択画面が開くので、先ほど保存したファイルを指定して開く。すると[学習結果ファイル]画面が開くので内容の確認を行う。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_041_bl_enkonotegami.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="ベイズ学習による分類" src="https://woodenplane.air-nifty.com/log/images/ca_pb_041_bl_enkonotegami.png" alt="ベイズ学習による分類" width="411" height="369" border="0" /></a></p>
<p>※[学習結果を用いた自動分類]については割愛する。</p>
<p>※[トピックの推定]と[ベイズ学習による分類]は固有名詞などを強制抽出語としてあらかじめ指定しておかないと正確に分析されないケースが生じる。正式に利用したい際は有償版の購入をお勧めする。当ブログのはあくまでテストケースとしてのものである。</p>
<p>※[トピックの推定]と[ベイズ学習による分類]はコーディング・ルールに依らない分析手法となるが、筆者の能力的に追及はしない。</p>
<p>◆参考文献</p>
<p>・『日本の民話 34 石見篇』（大庭良美／編, 未来社, 1978）pp.44-45.<br />・『島根のむかし話』（島根県小・中学校国語教育研究会／編著, 日本標準, 1976）pp.166-168.<br />・『動かして学ぶ！はじめてのテキストマイニング』（樋口耕一, ナカニシヤ出版, 2022）<br />・『社会調査のための計量テキスト分析　【第２版】　内容分析の継承と発展を目指して』（樋口耕一, ナカニシヤ出版, 2020）</p>]]></content:encoded>


<dc:subject><![CDATA[<!-- 11 //-->昔話]]></dc:subject>

<dc:creator>mitsuzakura</dc:creator>
<dc:date>2026-04-19T08:27:27+09:00</dc:date>
</item>
<item rdf:about="https://woodenplane.air-nifty.com/log/2026/04/post-e47a17.html">
<title>昔話の計量テキスト分析――えんこう塚</title>
<link>https://woodenplane.air-nifty.com/log/2026/04/post-e47a17.html</link>
<description>未来社『石見の民話』より「えんこう塚」とその類話についてKH Coderで計量テキスト分析を実施した。</description>
<content:encoded><![CDATA[<p>◆はじめに</p>
<p>以下はKH Coder（無償版：version 3.Beta.08e）を用いた昔話の計量テキスト分析である。昔話の類話の比較にツールを利用できないか試行してみた。</p>
<p>手持ちの資料が限られるため、分析の対象となる元データの文字数が少ないものの（※本来であれば5000字以上は欲しい）、分析自体は正常に処理されていると判断した。</p>
<p>KH Coderの操作に慣れる目的も兼ねて行った作業で、コーディングルールの記述の事例集、あるいは速習用のチュートリアルとしてでも読んで頂ければ……といったところである。</p>
<p>なお、KH Coderでよく用いられるのは共起ネットワークと対応分析とのことで、それ以外はおまけパートと思って頂いて構わない。操作に習熟するにはコーディングルールの記述に慣れるのが第一である。</p>
<p>◆ファイル</p>
<p>各ファイルをダウンロードしてKH Coderに読み込ませれば同様の分析が再現可能である。</p>
<p><a href="https://woodenplane.air-nifty.com/log/files/ca_pb_040_enkoduka.xlsx" target="_blank" rel="noopener">ダウンロード - ca_pb_040_enkoduka.xlsx</a></p>
<p><a href="https://woodenplane.air-nifty.com/log/files/ca_pb_040_codingrules.txt" target="_blank" rel="noopener">ダウンロード - ca_pb_040_codingrules.txt</a></p>
<p><a href="https://woodenplane.air-nifty.com/log/files/kh_coder_startingedition_sagyotejunsho.txt" target="_blank" rel="noopener">ダウンロード - kh_coder_startingedition_sagyotejunsho.txt</a> （※作業手順書）</p>
<p>※「H5」とはHTMLでいうところのヘッダー（見出し）・レベル5で本文に相当すると考えればよい。<br />※[コーディング単位]は「文／段落／H5」から選べるが、状況に応じて適切と思われるものを選択する必要がある。処理が上手くいかないと感じた場合、コーディング単位を切り替えると上手く処理されるケースがままある。</p>
<p>※公式マニュアルでは「集計単位」という用語が使われている。共起関係について、</p>
<p>・「文」では一文単位での分析<br />・「段落」では段落単位の分析<br />・「H5」では表計算ソフトのセル単位とされ、改行を含めた一セルの中身全体が分析単位となる</p>
<p>※レファレンスでも索引で「コーディング単位」の項目は設けられていない。操作性に関わる重要項目であるものの、その仕様について不明瞭な感はある。<br />※当ブログの場合、表計算ソフトのフォーマットで読み込ませているからH5固定でいいだろうと思い込んでいたら、さにあらずだった。</p>
<p>◆あらすじ</p>
<p>・「えんこう塚」（未来社『石見の民話』）<br />河内町を流れる浜田川のほとりにえんこう塚という石碑がひっそりと立っている。昔、ある日のこと一人の百姓が仕事を済ませて近くの川で馬の体を洗ってやった。そして日はまだ沈まないし、このまま家へ帰るには早いので、馬を川端に繋いで、もう一仕事しようと畑へ引き返していった。ところがこの様子を川の中からえんこう（河童）が見ていた。よし、今日はあの馬を川の中へ引きずり込んで捕ってやろう。えんこうは百姓がいなくなるのを待っていた。えんこうは百姓が畑へ行ったのを見澄ますと、そろりと馬に近づいて綱を杭からほどき、自分の身体に巻き付けて思い切り引っ張った。びっくりした馬は飛び上がると一目散に走り出した。慌てたえんこうは綱をほどこうとしたが、あまり強い力で引っ張られるのでほどくことができない。とうとう馬に引きずられて陸の上に放り出されてしまい、石にぶつかってやっと止まった。その騒ぎに頭の皿の水が飛び出してしまったので、えんこうは力がなくなりどうすることもできない。その時騒ぎを聞きつけた百姓が急いで川端へ引き返してみると、馬はおらずえんこうがぼんやり座っている。様子が分かった百姓は今日こそは承知しないぞと怒鳴りつけた。引っ張っていこうとすると、えんこうは涙を流して何度も何度も謝るので、それならこれからは子供を捕ったり馬にいたずらをしたりしないと約束をするなら許してやろうと言った。えんこうがこれからは絶対にそういうことはしないと言うので許してやった。そして石碑に「南無阿弥陀仏」と彫って、この字が消えない内は絶対にいたずらをしないと約束させ、河岸に立てて、この辺りでえんこうに捕られた子供たちを弔ってやった。その日から、えんこうのいたずらは全く無くなった。しかし、えんこうは早くこの字を消そうと毎日やって来て石碑の字をなでるので、反対に字はだんだん深くなったという。</p>
<p><br />・「いたずらカッパ」（日本標準『島根のむかし話』）<br />昔々、隠岐の中村に信光寺という寺があった。その寺の側に大きくて深い池があった。その池にはカッパが大層いた。カッパは池の土手を通る子供や大人に水をかけたり池に引っ張り込もうとしたりして悪戯していた。それで誰もが困っていた。カッパはその困った様子を見て大喜びした。ある日、信光寺の坊さんが土手の木に馬を繋いでいた。カッパがこれを見て、あの馬を池の中へ引っ張り込んでやろうと相談した。一番力の強いカッパが池から這い上がって繋いであって綱を解いて引っ張った。馬はびっくりして寺の方へどんどこ、どんどこ駆けて戻った。カッパは綱を放さなかったからとうとう寺まで引っ張られてしまって体中傷だらけになった。それに大事な頭の皿の水がみんな無くなってしまった。だから、もうカッパの力はないから、おんおん泣き出した。坊さんがこれを見て、お前たちがあまり悪戯するからこんなことになったのだぞ。もうしないなら許してやる。それにもうあの池にいるな。他所へ行くならどのカッパも許してやるぞと言った。カッパは懲り懲りしたから、もうしません。今夜のうちに出るから、松明を七十五本くださいと頼んだ。坊さんは頭の皿に水を一杯入れ、松明を七十五本用意してやった。その晩、坊さんが見ていたら、池の方から一本ずつ松明を灯したカッパが隣村の方へずっと続いておった。それからはこの中村にはカッパはいなくなった。</p>
<p><br />・「えんこうの話」（ハーベスト出版『夕陽を招く長者』）<br />昔、匹見の里に牛を飼っている婆さんがいた。牛は繋がれていたが、牛は水が飲みたくなり、離れて川に入った。ところが、川に入った牛はえんこうに足を引っ張られて驚いた拍子にえんこうを引きずって戻るなり肥えたて場に駆けこんだ。えんこうは牛を川の深みに引っ張り込むつもりが、陸へ引き出されて干からびてしまい困っていた。婆さんは牛が戻ってきたのを見て喜び、水をやろうと汲んできたが、牛が水を飲まないので、肥えたて場にその水を移した。すると、えんこうは水を貰ったお陰で川へ帰ることができた。それからえんこうは、今度は婆さんにお礼にと、毎日毎朝、魚を持ってきて、玄関の閂に掛けておくうようになった。毎日のことだから、そのうち閂が腐りはじめた。それで婆さんは金具のしっかりした閂に取り替えた。そうしたら、えんこうは魚を一向に持ってこなくなってしまった。えんこうは金物をとても恐れるというから、それで持ってこれなくなってしまったのだろう。</p>
<p><br />◆コーディングルール</p>
<p>※コーディングルールのキーワードは重要と判断したものを人力でピックアップしている。そのため、恣意性を伴う分析となる。</p>
<p>※活用形でなく基本形で入力する。</p>
<p>※[前処理]→[語の抽出結果を確認]でキーワードがどのように分節されているか検索すると結果の一覧[語の抽出結果]が表示される。</p>
<p>※[Result]から確認したい行をクリックして選択、画面下の[詳細表示]ボタンをクリックするとサブ画面が表示され、活用形や基本形が確認できる。</p>
<p>※昔話では「否定／肯定」「肯定／否定」と属性が変化することが多いと考え、否定詞「ない」「まい」「ぬ」「ん」、また禁止を意味する「な」を共通のコードとして設定している。</p>
<p>※[関連語検索]で否定詞の共起語の一覧を表示させたところ、日本の昔話のように掌編レベルのボリュームだと、物語の動因となる箇所に関する語句が上位に表示される傾向が強いのではないか……といった印象があり、検証作業中である。</p>
<p>※無償版では強制抽出語の指定が機能制限で事実上使用できないため以下のような手法をとっている。</p>
<p><br />＊浜田川<br />'浜田川'<br />＊石碑<br />'えんこう塚' or 石碑<br />＊川端<br />川端 or 河岸<br />＊えんこう<br />'えんこう' or カッパ<br />＊引きずり込む<br />引きずり込む or 引っ張る or 引きずる or 引っ張り込む<br />＊いたずら<br />いたずら or 悪戯<br />＊字<br />字 or '南無阿弥陀仏'<br />＊なくなる<br />なくなる or 無くなる or ( ない and なる ) or ( 無い and なる )<br />＊金物<br />金物 or 金具<br />＊帰る<br />帰る or 戻る</p>
<p>＊ない<br />ない<br />＊ぬ<br />ぬ<br />＊ん<br />ん<br />＊るな<br />'るな'<br />＊るまい<br />'るまい'</p>
<p>＊百姓<br />百姓<br />＊川<br />川<br />＊馬<br />馬<br />＊繋ぐ<br />繋ぐ<br />＊捕る<br />捕る<br />＊綱<br />綱<br />＊身体<br />身体<br />＊巻き付ける<br />巻き付ける<br />＊走り出す<br />走り出す<br />＊陸<br />陸<br />＊頭<br />頭<br />＊皿<br />皿<br />＊水<br />水<br />＊力<br />力<br />＊怒鳴る<br />怒鳴る<br />＊謝る<br />謝る<br />＊子供<br />子供<br />＊消す<br />消す<br />＊なでる<br />なでる<br />＊深い<br />深い<br />＊隠岐<br />隠岐<br />＊中村<br />中村<br />＊寺<br />寺<br />＊池<br />池<br />＊大人<br />大人<br />＊土手<br />土手<br />＊坊さん<br />坊さん<br />＊懲り懲り<br />懲り懲り<br />＊松明<br />松明<br />＊隣村<br />隣村<br />＊いる<br />いる<br />＊匹見<br />匹見<br />＊牛<br />牛<br />＊深み<br />深み<br />＊婆さん<br />婆さん<br />＊肥えたて場<br />'肥えたて場'<br />＊干からびる<br />干からびる<br />＊毎朝<br />毎朝<br />＊お礼<br />お礼<br />＊魚<br />魚<br />＊玄関<br />玄関<br />＊閂<br />閂<br />＊腐る<br />腐る<br />＊恐れる<br />恐れる<br />＊持ってくる<br />持ってくる</p>
<p><br />◆共起ネットワーク</p>
<p>・[コーディング単位]を[H5]に設定する。</p>
<p>※[描画する共起関係（edge）の選択]で「係数」を「0.2」から「0.3」に修正する。<br />※[強い共起関係ほど濃い線に]にチェックを入れる。</p>
<p>Jaccard係数が0.3以上はかなり強い共起関係にあることを示しているが、分析対象となる元データの文字数が少ないため係数が高めに出てしまう傾向にあるため、こうしている。</p>
<p>※Jaccard係数は共起関係（※ある言葉に続いて出てくる関係）の強さを表し 0≦係数≦1 の範囲の値をとる。</p>
<p>【Jaccard係数】<br />・0.1 →関連あり<br />・0.2 →強い関連あり<br />・0.3以上 →とても強い関連あり<br /><br />※ただし、あくまで目安であって絶対ではない。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_040_con_enkoduka.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="共起ネットワーク" src="https://woodenplane.air-nifty.com/log/images/ca_pb_040_con_enkoduka.png" alt="共起ネットワーク" width="480" height="360" border="0" /></a></p>
<p>ざっと確認したところ、共通するキーワードが中央のサブグラフ（バブルが島状に集まった一塊）に表示され、類話によって異なるキーワードがそれぞれのサブグラフとして周辺に表示される形となっている。</p>
<p>※なお、各バブル間の距離や配置に意味はない。</p>
<p>◆対応分析</p>
<p>・[コーディング単位]を[H5]に設定する。</p>
<p>※[外部変数]は[タイトル]のまま続行。<br />※[差異が顕著なコードを分析に使用]で上位「40」とした。また[バブルプロット]にチェックを入れている。これらは文字の重なりを極力避けるためである。<br />※文字が重なって読みづらい場合、オプション画面の[コード選択]で不要なコードのチェックを外してもよい。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_040_ca_enkoduka.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="対応分析" src="https://woodenplane.air-nifty.com/log/images/ca_pb_040_ca_enkoduka.png" alt="対応分析" width="480" height="374" border="0" /></a></p>
<p>x、y軸上の原点（0.0）から点線が伸び交差した箇所が原点となる。原点から離れるほど特徴的なキーワードだと分析される。</p>
<p>原点付近には「力」「頭」「皿」といったキーワードがプロットされている。未来社版では「石碑」「なでる」「字」といったキーワードが原点から離れてプロットされている。日本標準版では「松明」「隣村」「坊さん」といったキーワードが特徴的とされている。ハーベスト出版版では「牛」「深み」「金物」といったキーワードが特徴的とされている。</p>
<p>◆解釈</p>
<p>えんこうが頭の皿の水を失ってしまうくだりはほぼ同じである。ハーベスト出版版では、そこからえんこうの恩返し的な話となるのが違いである。</p>
<p>◆階層的クラスター分析</p>
<p>・[コーディング単位]を[文]に変更、実行するとデンドログラム（樹状図）で可視化される。</p>
<p>※キーワード指定しても可。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_040_hca_enkoduka.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="階層的クラスター分析・デンドログラム（樹状図）" src="https://woodenplane.air-nifty.com/log/images/ca_pb_040_hca_enkoduka.png" alt="階層的クラスター分析・デンドログラム（樹状図）" width="480" height="1245" border="0" /></a> <br /><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_040_hca_gs_enkoduka.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="階層的クラスター分析・デンドログラム（樹状図）" src="https://woodenplane.air-nifty.com/log/images/ca_pb_040_hca_gs_enkoduka.png" alt="階層的クラスター分析・デンドログラム（樹状図）" width="480" height="1190" border="0" /></a></p>
<p>概ねストーリーに沿った内容でクラスター化されている。</p>
<p>※当ブログの場合、[コーディング単位]が[段落][H5]だと、コードを全て選択するとエラーが返される結果となった。</p>
<p>◆クロス集計</p>
<p>・[コーディング単位]を[文]に変更、[集計]する。</p>
<p>※「タイトル」で集計をかけた。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_040_crt_enkoduka.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="クロス集計" src="https://woodenplane.air-nifty.com/log/images/ca_pb_040_crt_enkoduka.png" alt="クロス集計" width="480" height="345" border="0" /></a></p>
<p>クロス集計をかけたところ、「金物」「百姓」「馬」といったキーワードでカイ（χ）2乗値で相関関係を示す結果（※マーク）が得られた。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_040_crt_bm_enkoduka.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="クロス集計・バブルマップ" src="https://woodenplane.air-nifty.com/log/images/ca_pb_040_crt_bm_enkoduka.png" alt="クロス集計・バブルマップ" width="480" height="934" border="0" /></a></p>
<p>マップとして描画したところ、「牛」「深み」「肥えたて場」といったキーワードの残差が大きく（濃く）表示される結果となった。バブルとしては「えんこう」が大きく描画された。</p>
<p>◆KWICコンコーダンス</p>
<p>現状ではテキストマイニングのツールに文脈を読む性能はないため実際に該当箇所を読んで人力で判断する他ない。KWICコンコーダンスでキーワード指定すれば指定したキーワードがどのような文脈で用いられているか一覧で抽出される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_040_kwic_enkoduka.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="KWICコンコーダンス" src="https://woodenplane.air-nifty.com/log/images/ca_pb_040_kwic_enkoduka.png" alt="KWICコンコーダンス" width="480" height="274" border="0" /></a> <br /><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_040_kwic_doc_enkoduka.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="KWICコンコーダンス・文書表示" src="https://woodenplane.air-nifty.com/log/images/ca_pb_040_kwic_doc_enkoduka.png" alt="KWICコンコーダンス・文書表示" width="480" height="509" border="0" /></a></p>
<p>◆関連語検索</p>
<p>・[集計単位]を[文]に変更、[集計]する。<br />・[Search Entry:]の一覧からキーワードを選択してダブルクリックすると[Result]に指定したキーワードの品詞や共起関係が表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_040_rws_enkoduka.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="関連語検索" src="https://woodenplane.air-nifty.com/log/images/ca_pb_040_rws_enkoduka.png" alt="関連語検索" width="480" height="452" border="0" /></a></p>
<p>※[Result:]から行指定してダブルクリックするとKWICコンコーダンスに遷移する。<br />※[Result:]の一覧から範囲指定して[コピー]したものを表計算ソフトやテキストファイルにペーストすることも可能である。</p>
<p>[＃直接入力]を指定して「子供」といったキーワードで検索すると関連語が一覧で表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_040_rws_enkoduka_02.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="関連語検索" src="https://woodenplane.air-nifty.com/log/images/ca_pb_040_rws_enkoduka_02.png" alt="関連語検索" width="480" height="452" border="0" /></a></p>
<p>◆属性の転倒</p>
<p>・「ない」の結果上位一覧</p>
<table width="432">
<tbody>
<tr>
<td width="72">N</td>
<td width="72">抽出語</td>
<td width="72">品詞</td>
<td width="72">全体</td>
<td width="72">共起</td>
<td width="72">Jaccard</td>
</tr>
<tr>
<td>1</td>
<td>力</td>
<td>名詞C</td>
<td> 3 (0.059)</td>
<td> 3 (0.200)</td>
<td>0.2</td>
</tr>
<tr>
<td>2</td>
<td>許す</td>
<td>動詞</td>
<td> 4 (0.078)</td>
<td> 3 (0.200)</td>
<td>0.1875</td>
</tr>
<tr>
<td>3</td>
<td>引っ張る</td>
<td>動詞</td>
<td> 9 (0.176)</td>
<td> 3 (0.200)</td>
<td>0.1429</td>
</tr>
<tr>
<td>4</td>
<td>約束</td>
<td>サ変名詞</td>
<td> 2 (0.039)</td>
<td> 2 (0.133)</td>
<td>0.1333</td>
</tr>
<tr>
<td>5</td>
<td>いたずら</td>
<td>サ変名詞</td>
<td> 3 (0.059)</td>
<td> 2 (0.133)</td>
<td>0.125</td>
</tr>
<tr>
<td>6</td>
<td>言う</td>
<td>動詞</td>
<td> 3 (0.059)</td>
<td> 2 (0.133)</td>
<td>0.125</td>
</tr>
<tr>
<td>7</td>
<td>子供</td>
<td>名詞</td>
<td> 3 (0.059)</td>
<td> 2 (0.133)</td>
<td>0.125</td>
</tr>
<tr>
<td>8</td>
<td>持つ</td>
<td>動詞</td>
<td> 3 (0.059)</td>
<td> 2 (0.133)</td>
<td>0.125</td>
</tr>
<tr>
<td>9</td>
<td>捕る</td>
<td>動詞</td>
<td> 3 (0.059)</td>
<td> 2 (0.133)</td>
<td>0.125</td>
</tr>
<tr>
<td>10</td>
<td>綱</td>
<td>名詞C</td>
<td> 4 (0.078)</td>
<td> 2 (0.133)</td>
<td>0.1176</td>
</tr>
</tbody>
</table>
<p>川岸でいたずらしようとしたえんこうは却って頭の皿の水を失い干からびてしまう……といった粗筋となっている。</p>
<p>短いお話の中で属性の転倒を多用するのが昔話の特徴の一つと考えられる。</p>
<p>ここで「／」（スラッシュ）を「転倒」を意味する記号として用いる。スラッシュは様々な場面で用いられていて文脈依存的な記号という欠点もあるが、視覚的にはイメージしやすいと判断した。</p>
<p>・［えんこう｜力：喪失／回復］<br />・［えんこう｜力：回復／約束］</p>
<p>こういった風にお話を転がしていると分析できる。</p>
<p>えんこう塚の石碑の字はなぞることで「風化／深い」へと転倒される。</p>
<p>◆類似度行列</p>
<p>・[コーディング単位]を[文]に変更して[集計]。Jaccard係数がマトリクス形式で確認できる。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_040_sm_enkoduka.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="類似度行列" src="https://woodenplane.air-nifty.com/log/images/ca_pb_040_sm_enkoduka.png" alt="類似度行列" width="480" height="295" border="0" /></a></p>
<p>・ある列を選択して画面右下の[コピー（選択列）]をクリックすると、当該のキーワードに関するJaccard係数がコピーされるので、それを表計算ソフトにペーストするといった利用が可能となる。</p>
<p>※当ブログでは[コーディング単位]が[段落][H5]の場合、Jacccard係数が1.0～0.5といった結果がほとんどで、意味のない結果となった。</p>
<p>◆多次元尺度構成法</p>
<p>・[コーディング単位]を[文]に変更して実行。<br />・共起関係を確認したいキーワードを指定。<br />・次元を「2」から「3」に変更して実行、三次元のマップとした。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_040_mds_enkoduka.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="多次元尺度構成法" src="https://woodenplane.air-nifty.com/log/images/ca_pb_040_mds_enkoduka.png" alt="多次元尺度構成法" width="480" height="480" border="0" /></a></p>
<p>えんこうがいたずらしようとして失敗するくだりに関連したキーワードを指定したところ、「いたずら」が離れた位置にプロットされた。</p>
<p>※選択するキーワードによって相対的な位置関係は変わり得る。</p>
<p>※実行すると指定したキーワードの幾つかが除外されるとメッセージが表示される。テキストのボリューム不足のためか無償版の仕様によるものか判断がつかない。<br />※当ブログの事例では「文」以外、「段落」と「H5」では除外されるキーワードが増える傾向となった。</p>
<p>◆自己組織化マップ</p>
<p>[コーディング単位]を[文]に変更して実行。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_040_som_enkoduka.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="自己組織化マップ" src="https://woodenplane.air-nifty.com/log/images/ca_pb_040_som_enkoduka.png" alt="自己組織化マップ" width="480" height="480" border="0" /></a></p>
<p>記述内容が視覚的に整理され、類似性の高い内容が近くに配置される。概ねストーリーに沿った形で各クラスターが表示される。</p>
<p>※当ブログの事例では「文」以外、「段落」と「H5」ではエラーが返される結果となった。<br />※クラスター化の計算を繰り返すため処理に時間がかかるので要注意。<br />※クラスターの配置、距離に意味はない。</p>
<p>◆トピックの推定</p>
<p>・[ツール]→[文書]→[トピックモデル]→[トピックの推定]を選択。<br />・[集計単位]を[文]に変更。<br />・[OK]ボタンをクリックすると、[トピックの推定結果]画面が表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_040_ter_enkoduka.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="トピックの推定" src="https://woodenplane.air-nifty.com/log/images/ca_pb_040_ter_enkoduka.png" alt="トピックの推定" width="480" height="293" border="0" /></a></p>
<p>・各トピックで高い確率で出現する語句がリストアップされる。<br />・[＃1]といった欄をクリックすると、文書検索画面が表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_040_ter_doc_enkoduka.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="トピックの推定・文書検索" src="https://woodenplane.air-nifty.com/log/images/ca_pb_040_ter_doc_enkoduka.png" alt="トピックの推定・文書検索" width="480" height="360" border="0" /></a></p>
<p>◆ベイズ学習による分類</p>
<p>・[ツール]→[文書]→[ベイズ学習による分類]→[外部変数から学習]を選択。<br />・[分類の単位]を[文]に変更。<br />・[学習する外部変数]は[書名]に変更する。<br />　※「タイトル」のままでもよし。<br />・[OK]ボタンをクリックすると、ファイルの保存画面が表示されるので、任意のファイル名を記述して保存する。</p>
<p>・[ツール]→[文書]→[ベイズ学習による分類]→[学習結果ファイルの内容を確認]を選択。ファイル選択画面が開くので、先ほど保存したファイルを指定して開く。すると[学習結果ファイル]画面が開くので内容の確認を行う。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_040_bl_enkoduka.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="ベイズ学習による分類" src="https://woodenplane.air-nifty.com/log/images/ca_pb_040_bl_enkoduka.png" alt="ベイズ学習による分類" width="411" height="369" border="0" /></a></p>
<p>※[学習結果を用いた自動分類]については割愛する。</p>
<p>※[トピックの推定]と[ベイズ学習による分類]は固有名詞などを強制抽出語としてあらかじめ指定しておかないと正確に分析されないケースが生じる。正式に利用したい際は有償版の購入をお勧めする。当ブログのはあくまでテストケースとしてのものである。</p>
<p>※[トピックの推定]と[ベイズ学習による分類]はコーディング・ルールに依らない分析手法となるが、筆者の能力的に追及はしない。</p>
<p>◆参考文献</p>
<p>・『日本の民話 34 石見篇』（大庭良美／編, 未来社, 1978）pp.259-261.<br />・『島根のむかし話』（島根県小・中学校国語教育研究会／編著, 日本標準, 1976）pp.159-161.<br />・「夕陽を招く長者　山陰民話語り部シリーズ１」（民話の会「石見」／編, ハーベスト出版, 2013）pp.173-174.<br />・『日本伝説大系 第11巻 山陰（鳥取・島根）』（野村純一他, みずうみ書房, 1984）pp.198-199.<br />・『動かして学ぶ！はじめてのテキストマイニング』（樋口耕一, ナカニシヤ出版, 2022）<br />・『社会調査のための計量テキスト分析　【第２版】　内容分析の継承と発展を目指して』（樋口耕一, ナカニシヤ出版, 2020）</p>]]></content:encoded>


<dc:subject><![CDATA[<!-- 11 //-->昔話]]></dc:subject>

<dc:creator>mitsuzakura</dc:creator>
<dc:date>2026-04-18T23:00:00+09:00</dc:date>
</item>
<item rdf:about="https://woodenplane.air-nifty.com/log/2026/04/post-a77a46.html">
<title>昔話の計量テキスト分析――浮布の池</title>
<link>https://woodenplane.air-nifty.com/log/2026/04/post-a77a46.html</link>
<description>未来社『石見の民話』より「浮布の池」とその類話についてKH Coderで計量テキスト分析を実施した。</description>
<content:encoded><![CDATA[<p>◆はじめに</p>
<p>以下はKH Coder（無償版：version 3.Beta.08e）を用いた昔話の計量テキスト分析である。昔話の類話の比較にツールを利用できないか試行してみた。</p>
<p>手持ちの資料が限られるため、分析の対象となる元データの文字数が少ないものの（※本来であれば5000字以上は欲しい）、分析自体は正常に処理されていると判断した。</p>
<p>KH Coderの操作に慣れる目的も兼ねて行った作業で、コーディングルールの記述の事例集、あるいは速習用のチュートリアルとしてでも読んで頂ければ……といったところである。</p>
<p>なお、KH Coderでよく用いられるのは共起ネットワークと対応分析とのことで、それ以外はおまけパートと思って頂いて構わない。操作に習熟するにはコーディングルールの記述に慣れるのが第一である。</p>
<p>◆ファイル</p>
<p>各ファイルをダウンロードしてKH Coderに読み込ませれば同様の分析が再現可能である。</p>
<p><a href="https://woodenplane.air-nifty.com/log/files/ca_pb_039_ukinunonoike.xlsx" target="_blank" rel="noopener">ダウンロード - ca_pb_039_ukinunonoike.xlsx</a></p>
<p><a href="https://woodenplane.air-nifty.com/log/files/ca_pb_039_codingrules.txt" target="_blank" rel="noopener">ダウンロード - ca_pb_039_codingrules.txt</a></p>
<p><a href="https://woodenplane.air-nifty.com/log/files/kh_coder_startingedition_sagyotejunsho.txt" target="_blank" rel="noopener">ダウンロード - kh_coder_startingedition_sagyotejunsho.txt</a> （※作業手順書）</p>
<p>※「H5」とはHTMLでいうところのヘッダー（見出し）・レベル5で本文に相当すると考えればよい。<br />※[コーディング単位]は「文／段落／H5」から選べるが、状況に応じて適切と思われるものを選択する必要がある。処理が上手くいかないと感じた場合、コーディング単位を切り替えると上手く処理されるケースがままある。</p>
<p>※公式マニュアルでは「集計単位」という用語が使われている。共起関係について、</p>
<p>・「文」では一文単位での分析<br />・「段落」では段落単位の分析<br />・「H5」では表計算ソフトのセル単位とされ、改行を含めた一セルの中身全体が分析単位となる</p>
<p>※レファレンスでも索引で「コーディング単位」の項目は設けられていない。操作性に関わる重要項目であるものの、その仕様について不明瞭な感はある。<br />※当ブログの場合、表計算ソフトのフォーマットで読み込ませているからH5固定でいいだろうと思い込んでいたら、さにあらずだった。</p>
<p>◆あらすじ</p>
<p>・「浮布の池」（未来社『石見の民話』）<br />三瓶山の麓にある浮布の池はもとは浮沼池という。昔、池の原の長者の子ににえ姫という美しい姫がいた。古くから池に住む池の主がいつしか姫に思いを寄せるようになった。姫は池のほとりで美しい若者と出会った。姫は若者に心を惹かれた。姫は若者の誘いで池に行くと気を失ってしまう。そして空を飛ぶ夢を見る。気づくと一人で池のほとりに座っていた。着物は濡れていなかった。このようなことが度重なって、姫の顔に生気が無くなってきた。人々の心配を他所に姫は池のほとりを歩く。ある日、通りかかった武士が大蛇に巻き付かれた姫を見た。武士は弓で大蛇を射る。浮布の池はざわめいたが、池の主の姿はなかった。意識を取り戻した姫だったが、池に身を投げて死んでしまった。姫が着ていた衣の裾が白く帯のように池の中央に浮かんでいた。この日は六月一日で、それから毎年六月一日にはこの白い波の道が光って池の表に現れるところからこの池を浮布の池と呼ぶようになった。にえ姫を祀るにえ姫神社は池の東側の中ノ島にある。</p>
<p><br />・「池の主とむすめ」（日本標準『島根の伝説』）<br />昔、三瓶山の麓に池の原長者という長者がいた。そこには気立ての優しいきれいな娘がいた。ある夕方のこと、娘が池の傍にいると、身なりの立派な若者が通りかかった。見たことのない若者だったが、二人は話し合う仲となった。それからというもの、二人は逢うことを楽しんだ。ある日のこと、弓の上手な武士が池の側を通ると、大蛇に巻きつかれた娘がいた。これは大変と矢を射ると見事当たった。大蛇は池に逃げたが、娘には大蛇が若者に見えていたので、自分も跡を追った。やがて、娘の着物が布を流したように浮いてきた。人々は浮布の池と呼んだ。若者は池の主の大蛇だった。</p>
<p><br />◆コーディングルール</p>
<p>※コーディングルールのキーワードは重要と判断したものを人力でピックアップしている。そのため、恣意性を伴う分析となる。</p>
<p>※活用形でなく基本形で入力する。</p>
<p>※[前処理]→[語の抽出結果を確認]でキーワードがどのように分節されているか検索すると結果の一覧[語の抽出結果]が表示される。</p>
<p>※[Result]から確認したい行をクリックして選択、画面下の[詳細表示]ボタンをクリックするとサブ画面が表示され、活用形や基本形が確認できる。</p>
<p>※昔話では「否定／肯定」「肯定／否定」と属性が変化することが多いと考え、否定詞「ない」「まい」「ぬ」「ん」、また禁止を意味する「な」を共通のコードとして設定している。</p>
<p>※[関連語検索]で否定詞の共起語の一覧を表示させたところ、日本の昔話のように掌編レベルのボリュームだと、物語の動因となる箇所に関する語句が上位に表示される傾向が強いのではないか……といった印象があり、検証作業中である。</p>
<p>※無償版では強制抽出語の指定が機能制限で事実上使用できないため以下のような手法をとっている。</p>
<p><br />＊三瓶山<br />三瓶山<br />＊浮布池<br />'浮布池' or '浮布の池' or 池<br />＊にえ姫<br />'にえ姫' or 姫<br />＊惹かれる<br />惹かれる or ( 思い and 寄せる )<br />＊衣<br />着物 or 衣<br />＊気絶<br />気 and 失う<br />＊巻き付く<br />巻き付く or 巻きつく<br />＊身投げ<br />( 身 and 投げる ) or ( 跡 and 追う )<br />＊六月一日<br />'六月一日'<br />＊池の原<br />'池の原'<br />＊美しい<br />美しい or きれい</p>
<p>＊ない<br />ない<br />＊ぬ<br />ぬ<br />＊ん<br />ん<br />＊るな<br />'るな'<br />＊るまい<br />'るまい'</p>
<p>＊長者<br />長者<br />＊主<br />主<br />＊若者<br />若者<br />＊濡れる<br />濡れる<br />＊生気<br />生気<br />＊武士<br />武士<br />＊大蛇<br />大蛇<br />＊射る<br />射る<br />＊死ぬ<br />死ぬ<br />＊浮かぶ<br />浮かぶ<br />＊神社<br />神社<br />＊娘<br />娘<br />＊見える<br />見える<br />＊身なり<br />身なり<br />＊立派<br />立派</p>
<p><br />◆共起ネットワーク</p>
<p>・[コーディング単位]を[H5]に設定する。</p>
<p>※[描画する共起関係（edge）の選択]で「係数」を「0.2」から「0.3」に修正する。<br />※[強い共起関係ほど濃い線に]にチェックを入れる。</p>
<p>Jaccard係数が0.3以上はかなり強い共起関係にあることを示しているが、分析対象となる元データの文字数が少ないため係数が高めに出てしまう傾向にあるため、こうしている。</p>
<p>※Jaccard係数は共起関係（※ある言葉に続いて出てくる関係）の強さを表し 0≦係数≦1 の範囲の値をとる。</p>
<p>【Jaccard係数】<br />・0.1 →関連あり<br />・0.2 →強い関連あり<br />・0.3以上 →とても強い関連あり<br />※ただし、あくまで目安であって絶対ではない。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_039_con_ukinunoike.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="共起ネットワーク" src="https://woodenplane.air-nifty.com/log/images/ca_pb_039_con_ukinunoike.png" alt="共起ネットワーク" width="480" height="360" border="0" /></a></p>
<p>ざっと確認したところ、共通するキーワードが中央のサブグラフ（バブルが島状に集まった一塊）に表示され、類話によって異なるキーワードがそれぞれのサブグラフとして周辺に表示される形となっている。</p>
<p>※なお、各バブル間の距離や配置に意味はない。</p>
<p>◆対応分析</p>
<p>・[コーディング単位]を[H5]に設定する。</p>
<p>※[外部変数]は[タイトル]のまま続行。<br />※[差異が顕著なコードを分析に使用]で上位「40」とした。また[バブルプロット]にチェックを入れている。これらは文字の重なりを極力避けるためである。<br />※文字が重なって読みづらい場合、オプション画面の[コード選択]で不要なコードのチェックを外してもよい。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_039_ca_ukinunoike.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="対応分析" src="https://woodenplane.air-nifty.com/log/images/ca_pb_039_ca_ukinunoike.png" alt="対応分析" width="480" height="374" border="0" /></a></p>
<p>x、y軸上の原点（0.0）から点線が伸び交差した箇所が原点となる。原点から離れるほど特徴的なキーワードだと分析される。</p>
<p>原点付近には「若者」「大蛇」「身投げ」といったキーワードがプロットされている。未来社版では「にえ姫」「死ぬ」「浮かぶ」といったキーワードが原点から離れてプロットされている。日本標準版では「娘」「身なり」「立派」といったキーワードが特徴的とされている。</p>
<p>◆解釈</p>
<p>ほとんど同じ内容で、言葉選びの違いに過ぎない。「にえ姫」は「にべ姫」とされることが多い。</p>
<p>◆階層的クラスター分析</p>
<p>・[コーディング単位]を[文]に変更、実行するとデンドログラム（樹状図）で可視化される。</p>
<p>※キーワード指定しても可。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_039_hca_ukinunoike.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="階層的クラスター分析・デンドログラム（樹状図）" src="https://woodenplane.air-nifty.com/log/images/ca_pb_039_hca_ukinunoike.png" alt="階層的クラスター分析・デンドログラム（樹状図）" width="480" height="665" border="0" /></a> <br /><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_039_hca_gs_ukinunoike.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="階層的クラスター分析・デンドログラム（樹状図）" src="https://woodenplane.air-nifty.com/log/images/ca_pb_039_hca_gs_ukinunoike.png" alt="階層的クラスター分析・デンドログラム（樹状図）" width="480" height="665" border="0" /></a></p>
<p>概ねストーリーに沿った内容でクラスター化されている。</p>
<p>※当ブログの場合、[コーディング単位]が[段落][H5]だと、コードを全て選択するとエラーが返される結果となった。</p>
<p>◆クロス集計</p>
<p>・[コーディング単位]を[文]に変更、[集計]する。</p>
<p>※「タイトル」で集計をかけた。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_039_crt_ukinunoike.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="クロス集計" src="https://woodenplane.air-nifty.com/log/images/ca_pb_039_crt_ukinunoike.png" alt="クロス集計" width="480" height="345" border="0" /></a></p>
<p>クロス集計をかけたところ、「にえ姫」「娘」といったキーワードでカイ（χ）2乗値で相関関係を示す結果（※マーク）が得られた。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_039_crt_bm_ukinunoike.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="クロス集計・バブルマップ" src="https://woodenplane.air-nifty.com/log/images/ca_pb_039_crt_bm_ukinunoike.png" alt="クロス集計・バブルマップ" width="480" height="468" border="0" /></a></p>
<p>マップとして描画したところ、「見える」「娘」といったキーワードの残差が大きく（濃く）表示される結果となった。バブルとしては「浮布池」「にえ姫」が大きく描画された。</p>
<p>◆KWICコンコーダンス</p>
<p>現状ではテキストマイニングのツールに文脈を読む性能はないため実際に該当箇所を読んで人力で判断する他ない。KWICコンコーダンスでキーワード指定すれば指定したキーワードがどのような文脈で用いられているか一覧で抽出される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_039_kwic_ukinunoike.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="KWICコンコーダンス" src="https://woodenplane.air-nifty.com/log/images/ca_pb_039_kwic_ukinunoike.png" alt="KWICコンコーダンス" width="480" height="274" border="0" /></a> <br /><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_039_kwic_doc_ukinunoike.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="KWICコンコーダンス・文書表示" src="https://woodenplane.air-nifty.com/log/images/ca_pb_039_kwic_doc_ukinunoike.png" alt="KWICコンコーダンス・文書表示" width="480" height="509" border="0" /></a></p>
<p>◆関連語検索</p>
<p>・[集計単位]を[文]に変更、[集計]する。<br />・[Search Entry:]の一覧からキーワードを選択してダブルクリックすると[Result]に指定したキーワードの品詞や共起関係が表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_039_rws_ukinunoike.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="関連語検索" src="https://woodenplane.air-nifty.com/log/images/ca_pb_039_rws_ukinunoike.png" alt="関連語検索" width="480" height="452" border="0" /></a></p>
<p>※[Result:]から行指定してダブルクリックするとKWICコンコーダンスに遷移する。<br />※[Result:]の一覧から範囲指定して[コピー]したものを表計算ソフトやテキストファイルにペーストすることも可能である。</p>
<p>[＃直接入力]を指定して「投げる」といったキーワードで検索すると関連語が一覧で表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_039_rws_ukinunoike_02.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="関連語検索" src="https://woodenplane.air-nifty.com/log/images/ca_pb_039_rws_ukinunoike_02.png" alt="関連語検索" width="480" height="452" border="0" /></a></p>
<p>◆属性の転倒</p>
<p>・「ない」の結果上位一覧</p>
<table width="432">
<tbody>
<tr>
<td width="72">N</td>
<td width="72">抽出語</td>
<td width="72">品詞</td>
<td width="72">全体</td>
<td width="72">共起</td>
<td width="72">Jaccard</td>
</tr>
<tr>
<td>1</td>
<td>姿</td>
<td>名詞C</td>
<td> 1 (0.034)</td>
<td> 1 (0.333)</td>
<td>0.3333</td>
</tr>
<tr>
<td>2</td>
<td>仲</td>
<td>名詞C</td>
<td> 1 (0.034)</td>
<td> 1 (0.333)</td>
<td>0.3333</td>
</tr>
<tr>
<td>3</td>
<td>濡れる</td>
<td>動詞</td>
<td> 1 (0.034)</td>
<td> 1 (0.333)</td>
<td>0.3333</td>
</tr>
<tr>
<td>4</td>
<td>話し合う</td>
<td>動詞</td>
<td> 1 (0.034)</td>
<td> 1 (0.333)</td>
<td>0.3333</td>
</tr>
<tr>
<td>5</td>
<td>着物</td>
<td>名詞</td>
<td> 2 (0.069)</td>
<td> 1 (0.333)</td>
<td>0.25</td>
</tr>
<tr>
<td>6</td>
<td>見る</td>
<td>動詞</td>
<td> 3 (0.103)</td>
<td> 1 (0.333)</td>
<td>0.2</td>
</tr>
<tr>
<td>7</td>
<td>主</td>
<td>形容動詞</td>
<td> 3 (0.103)</td>
<td> 1 (0.333)</td>
<td>0.2</td>
</tr>
<tr>
<td>8</td>
<td>浮</td>
<td>未知語</td>
<td> 4 (0.138)</td>
<td> 1 (0.333)</td>
<td>0.1667</td>
</tr>
<tr>
<td>9</td>
<td>布</td>
<td>名詞C</td>
<td> 5 (0.172)</td>
<td> 1 (0.333)</td>
<td>0.1429</td>
</tr>
<tr>
<td>10</td>
<td>若者</td>
<td>名詞</td>
<td> 7 (0.241)</td>
<td> 1 (0.333)</td>
<td>0.1111</td>
</tr>
</tbody>
</table>
<p>池の主に誘惑された姫は武士によって大蛇から一旦解放されるものの、その跡を追って入水してしまう……といった粗筋となっている。</p>
<p>短いお話の中で属性の転倒を多用するのが昔話の特徴の一つと考えられる。</p>
<p>ここで「／」（スラッシュ）を「転倒」を意味する記号として用いる。スラッシュは様々な場面で用いられていて文脈依存的な記号という欠点もあるが、視覚的にはイメージしやすいと判断した。</p>
<p>・［姫｜恋：成就／死］<br />・［姫｜武士：阻止／入水］<br />・［大蛇｜若者：誘惑／退散］</p>
<p>こういった風にお話を転がしていると分析できる。</p>
<p>姫の運命は恋を成就させることで却って「生／死」へと転倒されてしまう。</p>
<p>◆類似度行列</p>
<p>・[コーディング単位]を[文]に変更して[集計]。Jaccard係数がマトリクス形式で確認できる。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_039_sm_ukinunoike.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="類似度行列" src="https://woodenplane.air-nifty.com/log/images/ca_pb_039_sm_ukinunoike.png" alt="類似度行列" width="480" height="295" border="0" /></a></p>
<p>・ある列を選択して画面右下の[コピー（選択列）]をクリックすると、当該のキーワードに関するJaccard係数がコピーされるので、それを表計算ソフトにペーストするといった利用が可能となる。</p>
<p>※当ブログでは[コーディング単位]が[段落][H5]の場合、Jacccard係数が1.0～0.5といった結果がほとんどで、意味のない結果となった。</p>
<p>◆多次元尺度構成法</p>
<p>・[コーディング単位]を[文]に変更して実行。<br />・共起関係を確認したいキーワードを指定。<br />・次元を「2」から「3」に変更して実行、三次元のマップとした。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_039_mds_ukinunoike.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="多次元尺度構成法" src="https://woodenplane.air-nifty.com/log/images/ca_pb_039_mds_ukinunoike.png" alt="多次元尺度構成法" width="480" height="480" border="0" /></a></p>
<p>姫が身投げしてしまうくだりに関連したキーワードを指定したところ、「娘」が離れた位置にプロットされた。</p>
<p>※選択するキーワードによって相対的な位置関係は変わり得る。</p>
<p>※実行すると指定したキーワードの幾つかが除外されるとメッセージが表示される。テキストのボリューム不足のためか無償版の仕様によるものか判断がつかない。<br />※当ブログの事例では「文」以外、「段落」と「H5」では除外されるキーワードが増える傾向となった。</p>
<p>◆自己組織化マップ</p>
<p>[コーディング単位]を[文]に変更して実行。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_039_som_ukinunoike.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="自己組織化マップ" src="https://woodenplane.air-nifty.com/log/images/ca_pb_039_som_ukinunoike.png" alt="自己組織化マップ" width="480" height="480" border="0" /></a></p>
<p>記述内容が視覚的に整理され、類似性の高い内容が近くに配置される。概ねストーリーに沿った形で各クラスターが表示される。</p>
<p>※当ブログの事例では「文」以外、「段落」と「H5」ではエラーが返される結果となった。<br />※クラスター化の計算を繰り返すため処理に時間がかかるので要注意。<br />※クラスターの配置、距離に意味はない。</p>
<p>◆トピックの推定</p>
<p>・[ツール]→[文書]→[トピックモデル]→[トピックの推定]を選択。<br />・[集計単位]を[文]に変更。<br />・[OK]ボタンをクリックすると、[トピックの推定結果]画面が表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_039_ter_ukinunoike.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="トピックの推定" src="https://woodenplane.air-nifty.com/log/images/ca_pb_039_ter_ukinunoike.png" alt="トピックの推定" width="480" height="293" border="0" /></a></p>
<p>・各トピックで高い確率で出現する語句がリストアップされる。<br />・[＃1]といった欄をクリックすると、文書検索画面が表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_039_ter_doc_ukinunoike.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="トピックの推定・文書検索" src="https://woodenplane.air-nifty.com/log/images/ca_pb_039_ter_doc_ukinunoike.png" alt="トピックの推定・文書検索" width="480" height="360" border="0" /></a></p>
<p>◆ベイズ学習による分類</p>
<p>・[ツール]→[文書]→[ベイズ学習による分類]→[外部変数から学習]を選択。<br />・[分類の単位]を[文]に変更。<br />・[学習する外部変数]は[書名]に変更する。<br />　※「タイトル」のままでもよし。<br />・[OK]ボタンをクリックすると、ファイルの保存画面が表示されるので、任意のファイル名を記述して保存する。</p>
<p>・[ツール]→[文書]→[ベイズ学習による分類]→[学習結果ファイルの内容を確認]を選択。ファイル選択画面が開くので、先ほど保存したファイルを指定して開く。すると[学習結果ファイル]画面が開くので内容の確認を行う。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_039_bl_ukinunoike.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="ベイズ学習による分類" src="https://woodenplane.air-nifty.com/log/images/ca_pb_039_bl_ukinunoike.png" alt="ベイズ学習による分類" width="411" height="369" border="0" /></a></p>
<p>※[学習結果を用いた自動分類]については割愛する。</p>
<p>※[トピックの推定]と[ベイズ学習による分類]は固有名詞などを強制抽出語としてあらかじめ指定しておかないと正確に分析されないケースが生じる。正式に利用したい際は有償版の購入をお勧めする。当ブログのはあくまでテストケースとしてのものである。</p>
<p>※[トピックの推定]と[ベイズ学習による分類]はコーディング・ルールに依らない分析手法となるが、筆者の能力的に追及はしない。</p>
<p>◆参考文献</p>
<p>・『日本の民話 34 石見篇』（大庭良美／編, 未来社, 1978）pp.21-23.<br />・『島根の伝説』（島根県小・中学校国語教育研究会／編, 日本標準, 1978）p.93.<br />・『動かして学ぶ！はじめてのテキストマイニング』（樋口耕一, ナカニシヤ出版, 2022）<br />・『社会調査のための計量テキスト分析　【第２版】　内容分析の継承と発展を目指して』（樋口耕一, ナカニシヤ出版, 2020）</p>]]></content:encoded>


<dc:subject><![CDATA[<!-- 11 //-->昔話]]></dc:subject>

<dc:creator>mitsuzakura</dc:creator>
<dc:date>2026-04-17T23:00:00+09:00</dc:date>
</item>
<item rdf:about="https://woodenplane.air-nifty.com/log/2026/04/post-b453ad.html">
<title>昔話の計量テキスト分析――蜘蛛の糸</title>
<link>https://woodenplane.air-nifty.com/log/2026/04/post-b453ad.html</link>
<description>未来社『石見の民話』より「千八尋渕」とその類話についてKH Coderで計量テキスト分析を実施した。</description>
<content:encoded><![CDATA[<p>◆はじめに</p>
<p>以下はKH Coder（無償版：version 3.Beta.08e）を用いた昔話の計量テキスト分析である。昔話の類話の比較にツールを利用できないか試行してみた。</p>
<p>手持ちの資料が限られるため、分析の対象となる元データの文字数が少ないものの（※本来であれば5000字以上は欲しい）、分析自体は正常に処理されていると判断した。</p>
<p>KH Coderの操作に慣れる目的も兼ねて行った作業で、コーディングルールの記述の事例集、あるいは速習用のチュートリアルとしてでも読んで頂ければ……といったところである。</p>
<p>なお、KH Coderでよく用いられるのは共起ネットワークと対応分析とのことで、それ以外はおまけパートと思って頂いて構わない。操作に習熟するにはコーディングルールの記述に慣れるのが第一である。</p>
<p>◆ファイル</p>
<p>各ファイルをダウンロードしてKH Coderに読み込ませれば同様の分析が再現可能である。</p>
<p><a href="https://woodenplane.air-nifty.com/log/files/ca_pb_038_kumonoito.xlsx" target="_blank" rel="noopener">ダウンロード - ca_pb_038_kumonoito.xlsx</a></p>
<p><a href="https://woodenplane.air-nifty.com/log/files/ca_pb_038_codingrules.txt" target="_blank" rel="noopener">ダウンロード - ca_pb_038_codingrules.txt</a></p>
<p><a href="https://woodenplane.air-nifty.com/log/files/kh_coder_startingedition_sagyotejunsho.txt" target="_blank" rel="noopener">ダウンロード - kh_coder_startingedition_sagyotejunsho.txt</a> （※作業手順書）</p>
<p>※「H5」とはHTMLでいうところのヘッダー（見出し）・レベル5で本文に相当すると考えればよい。<br />※[コーディング単位]は「文／段落／H5」から選べるが、状況に応じて適切と思われるものを選択する必要がある。処理が上手くいかないと感じた場合、コーディング単位を切り替えると上手く処理されるケースがままある。</p>
<p>※公式マニュアルでは「集計単位」という用語が使われている。共起関係について、</p>
<p>・「文」では一文単位での分析<br />・「段落」では段落単位の分析<br />・「H5」では表計算ソフトのセル単位とされ、改行を含めた一セルの中身全体が分析単位となる</p>
<p>※レファレンスでも索引で「コーディング単位」の項目は設けられていない。操作性に関わる重要項目であるものの、その仕様について不明瞭な感はある。<br />※当ブログの場合、表計算ソフトのフォーマットで読み込ませているからH5固定でいいだろうと思い込んでいたら、さにあらずだった。</p>
<p>◆あらすじ</p>
<p>・「千八尋渕」（未来社『石見の民話』）<br />円ノ谷から鍛冶屋谷に沿って登ると、大津に千八尋渕という有名な渕がある。直径三、四メートルくらいの丸い渕で、そう大きいことはないが、はんどう（水瓶）を上から覗く様に周囲の岩が下になるほど広がり、青黒い水をたたえている。この渕は底が円ノ谷の蛇渕へ続いているということで、この渕へ手杵を落としたところ蛇渕へ浮いたとか、籾殻を流しこんだところ蛇渕へ出たとかいう話がある。昔、大津の長九郎という人が日原から塩を買って帰りに千八尋渕の上で休んでいた。すると渕から一匹の蜘蛛が上がってきて、長九郎の膝の頭へ糸をつけて渕へ下りていった。長九郎はおかしなことをすると思って、糸を外してほとりの松の切株へつけておいた。しばらくすると、下から糸をぐいぐい引っ張りはじめた。すると、大きな松の切株がぐっさぐっさと動き出して、とうとう下の渕へどぶんと落ち込んでしまった。長九郎は危ないところだった。もう少しで渕へ引っ張り込まれるところだったと思いながら家へ帰った。その晩、長九郎の家の床の間にあった刀が一人働きをして何か斬ったので、明くる朝見るとべっとりと血がついていた。ある時長九郎が外から帰ってみると、昔から家伝の刀のしまってある箪笥の引き出しを百足がぞろぞろ這い回っていた。不思議に思って刀を出してみると、刀の刃を百足が這っていた。その話が伝わって、あっちこっちから人が見にくるようになった。とうとうそれが津和野の殿さまの耳に入って、そういう刀があるならば差し出すようにという沙汰があった。長九郎は仕方なしに刀を差しだした。ところがその晩から、刀は毎晩のようにかたかたと鍔を鳴らせて長九へ帰る、長九へ帰ると言う。殿さまは気味が悪くなって、とうとう長九郎へ返した。そののち長い間、刀は長九郎の家にあって、抜いてみるといつでもこうこうとした刃の上を百足が這っていた。そしてあっちこっちから見にくる人が絶えなかった。けれども長九郎は決して女には見せなかった。長九郎の女房はそれを見て、いくら女だからと言って自分の家にあるものを見ることができないというのは情けない話だと思った。そしてある日長九郎が留守の間にそっと刀を出してみた。ところがそれから刀に百足がいなくなり、赤い錆がくるようになった。ある時長九郎が千八尋渕へ行くと、向こうの岸からこっちの岸へとてつもない大きな蟹が爪をかけていた。長九郎はびっくりして火縄銃に青銅の一つ玉を込めてズドンと一発大きな甲をめがけて撃つと蟹は渕へ落ちた。長九郎は家へ帰ると手桶に三杯水を飲んだがすぐ死んでしまった。</p>
<p><br />・「千八尋渕と長九郎」（日本標準『島根の伝説』）<br />長九郎は日原からの帰り道、あまりに暑いので千八尋渕の傍で荷を下ろして一休みした。そしてうとうとしていると、一匹の蜘蛛が渕から這い上がって長九郎の膝に糸をかけた。はっと目覚めた長九郎はその糸を外すと、傍の大松に結んでおいた。すると、蜘蛛の糸がピーンと張ったかと思うと、松の木を引っ張っている。やがて、松の木は少しずつ渕の方へ傾いていき、とうとう、ずるずると渕の中へ引きずり込まれてしまった。夢をみているような気で見ていた長九郎は命からがら家に帰った。</p>
<p><br />・「やりこ渕」（みずうみ書房『日本伝説大系』第十一巻）<br />やりこというものが、山こだか木こりだか知らないけれど、その者が山へ行って煙草を吸っていたところ、渕から主が上がってきた。煙草を吸っていたら、蜘蛛が出てきて、やりこの煙草を吸っているところに、やりこの脛に蜘蛛の糸を引っかけて、「やりこか」と言ったので「ええわ」と言ったら、やりこを渕に引っ張り込んでしまった。それからお母が番をしていたら、今度はカエルみたいな物に化けて上がったそうな。それで、そんな今、残念で向かったのだそうな。そうしたら、走ったから追ったら、巌峯寺というところにぼうと行ったのだそうな。そうしたらカエルになって岩の頭にちゃんとして居たそうな。そうしたら化けて岩になってしまっていたそうな。それでカエル岩というのだそうな。それで我が家に戻ったのだと。</p>
<p><br />◆コーディングルール</p>
<p>※コーディングルールのキーワードは重要と判断したものを人力でピックアップしている。そのため、恣意性を伴う分析となる。</p>
<p>※活用形でなく基本形で入力する。</p>
<p>※[前処理]→[語の抽出結果を確認]でキーワードがどのように分節されているか検索すると結果の一覧[語の抽出結果]が表示される。</p>
<p>※[Result]から確認したい行をクリックして選択、画面下の[詳細表示]ボタンをクリックするとサブ画面が表示され、活用形や基本形が確認できる。</p>
<p>※昔話では「否定／肯定」「肯定／否定」と属性が変化することが多いと考え、否定詞「ない」「まい」「ぬ」「ん」、また禁止を意味する「な」を共通のコードとして設定している。</p>
<p>※[関連語検索]で否定詞の共起語の一覧を表示させたところ、日本の昔話のように掌編レベルのボリュームだと、物語の動因となる箇所に関する語句が上位に表示される傾向が強いのではないか……といった印象があり、検証作業中である。</p>
<p>※無償版では強制抽出語の指定が機能制限で事実上使用できないため以下のような手法をとっている。</p>
<p><br />＊千八尋渕<br />'千八尋渕'<br />＊蛇渕<br />'蛇渕'<br />＊長九郎<br />'長九郎' or '長九'<br />＊休む<br />休む or 一休み<br />＊切株<br />'切株'<br />＊床の間<br />'床の間'<br />＊引きずり込む<br />引きずり込む or 引っ張り込む<br />＊命からがら<br />命からがら or 危うい<br />＊やりこ<br />'やりこ'<br />＊お母<br />'お母'</p>
<p>＊ない<br />ない<br />＊ぬ<br />ぬ<br />＊ん<br />ん<br />＊るな<br />'るな'<br />＊るまい<br />'るまい'</p>
<p>＊渕<br />渕<br />＊日原<br />日原<br />＊蜘蛛<br />蜘蛛<br />＊膝<br />膝<br />＊糸<br />糸<br />＊外す<br />外す<br />＊落ちる<br />落ちる<br />＊家<br />家<br />＊刀<br />刀<br />＊斬る<br />斬る<br />＊血<br />血<br />＊家伝<br />家伝<br />＊百足<br />百足<br />＊津和野<br />津和野<br />＊殿さま<br />殿さま<br />＊差し出す<br />差し出す<br />＊女<br />女<br />＊見せる<br />見せる<br />＊女房<br />女房<br />＊留守<br />留守<br />＊錆<br />錆<br />＊蟹<br />蟹<br />＊撃つ<br />撃つ<br />＊水<br />水<br />＊飲む<br />飲む<br />＊死ぬ<br />死ぬ<br />＊結ぶ<br />結ぶ<br />＊帰る<br />帰る<br />＊山<br />山<br />＊主<br />主<br />＊脛<br />脛<br />＊番<br />番<br />＊カエル<br />カエル<br />＊化ける<br />化ける<br />＊寺<br />寺<br />＊岩<br />岩<br />＊木こり<br />木こり<br />＊山こ<br />'山こ'<br />＊煙草<br />煙草</p>
<p><br />◆共起ネットワーク</p>
<p>・[コーディング単位]を[H5]に設定する。</p>
<p>※[描画する共起関係（edge）の選択]で「係数」を「0.2」から「0.3」に修正する。<br />※[強い共起関係ほど濃い線に]にチェックを入れる。</p>
<p>Jaccard係数が0.3以上はかなり強い共起関係にあることを示しているが、分析対象となる元データの文字数が少ないため係数が高めに出てしまう傾向にあるため、こうしている。</p>
<p>※Jaccard係数は共起関係（※ある言葉に続いて出てくる関係）の強さを表し 0≦係数≦1 の範囲の値をとる。</p>
<p>【Jaccard係数】<br />・0.1 →関連あり<br />・0.2 →強い関連あり<br />・0.3以上 →とても強い関連あり<br />※ただし、あくまで目安であって絶対ではない。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_038_con_kumonoito.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="共起ネットワーク" src="https://woodenplane.air-nifty.com/log/images/ca_pb_038_con_kumonoito.png" alt="共起ネットワーク" width="480" height="360" border="0" /></a></p>
<p>ざっと確認したところ、共通するキーワードが中央のサブグラフ（バブルが島状に集まった一塊）に表示され、類話によって異なるキーワードがそれぞれのサブグラフとして周辺に表示される形となっている。</p>
<p>※なお、各バブル間の距離や配置に意味はない。</p>
<p>◆対応分析</p>
<p>・[コーディング単位]を[H5]に設定する。</p>
<p>※[外部変数]は[タイトル]のまま続行。<br />※[差異が顕著なコードを分析に使用]で上位「40」とした。また[バブルプロット]にチェックを入れている。これらは文字の重なりを極力避けるためである。<br />※文字が重なって読みづらい場合、オプション画面の[コード選択]で不要なコードのチェックを外してもよい。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_038_ca_kumonoito.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="対応分析" src="https://woodenplane.air-nifty.com/log/images/ca_pb_038_ca_kumonoito.png" alt="対応分析" width="480" height="374" border="0" /></a></p>
<p>x、y軸上の原点（0.0）から点線が伸び交差した箇所が原点となる。原点から離れるほど特徴的なキーワードだと分析される。</p>
<p>原点付近には「千八尋渕」「長九郎」「膝」といったキーワードがプロットされている。未来社版では「百足」「女房」「刀」といったキーワードが原点から離れてプロットされている。日本標準版では「命からがら」「引きずり込む」といったキーワードが特徴的とされている。みずうみ書房版では「やりこ」「お母」「脛」といったキーワードが特徴的とされている。</p>
<p>◆解釈</p>
<p>全国的には伊豆の浄蓮の滝の伝説で有名な話である。日本標準『島根の伝説』には千八尋渕の写真が載っておりリアリティを感じた。「やりこ渕」は不条理さが魅力である。</p>
<p>◆階層的クラスター分析</p>
<p>・[コーディング単位]を[文]に変更、実行するとデンドログラム（樹状図）で可視化される。</p>
<p>※キーワード指定しても可。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_038_hca_kumonoito.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="階層的クラスター分析・デンドログラム（樹状図）" src="https://woodenplane.air-nifty.com/log/images/ca_pb_038_hca_kumonoito.png" alt="階層的クラスター分析・デンドログラム（樹状図）" width="480" height="1125" border="0" /></a> <br /><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_038_hca_gs_kumonoito.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="階層的クラスター分析・デンドログラム（樹状図）" src="https://woodenplane.air-nifty.com/log/images/ca_pb_038_hca_gs_kumonoito.png" alt="階層的クラスター分析・デンドログラム（樹状図）" width="480" height="1078" border="0" /></a></p>
<p>概ねストーリーに沿った内容でクラスター化されている。</p>
<p>※当ブログの場合、[コーディング単位]が[段落][H5]だと、コードを全て選択するとエラーが返される結果となった。</p>
<p>◆クロス集計</p>
<p>・[コーディング単位]を[文]に変更、[集計]する。</p>
<p>※「タイトル」で集計をかけた。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_038_crt_kumonoito.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="クロス集計" src="https://woodenplane.air-nifty.com/log/images/ca_pb_038_crt_kumonoito.png" alt="クロス集計" width="480" height="345" border="0" /></a></p>
<p>クロス集計をかけたところ、「長九郎」「やりこ」といったキーワードでカイ（χ）2乗値で相関関係を示す結果（※マーク）が得られた。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_038_crt_bm_kumonoito.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="クロス集計・バブルマップ" src="https://woodenplane.air-nifty.com/log/images/ca_pb_038_crt_bm_kumonoito.png" alt="クロス集計・バブルマップ" width="480" height="855" border="0" /></a></p>
<p>マップとして描画したところ、「カエル」「山こ」といったキーワードの残差が大きく（濃く）表示される結果となった。バブルとしては「長九郎」が大きく描画された。</p>
<p>◆KWICコンコーダンス</p>
<p>現状ではテキストマイニングのツールに文脈を読む性能はないため実際に該当箇所を読んで人力で判断する他ない。KWICコンコーダンスでキーワード指定すれば指定したキーワードがどのような文脈で用いられているか一覧で抽出される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_038_kwic_kumonoito.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="KWICコンコーダンス" src="https://woodenplane.air-nifty.com/log/images/ca_pb_038_kwic_kumonoito.png" alt="KWICコンコーダンス" width="480" height="274" border="0" /></a><br /><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_038_kwic_doc_kumonoito.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="KWICコンコーダンス・文書表示" src="https://woodenplane.air-nifty.com/log/images/ca_pb_038_kwic_doc_kumonoito.png" alt="KWICコンコーダンス・文書表示" width="480" height="509" border="0" /></a></p>
<p>◆関連語検索</p>
<p>・[集計単位]を[文]に変更、[集計]する。<br />・[Search Entry:]の一覧からキーワードを選択してダブルクリックすると[Result]に指定したキーワードの品詞や共起関係が表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_038_rws_kumonoito.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="関連語検索" src="https://woodenplane.air-nifty.com/log/images/ca_pb_038_rws_kumonoito.png" alt="関連語検索" width="480" height="452" border="0" /></a></p>
<p>※[Result:]から行指定してダブルクリックするとKWICコンコーダンスに遷移する。<br />※[Result:]の一覧から範囲指定して[コピー]したものを表計算ソフトやテキストファイルにペーストすることも可能である。</p>
<p>[＃直接入力]を指定して「べっとり」といったキーワードで検索すると関連語が一覧で表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_038_rws_kumonoito_02.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="関連語検索" src="https://woodenplane.air-nifty.com/log/images/ca_pb_038_rws_kumonoito_02.png" alt="関連語検索" width="480" height="452" border="0" /></a></p>
<p>◆属性の転倒</p>
<p>・「ない」の結果上位一覧</p>
<table width="432">
<tbody>
<tr>
<td width="72">N</td>
<td width="72">抽出語</td>
<td width="72">品詞</td>
<td width="72">全体</td>
<td width="72">共起</td>
<td width="72">Jaccard</td>
</tr>
<tr>
<td>1</td>
<td>女</td>
<td>名詞C</td>
<td> 2 (0.048)</td>
<td> 2 (0.286)</td>
<td>0.2857</td>
</tr>
<tr>
<td>2</td>
<td>見る</td>
<td>動詞</td>
<td> 5 (0.119)</td>
<td> 2 (0.286)</td>
<td>0.2</td>
</tr>
<tr>
<td>3</td>
<td>刀</td>
<td>名詞C</td>
<td> 9 (0.214)</td>
<td> 2 (0.286)</td>
<td>0.1429</td>
</tr>
<tr>
<td>4</td>
<td>丸い</td>
<td>形容詞</td>
<td> 1 (0.024)</td>
<td> 1 (0.143)</td>
<td>0.1429</td>
</tr>
<tr>
<td>5</td>
<td>決して</td>
<td>副詞</td>
<td> 1 (0.024)</td>
<td> 1 (0.143)</td>
<td>0.1429</td>
</tr>
<tr>
<td>6</td>
<td>見せる</td>
<td>動詞</td>
<td> 1 (0.024)</td>
<td> 1 (0.143)</td>
<td>0.1429</td>
</tr>
<tr>
<td>7</td>
<td>広がる</td>
<td>動詞</td>
<td> 1 (0.024)</td>
<td> 1 (0.143)</td>
<td>0.1429</td>
</tr>
<tr>
<td>8</td>
<td>差しだす</td>
<td>動詞</td>
<td> 1 (0.024)</td>
<td> 1 (0.143)</td>
<td>0.1429</td>
</tr>
<tr>
<td>9</td>
<td>錆</td>
<td>名詞C</td>
<td> 1 (0.024)</td>
<td> 1 (0.143)</td>
<td>0.1429</td>
</tr>
<tr>
<td>10</td>
<td>山</td>
<td>名詞C</td>
<td> 1 (0.024)</td>
<td> 1 (0.143)</td>
<td>0.1429</td>
</tr>
</tbody>
</table>
<p>渕で休憩中の長九郎は蜘蛛が膝につけた糸を切り株に移すと、切り株が縁に引きずり込まれてしまい危ういところだった……といった粗筋となっている。</p>
<p>短いお話の中で属性の転倒を多用するのが昔話の特徴の一つと考えられる。</p>
<p>ここで「／」（スラッシュ）を「転倒」を意味する記号として用いる。スラッシュは様々な場面で用いられていて文脈依存的な記号という欠点もあるが、視覚的にはイメージしやすいと判断した。</p>
<p>・［長九郎｜糸：外す／身代わり］<br />・［蜘蛛｜狙い：長九郎／切り株］<br />・［やりこ｜呼び声：応答／死］</p>
<p>こういった風にお話を転がしていると分析できる。</p>
<p>蜘蛛の糸の付け先が「膝／切り株」と転倒することで長九郎の運命は「危機／生還」へと転倒する。</p>
<p>◆類似度行列</p>
<p>・[コーディング単位]を[文]に変更して[集計]。Jaccard係数がマトリクス形式で確認できる。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_038_sm_kumonoito.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="Ca_pb_038_sm_kumonoito" src="https://woodenplane.air-nifty.com/log/images/ca_pb_038_sm_kumonoito.png" alt="Ca_pb_038_sm_kumonoito" width="480" height="295" border="0" /></a></p>
<p>・ある列を選択して画面右下の[コピー（選択列）]をクリックすると、当該のキーワードに関するJaccard係数がコピーされるので、それを表計算ソフトにペーストするといった利用が可能となる。</p>
<p>※当ブログでは[コーディング単位]が[段落][H5]の場合、Jacccard係数が1.0～0.5といった結果がほとんどで、意味のない結果となった。</p>
<p>◆多次元尺度構成法</p>
<p>・[コーディング単位]を[文]に変更して実行。<br />・共起関係を確認したいキーワードを指定。<br />・次元を「2」から「3」に変更して実行、三次元のマップとした。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_038_mds_kumonoito.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="Ca_pb_038_mds_kumonoito" src="https://woodenplane.air-nifty.com/log/images/ca_pb_038_mds_kumonoito.png" alt="Ca_pb_038_mds_kumonoito" width="480" height="480" border="0" /></a></p>
<p>長九郎ややりこが渕で危機に遭遇するくだりに関連したキーワードを指定したところ、「引きずり込む」が離れた位置にプロットされた。</p>
<p>※選択するキーワードによって相対的な位置関係は変わり得る。</p>
<p>※実行すると指定したキーワードの幾つかが除外されるとメッセージが表示される。テキストのボリューム不足のためか無償版の仕様によるものか判断がつかない。<br />※当ブログの事例では「文」以外、「段落」と「H5」では除外されるキーワードが増える傾向となった。</p>
<p>◆自己組織化マップ</p>
<p>[コーディング単位]を[文]に変更して実行。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_038_som_kumonoito.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="自己組織化マップ" src="https://woodenplane.air-nifty.com/log/images/ca_pb_038_som_kumonoito.png" alt="自己組織化マップ" width="480" height="480" border="0" /></a></p>
<p>記述内容が視覚的に整理され、類似性の高い内容が近くに配置される。概ねストーリーに沿った形で各クラスターが表示される。</p>
<p>※当ブログの事例では「文」以外、「段落」と「H5」ではエラーが返される結果となった。<br />※クラスター化の計算を繰り返すため処理に時間がかかるので要注意。<br />※クラスターの配置、距離に意味はない。</p>
<p>◆トピックの推定</p>
<p>・[ツール]→[文書]→[トピックモデル]→[トピックの推定]を選択。<br />・[集計単位]を[文]に変更。<br />・[OK]ボタンをクリックすると、[トピックの推定結果]画面が表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_038_ter_kumonoito.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="トピックの推定" src="https://woodenplane.air-nifty.com/log/images/ca_pb_038_ter_kumonoito.png" alt="トピックの推定" width="480" height="293" border="0" /></a></p>
<p>・各トピックで高い確率で出現する語句がリストアップされる。<br />・[＃1]といった欄をクリックすると、文書検索画面が表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_038_ter_doc_kumonoito.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="トピックの推定・文書検索" src="https://woodenplane.air-nifty.com/log/images/ca_pb_038_ter_doc_kumonoito.png" alt="トピックの推定・文書検索" width="480" height="360" border="0" /></a></p>
<p>◆ベイズ学習による分類</p>
<p>・[ツール]→[文書]→[ベイズ学習による分類]→[外部変数から学習]を選択。<br />・[分類の単位]を[文]に変更。<br />・[学習する外部変数]は[書名]に変更する。<br />　※「タイトル」のままでもよし。<br />・[OK]ボタンをクリックすると、ファイルの保存画面が表示されるので、任意のファイル名を記述して保存する。</p>
<p>・[ツール]→[文書]→[ベイズ学習による分類]→[学習結果ファイルの内容を確認]を選択。ファイル選択画面が開くので、先ほど保存したファイルを指定して開く。すると[学習結果ファイル]画面が開くので内容の確認を行う。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_038_bl_kumonoito.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="ベイズ学習による分類" src="https://woodenplane.air-nifty.com/log/images/ca_pb_038_bl_kumonoito.png" alt="ベイズ学習による分類" width="411" height="369" border="0" /></a></p>
<p>※[学習結果を用いた自動分類]については割愛する。</p>
<p>※[トピックの推定]と[ベイズ学習による分類]は固有名詞などを強制抽出語としてあらかじめ指定しておかないと正確に分析されないケースが生じる。正式に利用したい際は有償版の購入をお勧めする。当ブログのはあくまでテストケースとしてのものである。</p>
<p>※[トピックの推定]と[ベイズ学習による分類]はコーディング・ルールに依らない分析手法となるが、筆者の能力的に追及はしない。</p>
<p>◆参考文献</p>
<p>・『日本の民話 34 石見篇』（大庭良美／編, 未来社, 1978）pp.366-368.<br />・『島根の伝説』（島根県小・中学校国語教育研究会／編, 日本標準, 1978）p.143.<br />・『日本伝説大系 第11巻 山陰（鳥取・島根）』（野村純一他, みずうみ書房, 1984）p.193.<br />・『動かして学ぶ！はじめてのテキストマイニング』（樋口耕一, ナカニシヤ出版, 2022）<br />・『社会調査のための計量テキスト分析　【第２版】　内容分析の継承と発展を目指して』（樋口耕一, ナカニシヤ出版, 2020）</p>]]></content:encoded>


<dc:subject><![CDATA[<!-- 11 //-->昔話]]></dc:subject>

<dc:creator>mitsuzakura</dc:creator>
<dc:date>2026-04-16T23:00:00+09:00</dc:date>
</item>
<item rdf:about="https://woodenplane.air-nifty.com/log/2026/04/post-1d4160.html">
<title>昔話の計量テキスト分析――岡田の婆</title>
<link>https://woodenplane.air-nifty.com/log/2026/04/post-1d4160.html</link>
<description>未来社『石見の民話』より「岡田の婆」とその類話についてKH Coderで計量テキスト分析を実施した。</description>
<content:encoded><![CDATA[<p>◆はじめに</p>
<p>以下はKH Coder（無償版：version 3.Beta.08e）を用いた昔話の計量テキスト分析である。昔話の類話の比較にツールを利用できないか試行してみた。</p>
<p>手持ちの資料が限られるため、分析の対象となる元データの文字数が少ないものの（※本来であれば5000字以上は欲しい）、分析自体は正常に処理されていると判断した。</p>
<p>KH Coderの操作に慣れる目的も兼ねて行った作業で、コーディングルールの記述の事例集、あるいは速習用のチュートリアルとしてでも読んで頂ければ……といったところである。</p>
<p>なお、KH Coderでよく用いられるのは共起ネットワークと対応分析とのことで、それ以外はおまけパートと思って頂いて構わない。操作に習熟するにはコーディングルールの記述に慣れるのが第一である。</p>
<p>◆ファイル</p>
<p>各ファイルをダウンロードしてKH Coderに読み込ませれば同様の分析が再現可能である。</p>
<p><a href="https://woodenplane.air-nifty.com/log/files/ca_pb_037_okadanobaba.xlsx" target="_blank" rel="noopener">ダウンロード - ca_pb_037_okadanobaba.xlsx</a></p>
<p><a href="https://woodenplane.air-nifty.com/log/files/ca_pb_037_codingrules.txt" target="_blank" rel="noopener">ダウンロード - ca_pb_037_codingrules.txt</a></p>
<p><a href="https://woodenplane.air-nifty.com/log/files/kh_coder_startingedition_sagyotejunsho.txt" target="_blank" rel="noopener">ダウンロード - kh_coder_startingedition_sagyotejunsho.txt</a> （※作業手順書）<br /><br />※「H5」とはHTMLでいうところのヘッダー（見出し）・レベル5で本文に相当すると考えればよい。<br />※[コーディング単位]は「文／段落／H5」から選べるが、状況に応じて適切と思われるものを選択する必要がある。処理が上手くいかないと感じた場合、コーディング単位を切り替えると上手く処理されるケースがままある。</p>
<p>※公式マニュアルでは「集計単位」という用語が使われている。共起関係について、</p>
<p>・「文」では一文単位での分析<br />・「段落」では段落単位の分析<br />・「H5」では表計算ソフトのセル単位とされ、改行を含めた一セルの中身全体が分析単位となる</p>
<p>※レファレンスでも索引で「コーディング単位」の項目は設けられていない。操作性に関わる重要項目であるものの、その仕様について不明瞭な感はある。<br />※当ブログの場合、表計算ソフトのフォーマットで読み込ませているからH5固定でいいだろうと思い込んでいたら、さにあらずだった。</p>
<p>◆あらすじ</p>
<p>・「岡田の婆」（未来社『石見の民話』）<br />猟師が山へ猟に行って日が暮れた。それで夜の明けるのを待とうと思って木の上へ登っていた。すると夜中になって猫が沢山やってきた。一匹の猫が木の下へしゃがんで木に抱きついた。次の猫はその猫の背中から肩車（びんぶく）をした。それから次々に猫が肩車をして木へ登って猟師の足を捕まえようとしたが、ちょっと届かない。その猫は、自分は帰って岡田の婆さんを連れてくると言って、ばらっと崩れ落ちて皆いなくなった。猟師が岡田のばばあと言っていたが、あそこにおるばばあは猫かしらんと思っていると、大きな猫が来て、他の猫も木の下に集まった。それから前の様にして木へ登ってきて、一番終いに後から来た大きな猫があがってきた。そして猟師の足を捕まえたので、猟師はすぐ腰へ差している鉈を抜いて手を切った。猫は悲鳴をあげて下へ落ちると、どこへともなくいなくなった。夜が明けると猟師は木から下りてきて、岡田のばばあちゅうのは前から居るが、猫だったのかしらんと思って岡田の家へ行って隙間から見ると婆さんが手の傷を舐めて（ねぶって）いる。それで、これは本当に猫じゃなかろうかと思って隙間から鉄砲で撃ち殺してしまった。その家の人は大騒ぎを始めた。近所の人も来て大騒動になった。これは猫の化物だから撃ったのだ。こうしておくと、そのうち正体を現して猫になると言って、猟師は婆さんの足を縛って庭の上に下げておいた。二日ぶりに猟師が行ってみると、やはり婆さんである。三日ぶりに行ってみると、大きな古猫になっていた。それで猟師には何のこともなかった。戸へ背をすりつけるか、柱へ背をすりつけて通る猫は飼ってもよいが、部屋の真ん中を通る様になると踊りを踊る様になる。そうなると化けるから置いてはいけないと言う。</p>
<p>・「がいだが婆」（みずうみ書房『日本伝説大系』第十一巻）<br />昔々、但馬の鐘尾にがいだが婆という婆が住んでいて、夜になると蒲生峠に出てきて旅の者を殺して食っていた。ある時、旅の者が日が暮れているのに戸を叩いてこれから峠超えをしないといけないので灯りをつけさせてくださいと入って来たそうだ。それで因幡側の村の者が言うには、この峠は上り下り五十丁もある大峠で、これから山に入るのは無理な話だから、今夜はここに泊まって夜明けにたちなさいと止めたのだけど、そうしてはおられぬ急用で、ぜひ今夜のうちにこの峠を越さないといけないと言ったそうだ。それで、それならこのバイサ（太い木の枝）を持っていきなさい。もしも夜何かが出るような事があったら、このバイサで力いっぱい殴ってやりなさいと囲炉裏の端に置いてあった薪の中から太いのを一本持たせた。旅の人は闇の中の山道をようように登りつめて、いよいよ但馬の側に降りにかかったと思った頃、何か物の気配がしたと思ったら、ギラギラ青光りするものが二つ、じーっとこっちを見ていた。旅人はこれは物に聞いている狼の目に違いないと思って大バイサを構えて身構えたところ、それが二つでなく横からも後ろの方にも青い目が狙っていた。一匹ならともかく、こう大勢ではとても敵わないと思ってそこにあった大きな木によじ登った。一番高いところまで登って下を見たところが、狼が次々に肩車をして、今にも手が届くところまで上がってきていた。それで持っていたバイサで一番上にいる狼めがけて力いっぱい殴りつけた。そうしたら、ギャアと一声吠えたと思ったら、バタバタっと皆木の下に落ちて、そのまま逃げていなくなったそうだ。旅の者は木から降りるなり、一目散に走ったら灯りが見えたから戸を叩いたところ、中から若い嫁さんが出て、旅人の話を聞いて、それはまあ恐ろしい目に遭ったものだ、まあ上がって夜が明けるまであたって行きなさいと快く言ってくれたので、上がらせてもらって囲炉裏の火にあたっていた。ところが、やがて納戸の方からうーん、うーんと病人のうめき声が聞こえてきた。この家には具合の悪い人がいるようだがと訊いたら、実はうちの婆さんがこけた拍子に大石で眉間を割って痛がっているとのことだった。それで嫁さんが立った間に納戸をそっと覗いてみたら、大きな古狼が頭を括って寝てうなっていた。旅の者はびっくりして下の村まで走って逃げた。この一軒家の婆さんのことを村の衆はがいだが婆さんと言っていたが、実は狼で人を食っていたのでがいだ虫みたいな好ましくない臭いがしていたのだろうか。</p>
<p><br />・「ばけネコばば」（偕成社『島根県の民話』）<br />昔、商人が山越えをしている内に日が暮れた。見ると山のてっぺんに高い松の木が一本生えている。商人はこの木に登って寝ることにした。夜中になると、下の方で何やら声がする。覗いてみると、山猫が十匹ばかり集まって商人を睨んで騒いでいた。あの商人、今夜の肴にもってこいだ。なんとか食う手立てはないかと。親分らしい大猫が、自分が登って落とすから、お前たちは押さえつけて噛み殺してやれ、そう言って大きな爪を松の木に立てながらざくりざくりと登ってきて、商人に飛びつこうとした。商人は懐の小刀を引き抜いて大猫のどてっ腹にズバリと突き立てた。猫はガクッとして、ニャーオ、今夜の肴は自分の手に合わんと地面に落ちてしまった。それを見た大勢の猫は我がちに登ってきたが、どいつもこいつも商人に斬られたり突かれたり、無傷の猫は一匹もいなくなった。猫たちはどうしたらよかろうと相談をはじめた。こんな手ごわい奴は庄屋婆の手にかけないと上手くいくまい。そうだそうだと相談がまとまるなり、大勢の猫は連れ立って山を下りていった。やがて麓の方からえっさえっさという駕籠かきの声が聞こえてきた。商人はこいつは油断がならないと松の木の上で待っていた。山猫どもは一丁の駕籠を担いでくると、松の木の根元に下した。庄屋婆、ここでございます。早いこと、あの人間を退治してくださいと頭の猫が言うと、駕籠の戸が開いて、中から袖の無い羽織を着た大きな白猫が手拭いを肩にかけて現れた。まん丸な目をぎょろりとさせて、お前ら、あんな人間もよく捕まえないとは役立たずばかりじゃな。待っておれ。自分が落としてやるからと白猫が言った。婆さま、どうぞ頼むと猫たちが答えた。庄屋婆と呼ばれた白猫はゆっくり松の木に登ってきた。下にいる猫らは舌なめずりしながら見上げている。商人はまたも小刀を抜いて白猫の額めがけて一突きに突いた。額を突かれてはさすがの大猫も堪らない。痛た、いくら自分でもこいつばかりは手に合わないと木の上からまくれ落ちていった。庄屋婆がやられたもので、大勢の山猫はがっかりしてしまった。放っておく訳にもいかないから婆を抱き起すと駕籠に乗せて看病しながら山から逃げ出していった。やれ助かった、ホッとした商人は早はや夜の明けるのを待って里に下りるなり庄屋の家に駆けこんだ。そうして夕べのことを残らず話した。庄屋はびっくりしたけれども、自分のところの婆さまは長いこと患っていて、そんなところへなど行くものかと笑って取りあわない。商人は心外に思って、それなら近頃婆さまの食い物は何ですかと訊くと、飯が嫌いで魚ばかり食っていると庄屋が答えると、商人はははあ、やっぱりとつぶやき、魚屋にひとっ走りして大きなブリを買ってくると庄屋に差し出した。それではこれを婆さまに差し上げてくださいと言うと、庄屋はブリを平鉢に載せて婆さまの寝ている部屋に持っていった。婆さまは鼻をくんくんさせて喜んだ。お前はいい婿だな。そこへ置いておけ。自分が後からゆっくり食べるからと言った。庄屋が唐紙を閉めて部屋を出ると、商人が婆さまの様子をちょっと覗いて見なさいというので唐紙を細めに開いて中を窺うと、今まで我が母親と思っていた婆さまが恐ろし気な白猫になってブリを頭からわじわじ噛んでいた。庄屋は驚いて刀を抜くや、唐紙を蹴って飛び込み、化け猫を斬り殺した。本当の婆さまはどうしたかと思って探したら、床の下に骨ばかり残っていた。猫が婆さまを噛み殺して自分が婆さまに化けていたのを庄屋は知らなかったのだと。</p>
<p><br />◆コーディングルール</p>
<p>※コーディングルールのキーワードは重要と判断したものを人力でピックアップしている。そのため、恣意性を伴う分析となる。</p>
<p>※活用形でなく基本形で入力する。</p>
<p>※[前処理]→[語の抽出結果を確認]でキーワードがどのように分節されているか検索すると結果の一覧[語の抽出結果]が表示される。</p>
<p>※[Result]から確認したい行をクリックして選択、画面下の[詳細表示]ボタンをクリックするとサブ画面が表示され、活用形や基本形が確認できる。</p>
<p>※昔話では「否定／肯定」「肯定／否定」と属性が変化することが多いと考え、否定詞「ない」「まい」「ぬ」「ん」、また禁止を意味する「な」を共通のコードとして設定している。</p>
<p>※[関連語検索]で否定詞の共起語の一覧を表示させたところ、日本の昔話のように掌編レベルのボリュームだと、物語の動因となる箇所に関する語句が上位に表示される傾向が強いのではないか……といった印象があり、検証作業中である。</p>
<p>※無償版では強制抽出語の指定が機能制限で事実上使用できないため以下のような手法をとっている。</p>
<p><br />＊猫<br />猫 or '山猫' or '大猫'<br />＊婆さん<br />婆さん or 'ばばあ' or 婆 or 婆さま<br />＊切る<br />切る or 突く or 斬る<br />＊古猫<br />'古猫'<br />＊がいだが婆<br />'がいだが婆'<br />＊旅人<br />旅 and 者<br />＊バイサ<br />'バイサ' or 薪<br />＊病人<br />病人 or ( 具合 and 悪い and 人 )<br />＊小刀<br />'小刀'<br />＊手ごわい<br />手ごわい or ( 手 and 合う and ない )<br />＊庄屋婆<br />'庄屋婆' or '白猫'<br />＊魚<br />魚 or ブリ<br />＊覗く<br />覗く or 窺う or ( 隙間 and 見る )</p>
<p>＊ない<br />ない<br />＊ぬ<br />ぬ<br />＊ん<br />ん<br />＊るな<br />'るな'<br />＊るまい<br />'るまい'</p>
<p>＊猟師<br />猟師<br />＊山<br />山<br />＊日<br />日<br />＊暮れる<br />暮れる<br />＊夜中<br />夜中<br />＊木<br />木<br />＊登る<br />登る<br />＊肩車<br />肩車<br />＊足<br />足<br />＊届く<br />届く<br />＊岡田<br />岡田<br />＊鉈<br />鉈<br />＊手<br />手<br />＊家<br />家<br />＊傷<br />傷<br />＊舐める<br />舐める<br />＊撃つ<br />撃つ<br />＊殺す<br />殺す<br />＊騒動<br />騒動<br />＊化物<br />化物<br />＊三日<br />三日<br />＊化ける<br />化ける<br />＊置く<br />置く<br />＊但馬<br />但馬<br />＊峠<br />峠<br />＊食う<br />食う<br />＊灯り<br />灯り<br />＊因幡<br />因幡<br />＊殴る<br />殴る<br />＊山道<br />山道<br />＊狼<br />狼<br />＊嫁<br />嫁<br />＊うめき声<br />うめき声<br />＊逃げる<br />逃げる<br />＊虫<br />虫<br />＊臭い<br />臭い<br />＊商人<br />商人<br />＊肴<br />肴<br />＊駕籠<br />駕籠<br />＊額<br />額<br />＊庄屋<br />庄屋<br />＊母親<br />母親<br />＊患う<br />患う<br />＊骨<br />骨<br />＊部屋<br />部屋<br />＊納戸<br />納戸</p>
<p><br />◆共起ネットワーク</p>
<p>・[コーディング単位]を[H5]に設定する。</p>
<p>※[描画する共起関係（edge）の選択]で「係数」を「0.2」から「0.3」に修正する。<br />※[強い共起関係ほど濃い線に]にチェックを入れる。</p>
<p>Jaccard係数が0.3以上はかなり強い共起関係にあることを示しているが、分析対象となる元データの文字数が少ないため係数が高めに出てしまう傾向にあるため、こうしている。</p>
<p>※Jaccard係数は共起関係（※ある言葉に続いて出てくる関係）の強さを表し 0≦係数≦1 の範囲の値をとる。</p>
<p>【Jaccard係数】<br />・0.1 →関連あり<br />・0.2 →強い関連あり<br />・0.3以上 →とても強い関連あり<br />※ただし、あくまで目安であって絶対ではない。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_037_con_okadanobaba.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="共起ネットワーク" src="https://woodenplane.air-nifty.com/log/images/ca_pb_037_con_okadanobaba.png" alt="共起ネットワーク" width="480" height="360" border="0" /></a></p>
<p>ざっと確認したところ、共通するキーワードが中央のサブグラフ（バブルが島状に集まった一塊）に表示され、類話によって異なるキーワードがそれぞれのサブグラフとして周辺に表示される形となっている。</p>
<p>※なお、各バブル間の距離や配置に意味はない。</p>
<p>◆対応分析</p>
<p>・[コーディング単位]を[H5]に設定する。</p>
<p>※[外部変数]は[タイトル]のまま続行。<br />※[差異が顕著なコードを分析に使用]で上位「40」とした。また[バブルプロット]にチェックを入れている。これらは文字の重なりを極力避けるためである。<br />※文字が重なって読みづらい場合、オプション画面の[コード選択]で不要なコードのチェックを外してもよい。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_037_ca_okadanobaba.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="対応分析" src="https://woodenplane.air-nifty.com/log/images/ca_pb_037_ca_okadanobaba.png" alt="対応分析" width="480" height="374" border="0" /></a></p>
<p>x、y軸上の原点（0.0）から点線が伸び交差した箇所が原点となる。原点から離れるほど特徴的なキーワードだと分析される。</p>
<p>原点付近には「猫」「肩車」「食う」といったキーワードがプロットされている。未来社版では「岡田」「古猫」「猟師」といったキーワードが原点から離れてプロットされている。偕成社版では「肴」「商人」「庄屋」といったキーワードが特徴的とされている。ハーベスト出版版では「匹見」が特徴的なキーワードとされている。みずうみ書房版では「がいだが婆」「病」「逃げる」といったキーワードが特徴的とされている。</p>
<p>◆解釈</p>
<p>千疋狼型のお話である。狼が猫になっている話もあるが、離島などでは狼の代わりに猫となるパターンが多いとされている。</p>
<p>◆階層的クラスター分析</p>
<p>・[コーディング単位]を[文]に変更、実行するとデンドログラム（樹状図）で可視化される。</p>
<p>※キーワード指定しても可。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_037_hca_okadanobaba.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="階層的クラスター分析・デンドログラム（樹状図）" src="https://woodenplane.air-nifty.com/log/images/ca_pb_037_hca_okadanobaba.png" alt="階層的クラスター分析・デンドログラム（樹状図）" width="480" height="1325" border="0" /></a> <br /><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_037_hca_gs_okadanobaba.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="階層的クラスター分析・デンドログラム（樹状図）" src="https://woodenplane.air-nifty.com/log/images/ca_pb_037_hca_gs_okadanobaba.png" alt="階層的クラスター分析・デンドログラム（樹状図）" width="480" height="1266" border="0" /></a></p>
<p>概ねストーリーに沿った内容でクラスター化されている。</p>
<p>※当ブログの場合、[コーディング単位]が[段落][H5]だと、コードを全て選択するとエラーが返される結果となった。</p>
<p>◆クロス集計</p>
<p>・[コーディング単位]を[文]に変更、[集計]する。</p>
<p>※「タイトル」で集計をかけた。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_037_crt_okadanobaba.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="クロス集計" src="https://woodenplane.air-nifty.com/log/images/ca_pb_037_crt_okadanobaba.png" alt="クロス集計" width="480" height="345" border="0" /></a></p>
<p>クロス集計をかけたところ、「猫」「がいだが婆」「庄屋婆」といったキーワードでカイ（χ）2乗値で相関関係を示す結果（※マーク）が得られた。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_037_crt_bm_okadanobaba.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="クロス集計・バブルマップ" src="https://woodenplane.air-nifty.com/log/images/ca_pb_037_crt_bm_okadanobaba.png" alt="クロス集計・バブルマップ" width="480" height="938" border="0" /></a></p>
<p>マップとして描画したところ、「猟師」「バイサ」「狼」といったキーワードの残差が大きく（濃く）表示される結果となった。バブルとしては「猫」が大きく描画された。</p>
<p>◆KWICコンコーダンス</p>
<p>現状ではテキストマイニングのツールに文脈を読む性能はないため実際に該当箇所を読んで人力で判断する他ない。KWICコンコーダンスでキーワード指定すれば指定したキーワードがどのような文脈で用いられているか一覧で抽出される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_037_kwic_okadanobaba.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="KWICコンコーダンス" src="https://woodenplane.air-nifty.com/log/images/ca_pb_037_kwic_okadanobaba.png" alt="KWICコンコーダンス" width="480" height="274" border="0" /></a> <br /><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_037_kwic_doc_okadanobaba.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="KWICコンコーダンス・文書表示" src="https://woodenplane.air-nifty.com/log/images/ca_pb_037_kwic_doc_okadanobaba.png" alt="KWICコンコーダンス・文書表示" width="480" height="509" border="0" /></a></p>
<p>◆関連語検索</p>
<p>・[集計単位]を[文]に変更、[集計]する。<br />・[Search Entry:]の一覧からキーワードを選択してダブルクリックすると[Result]に指定したキーワードの品詞や共起関係が表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_037_rws_okadanobaba.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="関連語検索" src="https://woodenplane.air-nifty.com/log/images/ca_pb_037_rws_okadanobaba.png" alt="関連語検索" width="480" height="452" border="0" /></a></p>
<p>※[Result:]から行指定してダブルクリックするとKWICコンコーダンスに遷移する。<br />※[Result:]の一覧から範囲指定して[コピー]したものを表計算ソフトやテキストファイルにペーストすることも可能である。</p>
<p>[＃直接入力]を指定して「唐紙」といったキーワードで検索すると関連語が一覧で表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_037_rws_okadanobaba_02.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="関連語検索" src="https://woodenplane.air-nifty.com/log/images/ca_pb_037_rws_okadanobaba_02.png" alt="関連語検索" width="480" height="452" border="0" /></a></p>
<p>◆属性の転倒</p>
<p>・「ない」の結果上位一覧</p>
<table width="432">
<tbody>
<tr>
<td width="72">N</td>
<td width="72">抽出語</td>
<td width="72">品詞</td>
<td width="72">全体</td>
<td width="72">共起</td>
<td width="72">Jaccard</td>
</tr>
<tr>
<td>1</td>
<td>自分</td>
<td>名詞</td>
<td> 8 (0.098)</td>
<td> 4 (0.182)</td>
<td>0.1538</td>
</tr>
<tr>
<td>2</td>
<td>思う</td>
<td>動詞</td>
<td> 11 (0.134)</td>
<td> 4 (0.182)</td>
<td>0.1379</td>
</tr>
<tr>
<td>3</td>
<td>言う</td>
<td>動詞</td>
<td> 12 (0.146)</td>
<td> 4 (0.182)</td>
<td>0.1333</td>
</tr>
<tr>
<td>4</td>
<td>落ちる</td>
<td>動詞</td>
<td> 4 (0.049)</td>
<td> 3 (0.136)</td>
<td>0.1304</td>
</tr>
<tr>
<td>5</td>
<td>婆</td>
<td>名詞C</td>
<td> 14 (0.171)</td>
<td> 4 (0.182)</td>
<td>0.125</td>
</tr>
<tr>
<td>6</td>
<td>木</td>
<td>名詞C</td>
<td> 10 (0.122)</td>
<td> 3 (0.136)</td>
<td>0.1034</td>
</tr>
<tr>
<td>7</td>
<td>庄屋</td>
<td>名詞</td>
<td> 11 (0.134)</td>
<td> 3 (0.136)</td>
<td>0.1</td>
</tr>
<tr>
<td>8</td>
<td>化ける</td>
<td>動詞</td>
<td> 2 (0.024)</td>
<td> 2 (0.091)</td>
<td>0.0909</td>
</tr>
<tr>
<td>9</td>
<td>入る</td>
<td>動詞</td>
<td> 2 (0.024)</td>
<td> 2 (0.091)</td>
<td>0.0909</td>
</tr>
<tr>
<td>10</td>
<td>村</td>
<td>名詞C</td>
<td> 3 (0.037)</td>
<td> 2 (0.091)</td>
<td>0.087</td>
</tr>
</tbody>
</table>
<p>・「ぬ」の結果上位一覧</p>
<table width="432">
<tbody>
<tr>
<td width="72">N</td>
<td width="72">抽出語</td>
<td width="72">品詞</td>
<td width="72">全体</td>
<td width="72">共起</td>
<td width="72">Jaccard</td>
</tr>
<tr>
<td>1</td>
<td>まん丸</td>
<td>形容動詞</td>
<td> 1 (0.012)</td>
<td> 1 (0.333)</td>
<td>0.3333</td>
</tr>
<tr>
<td>2</td>
<td>因幡</td>
<td>人名</td>
<td> 1 (0.012)</td>
<td> 1 (0.333)</td>
<td>0.3333</td>
</tr>
<tr>
<td>3</td>
<td>越す</td>
<td>動詞</td>
<td> 1 (0.012)</td>
<td> 1 (0.333)</td>
<td>0.3333</td>
</tr>
<tr>
<td>4</td>
<td>急用</td>
<td>名詞</td>
<td> 1 (0.012)</td>
<td> 1 (0.333)</td>
<td>0.3333</td>
</tr>
<tr>
<td>5</td>
<td>止める</td>
<td>動詞</td>
<td> 1 (0.012)</td>
<td> 1 (0.333)</td>
<td>0.3333</td>
</tr>
<tr>
<td>6</td>
<td>上る</td>
<td>動詞</td>
<td> 1 (0.012)</td>
<td> 1 (0.333)</td>
<td>0.3333</td>
</tr>
<tr>
<td>7</td>
<td>大峠</td>
<td>固有名詞</td>
<td> 1 (0.012)</td>
<td> 1 (0.333)</td>
<td>0.3333</td>
</tr>
<tr>
<td>8</td>
<td>泊まる</td>
<td>動詞</td>
<td> 1 (0.012)</td>
<td> 1 (0.333)</td>
<td>0.3333</td>
</tr>
<tr>
<td>9</td>
<td>無理</td>
<td>形容動詞</td>
<td> 1 (0.012)</td>
<td> 1 (0.333)</td>
<td>0.3333</td>
</tr>
<tr>
<td>10</td>
<td>夜明け</td>
<td>名詞</td>
<td> 1 (0.012)</td>
<td> 1 (0.333)</td>
<td>0.3333</td>
</tr>
</tbody>
</table>
<p>山中で木に登って夜を明かそうとしたところ、猫や狼に襲われたため反撃して撃退したところ、麓の家の婆さんがその親玉だった……といった粗筋となっている。</p>
<p>短いお話の中で属性の転倒を多用するのが昔話の特徴の一つと考えられる。</p>
<p>ここで「／」（スラッシュ）を「転倒」を意味する記号として用いる。スラッシュは様々な場面で用いられていて文脈依存的な記号という欠点もあるが、視覚的にはイメージしやすいと判断した。</p>
<p>・［猟師｜覗く：婆さん／猫］<br />・［猫｜肩車：届かない／届きそう］</p>
<p>こういった風にお話を転がしていると分析できる。</p>
<p>猫たちが肩車して距離が縮まり「届かない／届きそう」と転倒したところで反撃、猫の親玉は「無傷／負傷」へと転倒する。</p>
<p>◆類似度行列</p>
<p>・[コーディング単位]を[文]に変更して[集計]。Jaccard係数がマトリクス形式で確認できる。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_037_sm_okadanobaba.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="類似度行列" src="https://woodenplane.air-nifty.com/log/images/ca_pb_037_sm_okadanobaba.png" alt="類似度行列" width="480" height="295" border="0" /></a></p>
<p>・ある列を選択して画面右下の[コピー（選択列）]をクリックすると、当該のキーワードに関するJaccard係数がコピーされるので、それを表計算ソフトにペーストするといった利用が可能となる。</p>
<p>※当ブログでは[コーディング単位]が[段落][H5]の場合、Jacccard係数が1.0～0.5といった結果がほとんどで、意味のない結果となった。</p>
<p>◆多次元尺度構成法</p>
<p>・[コーディング単位]を[文]に変更して実行。<br />・共起関係を確認したいキーワードを指定。<br />・次元を「2」から「3」に変更して実行、三次元のマップとした。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_037_mds_okadanobaba.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="多次元尺度構成法" src="https://woodenplane.air-nifty.com/log/images/ca_pb_037_mds_okadanobaba.png" alt="多次元尺度構成法" width="480" height="480" border="0" /></a></p>
<p>主人公が猫や狼に襲われるくだりに関連したキーワードを指定したところ、「木」が離れた位置にプロットされた。</p>
<p>※選択するキーワードによって相対的な位置関係は変わり得る。</p>
<p>※実行すると指定したキーワードの幾つかが除外されるとメッセージが表示される。テキストのボリューム不足のためか無償版の仕様によるものか判断がつかない。<br />※当ブログの事例では「文」以外、「段落」と「H5」では除外されるキーワードが増える傾向となった。</p>
<p>◆自己組織化マップ</p>
<p>[コーディング単位]を[文]に変更して実行。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_037_som_okadanobaba.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="自己組織化マップ" src="https://woodenplane.air-nifty.com/log/images/ca_pb_037_som_okadanobaba.png" alt="自己組織化マップ" width="480" height="480" border="0" /></a></p>
<p>記述内容が視覚的に整理され、類似性の高い内容が近くに配置される。概ねストーリーに沿った形で各クラスターが表示される。</p>
<p>※当ブログの事例では「文」以外、「段落」と「H5」ではエラーが返される結果となった。<br />※クラスター化の計算を繰り返すため処理に時間がかかるので要注意。<br />※クラスターの配置、距離に意味はない。</p>
<p>◆トピックの推定</p>
<p>・[ツール]→[文書]→[トピックモデル]→[トピックの推定]を選択。<br />・[集計単位]を[文]に変更。<br />・[OK]ボタンをクリックすると、[トピックの推定結果]画面が表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_037_ter_okadanobaba.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="トピックの推定" src="https://woodenplane.air-nifty.com/log/images/ca_pb_037_ter_okadanobaba.png" alt="トピックの推定" width="480" height="293" border="0" /></a></p>
<p>・各トピックで高い確率で出現する語句がリストアップされる。<br />・[＃1]といった欄をクリックすると、文書検索画面が表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_037_ter_doc_okadanobaba.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="トピックの推定・文書検索" src="https://woodenplane.air-nifty.com/log/images/ca_pb_037_ter_doc_okadanobaba.png" alt="トピックの推定・文書検索" width="480" height="360" border="0" /></a></p>
<p>◆ベイズ学習による分類</p>
<p>・[ツール]→[文書]→[ベイズ学習による分類]→[外部変数から学習]を選択。<br />・[分類の単位]を[文]に変更。<br />・[学習する外部変数]は[書名]に変更する。<br />　※「タイトル」のままでもよし。<br />・[OK]ボタンをクリックすると、ファイルの保存画面が表示されるので、任意のファイル名を記述して保存する。</p>
<p>・[ツール]→[文書]→[ベイズ学習による分類]→[学習結果ファイルの内容を確認]を選択。ファイル選択画面が開くので、先ほど保存したファイルを指定して開く。すると[学習結果ファイル]画面が開くので内容の確認を行う。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_037_bl_okadanobaba.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="ベイズ学習による分類" src="https://woodenplane.air-nifty.com/log/images/ca_pb_037_bl_okadanobaba.png" alt="ベイズ学習による分類" width="411" height="369" border="0" /></a></p>
<p>※[学習結果を用いた自動分類]については割愛する。</p>
<p>※[トピックの推定]と[ベイズ学習による分類]は固有名詞などを強制抽出語としてあらかじめ指定しておかないと正確に分析されないケースが生じる。正式に利用したい際は有償版の購入をお勧めする。当ブログのはあくまでテストケースとしてのものである。</p>
<p>※[トピックの推定]と[ベイズ学習による分類]はコーディング・ルールに依らない分析手法となるが、筆者の能力的に追及はしない。</p>
<p>◆参考文献</p>
<p>・『日本の民話 34 石見篇』（大庭良美／編, 未来社, 1978）pp.431-432.<br />・『日本伝説大系 第11巻 山陰（鳥取・島根）』（野村純一他, みずうみ書房, 1984）pp.150-151.<br />・『島根県の民話　やまたのおろちほか』（日本児童文学者協会／編, 偕成社, 2000）pp.135-141.<br />・『動かして学ぶ！はじめてのテキストマイニング』（樋口耕一, ナカニシヤ出版, 2022）<br />・『社会調査のための計量テキスト分析　【第２版】　内容分析の継承と発展を目指して』（樋口耕一, ナカニシヤ出版, 2020）</p>]]></content:encoded>


<dc:subject><![CDATA[<!-- 11 //-->昔話]]></dc:subject>

<dc:creator>mitsuzakura</dc:creator>
<dc:date>2026-04-15T23:00:00+09:00</dc:date>
</item>
<item rdf:about="https://woodenplane.air-nifty.com/log/2026/04/post-623a69.html">
<title>昔話の計量テキスト分析――えんこうの恩返し</title>
<link>https://woodenplane.air-nifty.com/log/2026/04/post-623a69.html</link>
<description>未来社『石見の民話』より「大膳と治部」とその類話についてKH Coderで計量テキスト分析を実施した。</description>
<content:encoded><![CDATA[<p>◆はじめに</p>
<p>以下はKH Coder（無償版：version 3.Beta.08e）を用いた昔話の計量テキスト分析である。昔話の類話の比較にツールを利用できないか試行してみた。</p>
<p>手持ちの資料が限られるため、分析の対象となる元データの文字数が少ないものの（※本来であれば5000字以上は欲しい）、分析自体は正常に処理されていると判断した。</p>
<p>KH Coderの操作に慣れる目的も兼ねて行った作業で、コーディングルールの記述の事例集、あるいは速習用のチュートリアルとしてでも読んで頂ければ……といったところである。</p>
<p>なお、KH Coderでよく用いられるのは共起ネットワークと対応分析とのことで、それ以外はおまけパートと思って頂いて構わない。操作に習熟するにはコーディングルールの記述に慣れるのが第一である。</p>
<p>◆ファイル</p>
<p>各ファイルをダウンロードしてKH Coderに読み込ませれば同様の分析が再現可能である。</p>
<p><a href="https://woodenplane.air-nifty.com/log/files/ca_pb_036_enkonoongaeshi.xlsx" target="_blank" rel="noopener">ダウンロード - ca_pb_036_enkonoongaeshi.xlsx</a></p>
<p><a href="https://woodenplane.air-nifty.com/log/files/ca_pb_036_codingrules.txt" target="_blank" rel="noopener">ダウンロード - ca_pb_036_codingrules.txt</a></p>
<p><a href="https://woodenplane.air-nifty.com/log/files/kh_coder_startingedition_sagyotejunsho.txt" target="_blank" rel="noopener">ダウンロード - kh_coder_startingedition_sagyotejunsho.txt</a> （※作業手順書）</p>
<p>※「H5」とはHTMLでいうところのヘッダー（見出し）・レベル5で本文に相当すると考えればよい。<br />※[コーディング単位]は「文／段落／H5」から選べるが、状況に応じて適切と思われるものを選択する必要がある。処理が上手くいかないと感じた場合、コーディング単位を切り替えると上手く処理されるケースがままある。</p>
<p>※公式マニュアルでは「集計単位」という用語が使われている。共起関係について、</p>
<p>・「文」では一文単位での分析<br />・「段落」では段落単位の分析<br />・「H5」では表計算ソフトのセル単位とされ、改行を含めた一セルの中身全体が分析単位となる</p>
<p>※レファレンスでも索引で「コーディング単位」の項目は設けられていない。操作性に関わる重要項目であるものの、その仕様について不明瞭な感はある。<br />※当ブログの場合、表計算ソフトのフォーマットで読み込ませているからH5固定でいいだろうと思い込んでいたら、さにあらずだった。</p>
<p>◆あらすじ</p>
<p>・「大膳と治部」（未来社『石見の民話』）<br />昔、左鐙に大膳と治部という兄弟がいた。大膳は左鐙に、治部は川向こうに住んでいた。大膳はよく治部のところへ遊びに行った。すると治部のところでは、どんな雪の日でも雨風の日でも必ず生魚を出してご馳走した。大膳は不審に思って、いったいどうして手に入れるのかと尋ねた。治部の家の近くにえんこうわいと言って渕の底の岩に一間四角くらいな穴がある。ある晩治部が寝ていると誰か起こすものがある。目を開けて見ると美しい女が枕元へ来ていた。女は自分はえんこうわいにおるえんこうだが、この間の大水で金馬鍬が穴の口へ流れかかって通ることができない。それで子供を養うことが出来ずに困っている。どうか鍬を除けて下さらないか。ご恩は決して忘れないからと言った。治部は、それは除けてやらないことはないが、これからは左鐙の内で子供が一人でもえんこうに取られたという様なことがあったら承知しない。そういうことがあったら馬鍬を除けるどころか三尺の釜をもって塞いでやると言った。女はそういうことは決してしない。どうか除けてくださいと頼むので、それなら除けてやろうと言うと、女はたいそう喜んで、このことは誰にも言ってくださるなと言って帰った。明くる日、治部がえんこうわいへ行ってみると、女が言った通り馬鍬がかかっているので取りのけてやった。えんこうは金物に触ると身体が腐るので金物を恐れるのだった。ところがそれからと言うものは、夏は鮎、冬はいだという様に、朝起きてみると毎日の様に必ず魚が軒下へ吊ってあった。そういう訳でいつも生魚があるのだったが、えんこうに誰にも言わないという約束がしてあるので、言う訳にはいかない。それで大膳が尋ねても、それには訳があって言われないと治部は言った。大膳は兄弟の間で言われないということはない、言えと言う。治部はどういう事があっても言われぬと言う。そうして争っている内に大喧嘩になって、大膳はぷんぷんして帰っていった。大膳が家へ帰って昼寝をしていると治部が抜身を下げてやって来て、いきなり切りかかった。大膳は初めの内は扇子であしらっていたが、危なくなったので、女房に槍をとってくれと言った。女房は慌てて長押の槍をとって差し出す調子に、間違えて治部へ渡した。治部はその槍で大膳を突き殺してしまった。治部は家へ帰ると腹を切って死んだ。大膳は「大膳さま」と言って今も小さな祠に祀ってあるが、大膳さまは女というものはこのようにあさはかなもので、そのために自分は殺されたと言って、女をひどく嫌うので、女は参ってはいけないと言うことである。治部の墓は川向こうの田の中にあるが、そこに田を植えるときにはどんないい天気でも、雨の三粒でも降らないことはないと言う。</p>
<p><br />・「カッパのくれた石」（日本標準『島根のむかし話』）<br />とんとん昔、ある所によく働く若い者がいた。ある日、田んぼの仕事が済んだので川で鍬を洗っていたところ、田んぼへ忘れ物をしたことを思い出し、取りに行った。ところが、今度はその鍬を忘れて家に帰ってしまった。その晩、男が寝ていると、カッパがやって来た。そして、自分の家の入口にお前が忘れた鍬が引っかかって通れない。何とかして取ってくれと言った。若者はおかしなことを言うカッパだなと思ったが、知らぬふりをして寝ていた。次の晩、また同じようにカッパが来て、入口の鍬を早く取ってくれと言った。若者はやはり知らぬ顔をしていたが、明くる晩、またカッパが来て、どうか早く取ってくれ。あれを取ってもらわないと通れないと言った。これで三晩も同じことを言ってくるが、本当のことかもしれない。明日は行ってみるかと思ってその晩は寝た。あくる朝、納屋へ行ってみると、鍬が一丁なかった。ははあ、鍬を持って帰ることを忘れたのか。その鍬が流れたのだろう。と、鍬を洗った所へ行ってみると、鍬が川の中にずり込んでいた。鍬を持って帰れということだなと持って帰った。そのあくる朝、若者の入口についている木の鍵に大きな魚が引っかかっていた。あのカッパがくれたのだろうか。若者は喜んで食べた。その晩、あのカッパがまたやって来て、今日はどうもありがとう。今朝の魚はお礼だ。これから毎朝持ってくるからと言った。それから毎朝、色々な魚が掛かっていた。男は喜んで貰っていたが、どうもこの鍵が古くなって魚を掛けるのに困るだろう。鉄の鍵に替えてやろうと替えてやった。ところが、あくる日からは魚が掛かっていなかった。そうしたら、その晩、またカッパが来て、あの鍵が鉄になっているのでもう魚は掛けない。自分たちは金物が一番の苦手だ。その代わり、この石をあげる。この石を持っていると病気に罹らないと言って丸い石を置いていった。男はその石を大事に持っていたら、少しも病気をしなかった。</p>
<p><br />・「えんこうの話」（ハーベスト出版『夕陽を招く長者』）<br />昔、匹見の里に牛を飼っている婆さんがいた。牛は繋がれていたが、牛は水が飲みたくなり、離れて川に入った。ところが、川に入った牛はえんこうに足を引っ張られて驚いた拍子にえんこうを引きずって戻るなり肥えたて場に駆けこんだ。えんこうは牛を川の深みに引っ張り込むつもりが、陸へ引き出されて干からびてしまい困っていた。婆さんは牛が戻ってきたのを見て喜び、水をやろうと汲んできたが、牛が水を飲まないので、肥えたて場にその水を移した。すると、えんこうは水を貰ったお陰で川へ帰ることができた。それからえんこうは、今度は婆さんにお礼にと、毎日毎朝、魚を持ってきて、玄関の閂に掛けておくうようになった。毎日のことだから、そのうち閂が腐りはじめた。それで婆さんは金具のしっかりした閂に取り替えた。そうしたら、えんこうは魚を一向に持ってこなくなってしまった。えんこうは金物をとても恐れるというから、それで持ってこれなくなってしまったのだろう。</p>
<p><br />・「庄のカワコ屋」（みずうみ書房『日本伝説大系』第十一巻）<br />本町根雨原地内に国道一八〇号線を江府町に向かって進むと右手に日野川が並ぶところがある。この地点の日野川にショウゴの渕という深い水の淀みがある。古来、ここにカワコ（河童）が住んでいて往来の旅人を悩ませていた。明暦年間、庄村に細矢仙左衛門という川遊びが好きで泳ぎの達者な人がいた。この人がある夏の日、ショウゴの渕で川遊びをして水深く潜ったとき大きな岩のウロ（穴）の口に鍬が引っかかって口を塞いでいたので取り除いて水の流れをよくした。その翌日の朝、仙左衛門が家の門口をみると、門の柱に取り付けてある掛け木に沢山の川魚が柳の枝に刺して掛けてあった。そのときは不思議なことだと思いながらも煮たり焼いたりして食べたが、その後も毎朝このことが続いた。しばらくしてある朝のこと、例によって門の柱を見ると掛け木が折れて下に落ち、川魚の姿も見えなかったので、仙左衛門は掛け木を鉄釘に取り替えた。それ以来、柳の枝に刺した川魚の姿が見られなくなった。この話を伝え聞いた村人は仙左衛門がショウゴの渕のカワコの住家であったウロの口を掃除してやった恩返しに川魚を運んでいたのに、掛け木がカワコの嫌う鉄釘に変わったため二度と来なくなったのだとも、また他所へ住みかわったとも、あるいはそのカワコは死んだのだとも言った。このことがあって以来、細矢家のことをカワコ屋という門名で呼びだし今なお続いている。一説には仙左衛門が旅人のお産の世話をした恩返しだともいっているが真偽のほどは分からない。この細矢家の子孫が現在、荘に在住する川口作市さんである。川口さんの話によれば、明治年間に細矢姓が川口に改められたという。</p>
<p><br />◆コーディングルール</p>
<p>※コーディングルールのキーワードは重要と判断したものを人力でピックアップしている。そのため、恣意性を伴う分析となる。</p>
<p>※活用形でなく基本形で入力する。</p>
<p>※[前処理]→[語の抽出結果を確認]でキーワードがどのように分節されているか検索すると結果の一覧[語の抽出結果]が表示される。</p>
<p>※[Result]から確認したい行をクリックして選択、画面下の[詳細表示]ボタンをクリックするとサブ画面が表示され、活用形や基本形が確認できる。</p>
<p>※昔話では「否定／肯定」「肯定／否定」と属性が変化することが多いと考え、否定詞「ない」「まい」「ぬ」「ん」、また禁止を意味する「な」を共通のコードとして設定している。</p>
<p>※[関連語検索]で否定詞の共起語の一覧を表示させたところ、日本の昔話のように掌編レベルのボリュームだと、物語の動因となる箇所に関する語句が上位に表示される傾向が強いのではないか……といった印象があり、検証作業中である。</p>
<p>※無償版では強制抽出語の指定が機能制限で事実上使用できないため以下のような手法をとっている。</p>
<p><br />＊左鐙<br />'左鐙'<br />＊大膳<br />'大膳'<br />＊治部<br />'治部'<br />＊川魚<br />生魚 or 魚 or '川魚'<br />＊天気<br />雪 or 雨 or 風<br />＊穴<br />穴 or ウロ or 'えんこうわい' or 入口 or 口<br />＊えんこう<br />'えんこう' or カッパ or 'カワコ'<br />＊取る<br />取る or 掃除 or 除ける or 除く<br />＊金物<br />金物 or 鉄 or 釘<br />＊若者<br />若者 or ( 若い and 者 ) or 男<br />＊田<br />田 or 田んぼ<br />＊忘れ物<br />忘れ物 or 忘れる<br />＊鍵<br />鍵 or 閂 or '掛け木'<br />＊毎朝<br />毎朝 or 毎日<br />＊あくる日<br />あくる日 or 明くる日<br />＊匹見<br />'匹見'<br />＊日野川<br />'日野川'<br />＊仙左衛門<br />'仙左衛門'<br />＊恐れる<br />恐れる or 嫌う</p>
<p>＊ない<br />ない<br />＊ぬ<br />ぬ<br />＊ん<br />ん<br />＊るな<br />'るな'<br />＊るまい<br />'るまい'</p>
<p>＊ご馳走<br />ご馳走<br />＊渕<br />渕<br />＊底<br />底<br />＊岩<br />岩<br />＊女<br />女<br />＊鍬<br />鍬<br />＊通る<br />通る<br />＊子供<br />子供<br />＊塞ぐ<br />塞ぐ<br />＊養う<br />養う<br />＊約束<br />約束<br />＊言う<br />言う<br />＊兄弟<br />兄弟<br />＊喧嘩<br />喧嘩<br />＊女房<br />女房<br />＊槍<br />槍<br />＊間違える<br />間違える<br />＊渡す<br />渡す<br />＊切る<br />切る<br />＊殺す<br />殺す<br />＊腹<br />腹<br />＊死ぬ<br />死ぬ<br />＊祠<br />祠<br />＊墓<br />墓<br />＊川<br />川<br />＊木<br />木<br />＊お礼<br />お礼<br />＊石<br />石<br />＊病気<br />病気<br />＊牛<br />牛<br />＊婆さん<br />婆さん<br />＊引きずる<br />引きずる<br />＊干からびる<br />干からびる<br />＊水<br />水<br />＊帰る<br />帰る<br />＊腐る<br />腐る<br />＊旅人<br />旅人<br />＊住家<br />住家</p>
<p><br />◆共起ネットワーク</p>
<p>・[コーディング単位]を[H5]に設定する。</p>
<p>※[描画する共起関係（edge）の選択]で「係数」を「0.2」から「0.3」に修正する。<br />※[強い共起関係ほど濃い線に]にチェックを入れる。</p>
<p>Jaccard係数が0.3以上はかなり強い共起関係にあることを示しているが、分析対象となる元データの文字数が少ないため係数が高めに出てしまう傾向にあるため、こうしている。</p>
<p>※Jaccard係数は共起関係（※ある言葉に続いて出てくる関係）の強さを表し 0≦係数≦1 の範囲の値をとる。</p>
<p>【Jaccard係数】<br />・0.1 →関連あり<br />・0.2 →強い関連あり<br />・0.3以上 →とても強い関連あり<br />※ただし、あくまで目安であって絶対ではない。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_036_con_enkonoongaeshi.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="共起ネットワーク" src="https://woodenplane.air-nifty.com/log/images/ca_pb_036_con_enkonoongaeshi.png" alt="共起ネットワーク" width="480" height="360" border="0" /></a></p>
<p>ざっと確認したところ、共通するキーワードが中央のサブグラフ（バブルが島状に集まった一塊）に表示され、類話によって異なるキーワードがそれぞれのサブグラフとして周辺に表示される形となっている。</p>
<p>※なお、各バブル間の距離や配置に意味はない。</p>
<p>◆対応分析</p>
<p>・[コーディング単位]を[H5]に設定する。</p>
<p>※[外部変数]は[タイトル]のまま続行。<br />※[差異が顕著なコードを分析に使用]で上位「40」とした。また[バブルプロット]にチェックを入れている。これらは文字の重なりを極力避けるためである。<br />※文字が重なって読みづらい場合、オプション画面の[コード選択]で不要なコードのチェックを外してもよい。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_036_ca_enkonoongaeshi.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="対応分析" src="https://woodenplane.air-nifty.com/log/images/ca_pb_036_ca_enkonoongaeshi.png" alt="対応分析" width="480" height="374" border="0" /></a></p>
<p>x、y軸上の原点（0.0）から点線が伸び交差した箇所が原点となる。原点から離れるほど特徴的なキーワードだと分析される。</p>
<p>原点付近には「岩」「渕」「塞ぐ」といったキーワードがプロットされている。未来社版では「兄弟」「約束」「女房」といったキーワードが原点から離れてプロットされている。日本標準版では「穴」「鍬」「若者」といったキーワードが特徴的とされている。ハーベスト出版版では「匹見」が特徴的なキーワードとされている。みずうみ書房版では「日野川」「仙左衛門」といったキーワードが特徴的とされている。</p>
<p>◆解釈</p>
<p>えんこう（河童）は恩返しとして川魚を持ってくると語られている。が、金物に触れると体が腐るため嫌う習性があり、鍵を変えるといった理由で持ってくるのを止めるといった結末となることが多い。</p>
<p>◆階層的クラスター分析</p>
<p>・[コーディング単位]を[文]に変更、実行するとデンドログラム（樹状図）で可視化される。</p>
<p>※キーワード指定しても可。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_036_hca_enkonoongaeshi.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="階層的クラスター分析・デンドログラム（樹状図）" src="https://woodenplane.air-nifty.com/log/images/ca_pb_036_hca_enkonoongaeshi.png" alt="階層的クラスター分析・デンドログラム（樹状図）" width="480" height="1285" border="0" /></a> <br /><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_036_hca_gs_enkonoongaeshi.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="階層的クラスター分析・デンドログラム（樹状図）" src="https://woodenplane.air-nifty.com/log/images/ca_pb_036_hca_gs_enkonoongaeshi.png" alt="階層的クラスター分析・デンドログラム（樹状図）" width="480" height="1228" border="0" /></a></p>
<p>概ねストーリーに沿った内容でクラスター化されている。</p>
<p>※当ブログの場合、[コーディング単位]が[段落][H5]だと、コードを全て選択するとエラーが返される結果となった。</p>
<p>◆クロス集計</p>
<p>・[コーディング単位]を[文]に変更、[集計]する。</p>
<p>※「タイトル」で集計をかけた。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_036_crt_enkonoongaeshi.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="クロス集計" src="https://woodenplane.air-nifty.com/log/images/ca_pb_036_crt_enkonoongaeshi.png" alt="クロス集計" width="480" height="345" border="0" /></a></p>
<p>クロス集計をかけたところ、「大膳」「治部」「日野川」といったキーワードでカイ（χ）2乗値で相関関係を示す結果（※マーク）が得られた。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_036_crt_bm_enkonoongaeshi.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="クロス集計・バブルマップ" src="https://woodenplane.air-nifty.com/log/images/ca_pb_036_crt_bm_enkonoongaeshi.png" alt="クロス集計・バブルマップ" width="480" height="975" border="0" /></a></p>
<p>マップとして描画したところ、「婆さん」「大膳」「治部」といったキーワードの残差が大きく（濃く）表示される結果となった。バブルとしては「えんこう」「川魚」「牛」が大きく描画された。</p>
<p>◆KWICコンコーダンス</p>
<p>現状ではテキストマイニングのツールに文脈を読む性能はないため実際に該当箇所を読んで人力で判断する他ない。KWICコンコーダンスでキーワード指定すれば指定したキーワードがどのような文脈で用いられているか一覧で抽出される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_036_kwic_enkonoongaeshi.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="KWICコンコーダンス" src="https://woodenplane.air-nifty.com/log/images/ca_pb_036_kwic_enkonoongaeshi.png" alt="KWICコンコーダンス" width="480" height="274" border="0" /></a> <br /><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_036_kwic_doc_enkonoongaeshi.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="KWICコンコーダンス・文書表示" src="https://woodenplane.air-nifty.com/log/images/ca_pb_036_kwic_doc_enkonoongaeshi.png" alt="KWICコンコーダンス・文書表示" width="480" height="509" border="0" /></a></p>
<p>◆関連語検索</p>
<p>・[集計単位]を[文]に変更、[集計]する。<br />・[Search Entry:]の一覧からキーワードを選択してダブルクリックすると[Result]に指定したキーワードの品詞や共起関係が表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_036_rws_enkonoongaeshi.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="関連語検索" src="https://woodenplane.air-nifty.com/log/images/ca_pb_036_rws_enkonoongaeshi.png" alt="関連語検索" width="480" height="452" border="0" /></a></p>
<p>※[Result:]から行指定してダブルクリックするとKWICコンコーダンスに遷移する。<br />※[Result:]の一覧から範囲指定して[コピー]したものを表計算ソフトやテキストファイルにペーストすることも可能である。</p>
<p>[＃直接入力]を指定して「腐る」といったキーワードで検索すると関連語が一覧で表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_036_rws_enkonoongaeshi_02.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="関連語検索" src="https://woodenplane.air-nifty.com/log/images/ca_pb_036_rws_enkonoongaeshi_02.png" alt="関連語検索" width="480" height="452" border="0" /></a></p>
<p>◆属性の転倒</p>
<p>・「ない」の結果上位一覧</p>
<table width="432">
<tbody>
<tr>
<td width="72">N</td>
<td width="72">抽出語</td>
<td width="72">品詞</td>
<td width="72">全体</td>
<td width="72">共起</td>
<td width="72">Jaccard</td>
</tr>
<tr>
<td>1</td>
<td>言う</td>
<td>動詞</td>
<td> 21 (0.239)</td>
<td> 10 (0.400)</td>
<td>0.2778</td>
</tr>
<tr>
<td>2</td>
<td>持つ</td>
<td>動詞</td>
<td> 8 (0.091)</td>
<td> 4 (0.160)</td>
<td>0.1379</td>
</tr>
<tr>
<td>3</td>
<td>川</td>
<td>名詞C</td>
<td> 12 (0.136)</td>
<td> 4 (0.160)</td>
<td>0.1212</td>
</tr>
<tr>
<td>4</td>
<td>見る</td>
<td>動詞</td>
<td> 4 (0.045)</td>
<td> 3 (0.120)</td>
<td>0.1154</td>
</tr>
<tr>
<td>5</td>
<td>自分</td>
<td>名詞</td>
<td> 4 (0.045)</td>
<td> 3 (0.120)</td>
<td>0.1154</td>
</tr>
<tr>
<td>6</td>
<td>仙</td>
<td>地名</td>
<td> 4 (0.045)</td>
<td> 3 (0.120)</td>
<td>0.1154</td>
</tr>
<tr>
<td>7</td>
<td>鉄</td>
<td>名詞C</td>
<td> 4 (0.045)</td>
<td> 3 (0.120)</td>
<td>0.1154</td>
</tr>
<tr>
<td>8</td>
<td>左衛門</td>
<td>人名</td>
<td> 5 (0.057)</td>
<td> 3 (0.120)</td>
<td>0.1111</td>
</tr>
<tr>
<td>9</td>
<td>女</td>
<td>名詞C</td>
<td> 6 (0.068)</td>
<td> 3 (0.120)</td>
<td>0.1071</td>
</tr>
<tr>
<td>10</td>
<td>魚</td>
<td>名詞C</td>
<td> 9 (0.102)</td>
<td> 3 (0.120)</td>
<td>0.0968</td>
</tr>
</tbody>
</table>
<p>・「ぬ」の結果上位一覧</p>
<table width="432">
<tbody>
<tr>
<td width="72">N</td>
<td width="72">抽出語</td>
<td width="72">品詞</td>
<td width="72">全体</td>
<td width="72">共起</td>
<td width="72">Jaccard</td>
</tr>
<tr>
<td>1</td>
<td>出来る</td>
<td>動詞</td>
<td> 1 (0.011)</td>
<td> 1 (0.333)</td>
<td>0.3333</td>
</tr>
<tr>
<td>2</td>
<td>知る</td>
<td>動詞</td>
<td> 1 (0.011)</td>
<td> 1 (0.333)</td>
<td>0.3333</td>
</tr>
<tr>
<td>3</td>
<td>養う</td>
<td>動詞</td>
<td> 1 (0.011)</td>
<td> 1 (0.333)</td>
<td>0.3333</td>
</tr>
<tr>
<td>4</td>
<td>子供</td>
<td>名詞</td>
<td> 2 (0.023)</td>
<td> 1 (0.333)</td>
<td>0.25</td>
</tr>
<tr>
<td>5</td>
<td>困る</td>
<td>動詞</td>
<td> 3 (0.034)</td>
<td> 1 (0.333)</td>
<td>0.2</td>
</tr>
<tr>
<td>6</td>
<td>思う</td>
<td>動詞</td>
<td> 4 (0.045)</td>
<td> 1 (0.333)</td>
<td>0.1667</td>
</tr>
<tr>
<td>7</td>
<td>若者</td>
<td>名詞</td>
<td> 4 (0.045)</td>
<td> 1 (0.333)</td>
<td>0.1667</td>
</tr>
<tr>
<td>8</td>
<td>寝る</td>
<td>動詞</td>
<td> 4 (0.045)</td>
<td> 1 (0.333)</td>
<td>0.1667</td>
</tr>
<tr>
<td>9</td>
<td>カッパ</td>
<td>名詞</td>
<td> 7 (0.080)</td>
<td> 1 (0.333)</td>
<td>0.1111</td>
</tr>
<tr>
<td>10</td>
<td>言う</td>
<td>動詞</td>
<td> 21 (0.239)</td>
<td> 2 (0.667)</td>
<td>0.0909</td>
</tr>
</tbody>
</table>
<p>えんこうの住処の穴に入れるように鍬を取り除いたところ、毎朝魚が届けられるようになったが金物がきっかけで来なくなった……といった粗筋となっている。</p>
<p>短いお話の中で属性の転倒を多用するのが昔話の特徴の一つと考えられる。</p>
<p>ここで「／」（スラッシュ）を「転倒」を意味する記号として用いる。スラッシュは様々な場面で用いられていて文脈依存的な記号という欠点もあるが、視覚的にはイメージしやすいと判断した。</p>
<p>・［えんこう｜穴：入れない／入れる］<br />・［えんこう｜魚：持参／止める］<br />・［兄弟｜約束：仲良し／仲違い］</p>
<p>こういった風にお話を転がしていると分析できる。</p>
<p>えんこうとの約束がきっかけで兄弟は喧嘩、その関係が「仲良し／仲違い」と転倒してしまう。</p>
<p>◆類似度行列</p>
<p>・[コーディング単位]を[文]に変更して[集計]。Jaccard係数がマトリクス形式で確認できる。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_036_sm_enkonoongaeshi.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="類似度行列" src="https://woodenplane.air-nifty.com/log/images/ca_pb_036_sm_enkonoongaeshi.png" alt="類似度行列" width="480" height="295" border="0" /></a></p>
<p>・ある列を選択して画面右下の[コピー（選択列）]をクリックすると、当該のキーワードに関するJaccard係数がコピーされるので、それを表計算ソフトにペーストするといった利用が可能となる。</p>
<p>※当ブログでは[コーディング単位]が[段落][H5]の場合、Jacccard係数が1.0～0.5といった結果がほとんどで、意味のない結果となった。</p>
<p>◆多次元尺度構成法</p>
<p>・[コーディング単位]を[文]に変更して実行。<br />・共起関係を確認したいキーワードを指定。<br />・次元を「2」から「3」に変更して実行、三次元のマップとした。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_036_mds_enkonoongaeshi.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="多次元尺度構成法" src="https://woodenplane.air-nifty.com/log/images/ca_pb_036_mds_enkonoongaeshi.png" alt="多次元尺度構成法" width="480" height="480" border="0" /></a></p>
<p>大膳と治部とがえんこうとの約束を巡って喧嘩となるくだりに関連したキーワードを指定したところ、「殺す」「約束」が離れた位置にプロットされた。</p>
<p>※選択するキーワードによって相対的な位置関係は変わり得る。</p>
<p>※実行すると指定したキーワードの幾つかが除外されるとメッセージが表示される。テキストのボリューム不足のためか無償版の仕様によるものか判断がつかない。<br />※当ブログの事例では「文」以外、「段落」と「H5」では除外されるキーワードが増える傾向となった。</p>
<p>◆自己組織化マップ</p>
<p>[コーディング単位]を[文]に変更して実行。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_036_som_enkonoongaeshi.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="自己組織化マップ" src="https://woodenplane.air-nifty.com/log/images/ca_pb_036_som_enkonoongaeshi.png" alt="自己組織化マップ" width="480" height="480" border="0" /></a></p>
<p>記述内容が視覚的に整理され、類似性の高い内容が近くに配置される。概ねストーリーに沿った形で各クラスターが表示される。</p>
<p>※当ブログの事例では「文」以外、「段落」と「H5」ではエラーが返される結果となった。<br />※クラスター化の計算を繰り返すため処理に時間がかかるので要注意。<br />※クラスターの配置、距離に意味はない。</p>
<p>◆トピックの推定</p>
<p>・[ツール]→[文書]→[トピックモデル]→[トピックの推定]を選択。<br />・[集計単位]を[文]に変更。<br />・[OK]ボタンをクリックすると、[トピックの推定結果]画面が表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_036_ter_enkonoongaeshi.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="トピックの推定" src="https://woodenplane.air-nifty.com/log/images/ca_pb_036_ter_enkonoongaeshi.png" alt="トピックの推定" width="480" height="293" border="0" /></a></p>
<p>・各トピックで高い確率で出現する語句がリストアップされる。<br />・[＃1]といった欄をクリックすると、文書検索画面が表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_036_ter_doc_enkonoongaeshi.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="トピックの推定・文書検索" src="https://woodenplane.air-nifty.com/log/images/ca_pb_036_ter_doc_enkonoongaeshi.png" alt="トピックの推定・文書検索" width="480" height="360" border="0" /></a></p>
<p>◆ベイズ学習による分類</p>
<p>・[ツール]→[文書]→[ベイズ学習による分類]→[外部変数から学習]を選択。<br />・[分類の単位]を[文]に変更。<br />・[学習する外部変数]は[書名]に変更する。<br />　※「タイトル」のままでもよし。<br />・[OK]ボタンをクリックすると、ファイルの保存画面が表示されるので、任意のファイル名を記述して保存する。</p>
<p>・[ツール]→[文書]→[ベイズ学習による分類]→[学習結果ファイルの内容を確認]を選択。ファイル選択画面が開くので、先ほど保存したファイルを指定して開く。すると[学習結果ファイル]画面が開くので内容の確認を行う。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_036_bl_enkonoongaeshi.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="ベイズ学習による分類" src="https://woodenplane.air-nifty.com/log/images/ca_pb_036_bl_enkonoongaeshi.png" alt="ベイズ学習による分類" width="411" height="369" border="0" /></a></p>
<p>※[学習結果を用いた自動分類]については割愛する。</p>
<p>※[トピックの推定]と[ベイズ学習による分類]は固有名詞などを強制抽出語としてあらかじめ指定しておかないと正確に分析されないケースが生じる。正式に利用したい際は有償版の購入をお勧めする。当ブログのはあくまでテストケースとしてのものである。</p>
<p>※[トピックの推定]と[ベイズ学習による分類]はコーディング・ルールに依らない分析手法となるが、筆者の能力的に追及はしない。</p>
<p>◆参考文献</p>
<p>・『日本の民話 34 石見篇』（大庭良美／編, 未来社, 1978）pp.356-358.<br />・『島根のむかし話』（島根県小・中学校国語教育研究会／編著, 日本標準, 1976）pp.176-179.<br />・「夕陽を招く長者　山陰民話語り部シリーズ１」（民話の会「石見」／編, ハーベスト出版, 2013）pp.173-174.<br />・『日本伝説大系 第11巻 山陰（鳥取・島根）』（野村純一他, みずうみ書房, 1984）pp.198-199.<br />・『動かして学ぶ！はじめてのテキストマイニング』（樋口耕一, ナカニシヤ出版, 2022）<br />・『社会調査のための計量テキスト分析　【第２版】　内容分析の継承と発展を目指して』（樋口耕一, ナカニシヤ出版, 2020）</p>]]></content:encoded>


<dc:subject><![CDATA[<!-- 11 //-->昔話]]></dc:subject>

<dc:creator>mitsuzakura</dc:creator>
<dc:date>2026-04-14T23:00:00+09:00</dc:date>
</item>
<item rdf:about="https://woodenplane.air-nifty.com/log/2026/04/post-519ff7.html">
<title>出雲市以西は負のスパイラル――JR山陰本線の輸送密度</title>
<link>https://woodenplane.air-nifty.com/log/2026/04/post-519ff7.html</link>
<description>JR山陰本線の輸送密度、鳥取―出雲市間は黒字だが、出雲市以西は赤字路線となっている。</description>
<content:encoded><![CDATA[<p>人口、利用者減に危機感　山陰線利用促進協設立へ　悪循環回避へ対策急務<br /><a title="山陰中央新報：JR山陰本線の輸送密度" href="https://www.sanin-chuo.co.jp/articles/-/984132" target="_blank" rel="noopener">https://www.sanin-chuo.co.jp/articles/-/984132</a></p>
<p>鉄道の輸送密度、一日2000人が採算ラインらしいのだけど、JR山陰本線の場合、鳥取―出雲市間は黒字、出雲以西は赤字である。特に益田以西は山口線以下で厳しい数字。コロナ禍を契機にそれ以前より数字が悪化、一日の本数が減って乗客数も減る負のスパイラルに陥っている。山陰道は江津から益田までほぼ繋がったので萩石見空港にはプラスかもしれないが、JRにメリットがあるかは分からない。</p>
<p>都会の私鉄じゃないから沿線に住宅地を開発する訳にもいかないし、パーク＆ライドといった取り組みも既に行われているしで、そうそうよい解決策が出る訳もない。</p>]]></content:encoded>


<dc:subject><![CDATA[<!-- 22 //-->地域総合]]></dc:subject>

<dc:creator>mitsuzakura</dc:creator>
<dc:date>2026-04-13T23:05:00+09:00</dc:date>
</item>
<item rdf:about="https://woodenplane.air-nifty.com/log/2026/04/post-b78b83.html">
<title>昔話の計量テキスト分析――八匹の馬</title>
<link>https://woodenplane.air-nifty.com/log/2026/04/post-b78b83.html</link>
<description>未来社『石見の民話』より「八匹の馬」とその類話についてKH Coderで計量テキスト分析を行った。</description>
<content:encoded><![CDATA[<p>◆はじめに</p>
<p>以下はKH Coder（無償版：version 3.Beta.08e）を用いた昔話の計量テキスト分析である。昔話の類話の比較にツールを利用できないか試行してみた。</p>
<p>手持ちの資料が限られるため、分析の対象となる元データの文字数が少ないものの（※本来であれば5000字以上は欲しい）、分析自体は正常に処理されていると判断した。</p>
<p>KH Coderの操作に慣れる目的も兼ねて行った作業で、コーディングルールの記述の事例集、あるいは速習用のチュートリアルとしてでも読んで頂ければ……といったところである。</p>
<p>なお、KH Coderでよく用いられるのは共起ネットワークと対応分析とのことで、それ以外はおまけパートと思って頂いて構わない。操作に習熟するにはコーディングルールの記述に慣れるのが第一である。</p>
<p>◆ファイル</p>
<p>各ファイルをダウンロードしてKH Coderに読み込ませれば同様の分析が再現可能である。</p>
<p><a href="https://woodenplane.air-nifty.com/log/files/ca_pb_035_hachihikinouma.xlsx" target="_blank" rel="noopener">ダウンロード - ca_pb_035_hachihikinouma.xlsx</a></p>
<p><a href="https://woodenplane.air-nifty.com/log/files/ca_pb_035_codingrules.txt" target="_blank" rel="noopener">ダウンロード - ca_pb_035_codingrules.txt</a></p>
<p><a href="https://woodenplane.air-nifty.com/log/files/kh_coder_startingedition_sagyotejunsho.txt" target="_blank" rel="noopener">ダウンロード - kh_coder_startingedition_sagyotejunsho.txt</a> （※作業手順書）</p>
<p>※「H5」とはHTMLでいうところのヘッダー（見出し）・レベル5で本文に相当すると考えればよい。<br />※[コーディング単位]は「文／段落／H5」から選べるが、状況に応じて適切と思われるものを選択する必要がある。処理が上手くいかないと感じた場合、コーディング単位を切り替えると上手く処理されるケースがままある。</p>
<p>※公式マニュアルでは「集計単位」という用語が使われている。共起関係について、</p>
<p>・「文」では一文単位での分析<br />・「段落」では段落単位の分析<br />・「H5」では表計算ソフトのセル単位とされ、改行を含めた一セルの中身全体が分析単位となる</p>
<p>※レファレンスでも索引で「コーディング単位」の項目は設けられていない。操作性に関わる重要項目であるものの、その仕様について不明瞭な感はある。<br />※当ブログの場合、表計算ソフトのフォーマットで読み込ませているからH5固定でいいだろうと思い込んでいたら、さにあらずだった。</p>
<p>◆あらすじ</p>
<p>・「八匹の馬」（未来社『石見の民話』）<br />彦八の旦那のところへ商人が一夜宿を借りた。夕飯を食べながら色々話すうちに商人が、旦那様、今日自分が来る道でタノキのマタへ烏が巣をかけていたと言った。旦那がそんな馬鹿げた話をしなさんなと言った。いや、嘘ではない。本当であると商人が言ったので、もし本当でなかったら、お前の荷をみんな置いていけ。もし自分が負けたら八匹の馬がいるから皆あげようと旦那が言った。旦那と商人は手を打って約束をした。朝になると旦那と商人は飯も食わずに出かけた。旦那が商人について行くと、田の中に木があって、木の股に烏が巣をかけていた。旦那、あれを見よ。田の木の股に烏が巣を作っておろうと商人が言った。旦那は狸はどこにいるかね。狸なんぞいはしないじゃないかと言うと、商人は狸の話など誰もしはしない。自分が言ったのは田の木の股と言ったのだと言った。旦那の負けになった。そこで旦那はこっそり彦八を呼びにやった。そして訳を話し、お前はこれの下男ということになって上手くやってくれと頼むと、彦八はポンと膝を打って、それは自分が引き受けようと言って、本当の下男を呼んで駄屋から一番痩せた馬を出させ、庭の植木鉢に縄をかけて引っ張らせ、商人さん、さあハチヒキの馬をあげるから受け取れと言った。商人は話が違うが、まあいいと思って馬を引っ張って出ると、商人さん、お前の荷は置いていけ、八引く二（荷）が残るということがあるからと言って、とうとう商人の荷を取り上げてしまった。</p>
<p><br />・「たのきのまたのハチのす」（日本標準『島根のむかし話』）<br />昔、彦八が旦那のところへ話に行った。彦八、何か面白い話はないかと聞かれたので、はい、あります。ここへ来るときに、たのきのまたに蜂が巣をかけていましたと答えたら、彦八、それは嘘ではないかと返されたので、いえ、嘘ではありません。嘘だと思うなら行ってみましょうとなり、旦那と連れ立って行ったところ、ちょうど田の中に木があった。その木の股に蜂が巣をかけていた。そこで彦八が、ほら、田の木の股に蜂が巣をかけているでしょうと言った。旦那は大笑いしたそうな。</p>
<p><br />・「たの吉とうわばみ」（日本標準『島根のむかし話』）<br />昔々、この辺にたの吉という踊りの上手い男がいた。ある年、隣村で踊りを始めようとしたら、早く帰りなさい。嬶が病気になったからと使いの者が来た。たの吉はそれは大変だ。すぐ帰ると帰る用意をした。ところが、傍の者が今から帰ると山の中で日が暮れる。あの山の中には大きなうわばみが出るということだ。明日の朝になって帰ればいいと止めたが、どうしても帰ると言うものだから、それなら気をつけて帰りなさいと言って帰らせた。たの吉が山の中まで来ると、もう真っ暗になってしまった。松明に火をつけて峠の方へ歩いていくと、先の方でフーッ、フーッと声がする。あれまあ、こいつがあのうわばみではないかと思ってぶるぶる震えたけれど、仕方ない。運が良ければ通られるだろうし、悪ければ食われてしまうとそろそろ歩いていった。そうしたら、うわばみがお前は誰だ。ものを言って通れと言った。俺はたの吉だ。これから帰るところだと震え震え言った。すると、うわばみが何を聞き間違えたものやら、何、タヌキだと。タヌキなら化けるだろう。ひとつ何でもいいから化けてみよと言った。たの吉はそれなら化けるから、あっちを向いていて下さい。こっちを向いていると、震えて化けられないと答えた。うわばみが向こうを見ている間に、たの吉は風呂敷の中に入れておいた芝居の着物を着て娘の面を被った。もういいぞ。ほら、どうかねと言った。うわばみはびっくりして、何と綺麗な娘さんだこと。それなら、ここを通ってもいいと言ったものだから、たの吉は帰ろうとした。それなら自分はこれで帰りますが、ひとつ聞きたいことがある。それは他でもない、お前さんのようなものはこの世で恐ろしいものはいないだろうと言うと、そんなことはない。やはりある。それは松やにだ。あれはどうしても自分の手に負えないと答えた。ほーん、松やにか。自分は銭だ。銭があると心配したり喧嘩したり。銭が一番恐ろしいと言って帰った。帰ってみると、嬶の加減はよかった。それから大分してから、なんと、あの山にいるうわばみをやっつけることはできないものかと相談があった。たの吉はそれを聞いて、それは自分が知っている。あのうわばみは松やにが嫌いだ。松やにをうわばみの穴に流しさえすれば退治できると教えてやった。あくる日、松やにを集めて、うわばみが寝ている穴にどろどろ、どろどろと流し込んだ。うわばみは苦しくて苦しくて三日三晩唸っていた。それから少しして、たの吉が寝ていると、ドシーンと音がしたかと思うと、この間の仕返しだと言った者があった。たの吉が戸を開けてみると、なんと、入口に銭が一杯入った俵が積んであった。</p>
<p><br />◆コーディングルール</p>
<p>※コーディングルールのキーワードは重要と判断したものを人力でピックアップしている。そのため、恣意性を伴う分析となる。</p>
<p>※活用形でなく基本形で入力する。</p>
<p>※[前処理]→[語の抽出結果を確認]でキーワードがどのように分節されているか検索すると結果の一覧[語の抽出結果]が表示される。</p>
<p>※[Result]から確認したい行をクリックして選択、画面下の[詳細表示]ボタンをクリックするとサブ画面が表示され、活用形や基本形が確認できる。</p>
<p>※昔話では「否定／肯定」「肯定／否定」と属性が変化することが多いと考え、否定詞「ない」「まい」「ぬ」「ん」、また禁止を意味する「な」を共通のコードとして設定している。</p>
<p>※[関連語検索]で否定詞の共起語の一覧を表示させたところ、日本の昔話のように掌編レベルのボリュームだと、物語の動因となる箇所に関する語句が上位に表示される傾向が強いのではないか……といった印象があり、検証作業中である。</p>
<p>※無償版では強制抽出語の指定が機能制限で事実上使用できないため以下のような手法をとっている。</p>
<p><br />＊彦八<br />'彦八'<br />＊タノキ<br />タノキ or ( 田 and 木 )<br />＊マタ<br />マタ or 股<br />＊嘘<br />嘘 or 馬鹿げた<br />＊八<br />八 or 鉢<br />＊荷<br />荷 or 二<br />＊八匹<br />'八匹' or 'ハチヒキ' or ( 鉢 and 引っ張る )<br />＊負け<br />負け or 負ける<br />＊駄屋<br />'駄屋'<br />＊たの吉<br />'たの吉'<br />＊うわばみ<br />'うわばみ'<br />＊狸<br />狸 or タヌキ</p>
<p>＊ない<br />ない<br />＊ぬ<br />ぬ<br />＊ん<br />ん<br />＊るな<br />'るな'<br />＊るまい<br />'るまい'</p>
<p>＊旦那<br />旦那<br />＊商人<br />商人<br />＊烏<br />烏<br />＊巣<br />巣<br />＊馬<br />馬<br />＊約束<br />約束<br />＊取り上げる<br />取り上げる<br />＊引く<br />引く<br />＊蜂<br />蜂<br />＊大笑い<br />大笑い<br />＊踊り<br />踊り<br />＊隣村<br />隣村<br />＊嬶<br />嬶<br />＊使い<br />使い<br />＊山<br />山<br />＊化ける<br />化ける<br />＊風呂敷<br />風呂敷<br />＊芝居<br />芝居<br />＊着物<br />着物<br />＊娘<br />娘<br />＊面<br />面<br />＊食う<br />食う<br />＊通る<br />通る<br />＊恐ろしい<br />恐ろしい<br />＊松やに<br />松やに<br />＊銭<br />銭<br />＊穴<br />穴<br />＊苦しい<br />苦しい<br />＊仕返し<br />仕返し<br />＊俵<br />俵</p>
<p><br />※語呂合わせが多用されていて悩ましいところである。</p>
<p>◆共起ネットワーク</p>
<p>・[コーディング単位]を[H5]に設定する。</p>
<p>※[描画する共起関係（edge）の選択]で「係数」を「0.2」から「0.3」に修正する。<br />※[強い共起関係ほど濃い線に]にチェックを入れる。</p>
<p>Jaccard係数が0.3以上はかなり強い共起関係にあることを示しているが、分析対象となる元データの文字数が少ないため係数が高めに出てしまう傾向にあるため、こうしている。</p>
<p>※Jaccard係数は共起関係（※ある言葉に続いて出てくる関係）の強さを表し 0≦係数≦1 の範囲の値をとる。</p>
<p>【Jaccard係数】<br />・0.1 →関連あり<br />・0.2 →強い関連あり<br />・0.3以上 →とても強い関連あり<br />※ただし、あくまで目安であって絶対ではない。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_035_con_hachihikinouma.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="共起ネットワーク" src="https://woodenplane.air-nifty.com/log/images/ca_pb_035_con_hachihikinouma.png" alt="共起ネットワーク" width="480" height="360" border="0" /></a></p>
<p>ざっと確認したところ、共通するキーワードが中央のサブグラフ（バブルが島状に集まった一塊）に表示され、類話によって異なるキーワードがそれぞれのサブグラフとして周辺に表示される形となっている。</p>
<p>※なお、各バブル間の距離や配置に意味はない。</p>
<p>◆対応分析</p>
<p>・[コーディング単位]を[H5]に設定する。</p>
<p>※[外部変数]は[タイトル]のまま続行。<br />※[差異が顕著なコードを分析に使用]で上位「40」とした。また[バブルプロット]にチェックを入れている。これらは文字の重なりを極力避けるためである。<br />※文字が重なって読みづらい場合、オプション画面の[コード選択]で不要なコードのチェックを外してもよい。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_035_ca_hachihikinouma.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="対応分析" src="https://woodenplane.air-nifty.com/log/images/ca_pb_035_ca_hachihikinouma.png" alt="対応分析" width="480" height="374" border="0" /></a></p>
<p>x、y軸上の原点（0.0）から点線が伸び交差した箇所が原点となる。原点から離れるほど特徴的なキーワードだと分析される。</p>
<p>原点付近には「狸」「食う」といったキーワードがプロットされている。未来社版では「商人」「八匹」「取り上げる」といったキーワードが原点から離れてプロットされている。日本標準版では「蜂」「大笑い」あるいは「うわばみ」「松やに」「化ける」といったキーワードが特徴的とされている。</p>
<p>◆解釈</p>
<p>狸をタノキと読むことに由来する笑話である。</p>
<p>◆階層的クラスター分析</p>
<p>・[コーディング単位]を[文]に変更、実行するとデンドログラム（樹状図）で可視化される。</p>
<p>※キーワード指定しても可。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_035_hca_hachihikinouma.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="階層的クラスター分析・デンドログラム（樹状図）" src="https://woodenplane.air-nifty.com/log/images/ca_pb_035_hca_hachihikinouma.png" alt="階層的クラスター分析・デンドログラム（樹状図）" width="480" height="985" border="0" /></a> <br /><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_035_hca_gs_hachihikinouma.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="階層的クラスター分析・デンドログラム（樹状図）" src="https://woodenplane.air-nifty.com/log/images/ca_pb_035_hca_gs_hachihikinouma.png" alt="階層的クラスター分析・デンドログラム（樹状図）" width="480" height="985" border="0" /></a></p>
<p>概ねストーリーに沿った内容でクラスター化されている。</p>
<p>※当ブログの場合、[コーディング単位]が[段落][H5]だと、コードを全て選択するとエラーが返される結果となった。</p>
<p>◆クロス集計</p>
<p>・[コーディング単位]を[文]に変更、[集計]する。</p>
<p>※「タイトル」で集計をかけた。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_035_crt_hachihikinouma.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="クロス集計" src="https://woodenplane.air-nifty.com/log/images/ca_pb_035_crt_hachihikinouma.png" alt="クロス集計" width="480" height="345" border="0" /></a></p>
<p>クロス集計をかけたところ、「彦八」「タノキ」「嘘」といったキーワードでカイ（χ）2乗値で相関関係を示す結果（※マーク）が得られた。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_035_crt_bm_hachihikinouma.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="クロス集計・バブルマップ" src="https://woodenplane.air-nifty.com/log/images/ca_pb_035_crt_bm_hachihikinouma.png" alt="クロス集計・バブルマップ" width="480" height="769" border="0" /></a></p>
<p>マップとして描画したところ、「商人」「大笑い」といったキーワードの残差が大きく（濃く）表示される結果となった。バブルとしては「彦八」「旦那」が大きく描画された。</p>
<p>◆KWICコンコーダンス</p>
<p>現状ではテキストマイニングのツールに文脈を読む性能はないため実際に該当箇所を読んで人力で判断する他ない。KWICコンコーダンスでキーワード指定すれば指定したキーワードがどのような文脈で用いられているか一覧で抽出される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_035_kwic_hachihikinouma.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="KWICコンコーダンス" src="https://woodenplane.air-nifty.com/log/images/ca_pb_035_kwic_hachihikinouma.png" alt="KWICコンコーダンス" width="480" height="274" border="0" /></a> <br /><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_035_kwic_doc_hachihikinouma.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="KWICコンコーダンス・文書表示" src="https://woodenplane.air-nifty.com/log/images/ca_pb_035_kwic_doc_hachihikinouma.png" alt="KWICコンコーダンス・文書表示" width="480" height="509" border="0" /></a></p>
<p>◆関連語検索</p>
<p>・[集計単位]を[文]に変更、[集計]する。<br />・[Search Entry:]の一覧からキーワードを選択してダブルクリックすると[Result]に指定したキーワードの品詞や共起関係が表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_035_rws_hachihikinouma.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="関連語検索" src="https://woodenplane.air-nifty.com/log/images/ca_pb_035_rws_hachihikinouma.png" alt="関連語検索" width="480" height="452" border="0" /></a></p>
<p>※[Result:]から行指定してダブルクリックするとKWICコンコーダンスに遷移する。<br />※[Result:]の一覧から範囲指定して[コピー]したものを表計算ソフトやテキストファイルにペーストすることも可能である。</p>
<p>[＃直接入力]を指定して「下男」といったキーワードで検索すると関連語が一覧で表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_035_rws_hachihikinouma_02.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="関連語検索" src="https://woodenplane.air-nifty.com/log/images/ca_pb_035_rws_hachihikinouma_02.png" alt="関連語検索" width="480" height="452" border="0" /></a></p>
<p>◆属性の転倒</p>
<p>・「ない」の結果上位一覧</p>
<table width="432">
<tbody>
<tr>
<td width="72">N</td>
<td width="72">抽出語</td>
<td width="72">品詞</td>
<td width="72">全体</td>
<td width="72">共起</td>
<td width="72">Jaccard</td>
</tr>
<tr>
<td>1</td>
<td>答える</td>
<td>動詞</td>
<td> 3 (0.043)</td>
<td> 3 (0.273)</td>
<td>0.2727</td>
</tr>
<tr>
<td>2</td>
<td>話</td>
<td>サ変名詞</td>
<td> 5 (0.072)</td>
<td> 3 (0.273)</td>
<td>0.2308</td>
</tr>
<tr>
<td>3</td>
<td>嘘</td>
<td>名詞C</td>
<td> 3 (0.043)</td>
<td> 2 (0.182)</td>
<td>0.1667</td>
</tr>
<tr>
<td>4</td>
<td>震える</td>
<td>動詞</td>
<td> 3 (0.043)</td>
<td> 2 (0.182)</td>
<td>0.1667</td>
</tr>
<tr>
<td>5</td>
<td>言う</td>
<td>動詞</td>
<td> 19 (0.275)</td>
<td> 4 (0.364)</td>
<td>0.1538</td>
</tr>
<tr>
<td>6</td>
<td>彦</td>
<td>未知語</td>
<td> 7 (0.101)</td>
<td> 2 (0.182)</td>
<td>0.125</td>
</tr>
<tr>
<td>7</td>
<td>商人</td>
<td>名詞</td>
<td> 10 (0.145)</td>
<td> 2 (0.182)</td>
<td>0.1053</td>
</tr>
<tr>
<td>8</td>
<td>あれ</td>
<td>感動詞</td>
<td> 1 (0.014)</td>
<td> 1 (0.091)</td>
<td>0.0909</td>
</tr>
<tr>
<td>9</td>
<td>この世</td>
<td>名詞</td>
<td> 1 (0.014)</td>
<td> 1 (0.091)</td>
<td>0.0909</td>
</tr>
<tr>
<td>10</td>
<td>はい</td>
<td>感動詞</td>
<td> 1 (0.014)</td>
<td> 1 (0.091)</td>
<td>0.0909</td>
</tr>
</tbody>
</table>
<p>狸とタノキと読む地方ならではの勘違いで一本とられてしまう……といった粗筋となっている。</p>
<p>短いお話の中で属性の転倒を多用するのが昔話の特徴の一つと考えられる。</p>
<p>ここで「／」（スラッシュ）を「転倒」を意味する記号として用いる。スラッシュは様々な場面で用いられていて文脈依存的な記号という欠点もあるが、視覚的にはイメージしやすいと判断した。</p>
<p>・［旦那｜馬：取られる／取り返す］<br />・［旦那｜タノキ：疑い／笑い］<br />・［うわばみ｜認識：たの吉／狸／娘］<br />・［うわばみ｜仕返し：苦手／銭］</p>
<p>こういった風にお話を転がしていると分析できる。</p>
<p>「狸／タノキ」と転倒させてしまうことで騙したり笑いをとったりしている。</p>
<p>◆類似度行列</p>
<p>・[コーディング単位]を[文]に変更して[集計]。Jaccard係数がマトリクス形式で確認できる。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_035_sm_hachihikinouma.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="類似度行列" src="https://woodenplane.air-nifty.com/log/images/ca_pb_035_sm_hachihikinouma.png" alt="類似度行列" width="480" height="295" border="0" /></a></p>
<p>・ある列を選択して画面右下の[コピー（選択列）]をクリックすると、当該のキーワードに関するJaccard係数がコピーされるので、それを表計算ソフトにペーストするといった利用が可能となる。</p>
<p>※当ブログでは[コーディング単位]が[段落][H5]の場合、Jacccard係数が1.0～0.5といった結果がほとんどで、意味のない結果となった。</p>
<p>◆多次元尺度構成法</p>
<p>・[コーディング単位]を[文]に変更して実行。<br />・共起関係を確認したいキーワードを指定。<br />・次元を「2」から「3」に変更して実行、三次元のマップとした。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_035_mds_hachihikinouma.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="多次元尺度構成法" src="https://woodenplane.air-nifty.com/log/images/ca_pb_035_mds_hachihikinouma.png" alt="多次元尺度構成法" width="480" height="480" border="0" /></a></p>
<p>たの吉が山でうわばみに遭遇するくだりに関連したキーワードを指定したところ、「通る」が離れた位置にプロットされた。</p>
<p>※選択するキーワードによって相対的な位置関係は変わり得る。</p>
<p>※実行すると指定したキーワードの幾つかが除外されるとメッセージが表示される。テキストのボリューム不足のためか無償版の仕様によるものか判断がつかない。<br />※当ブログの事例では「文」以外、「段落」と「H5」では除外されるキーワードが増える傾向となった。</p>
<p>◆自己組織化マップ</p>
<p>[コーディング単位]を[文]に変更して実行。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_035_som_hachihikinouma.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="自己組織化マップ" src="https://woodenplane.air-nifty.com/log/images/ca_pb_035_som_hachihikinouma.png" alt="自己組織化マップ" width="480" height="480" border="0" /></a></p>
<p>記述内容が視覚的に整理され、類似性の高い内容が近くに配置される。概ねストーリーに沿った形で各クラスターが表示される。</p>
<p>※当ブログの事例では「文」以外、「段落」と「H5」ではエラーが返される結果となった。<br />※クラスター化の計算を繰り返すため処理に時間がかかるので要注意。<br />※クラスターの配置、距離に意味はない。</p>
<p>◆トピックの推定</p>
<p>・[ツール]→[文書]→[トピックモデル]→[トピックの推定]を選択。<br />・[集計単位]を[文]に変更。<br />・[OK]ボタンをクリックすると、[トピックの推定結果]画面が表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_035_ter_hachihikinouma.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="トピックの推定" src="https://woodenplane.air-nifty.com/log/images/ca_pb_035_ter_hachihikinouma.png" alt="トピックの推定" width="480" height="293" border="0" /></a></p>
<p>・各トピックで高い確率で出現する語句がリストアップされる。<br />・[＃1]といった欄をクリックすると、文書検索画面が表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_035_ter_doc_hachihikinouma.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="トピックの推定・文書検索" src="https://woodenplane.air-nifty.com/log/images/ca_pb_035_ter_doc_hachihikinouma.png" alt="トピックの推定・文書検索" width="480" height="360" border="0" /></a></p>
<p>◆ベイズ学習による分類</p>
<p>・[ツール]→[文書]→[ベイズ学習による分類]→[外部変数から学習]を選択。<br />・[分類の単位]を[文]に変更。<br />・[学習する外部変数]は[書名]に変更する。<br />　※「タイトル」のままでもよし。<br />・[OK]ボタンをクリックすると、ファイルの保存画面が表示されるので、任意のファイル名を記述して保存する。</p>
<p>・[ツール]→[文書]→[ベイズ学習による分類]→[学習結果ファイルの内容を確認]を選択。ファイル選択画面が開くので、先ほど保存したファイルを指定して開く。すると[学習結果ファイル]画面が開くので内容の確認を行う。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_035_bl_hachihikinouma.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="ベイズ学習による分類" src="https://woodenplane.air-nifty.com/log/images/ca_pb_035_bl_hachihikinouma.png" alt="ベイズ学習による分類" width="411" height="369" border="0" /></a></p>
<p>※[学習結果を用いた自動分類]については割愛する。</p>
<p>※[トピックの推定]と[ベイズ学習による分類]は固有名詞などを強制抽出語としてあらかじめ指定しておかないと正確に分析されないケースが生じる。正式に利用したい際は有償版の購入をお勧めする。当ブログのはあくまでテストケースとしてのものである。</p>
<p>※[トピックの推定]と[ベイズ学習による分類]はコーディング・ルールに依らない分析手法となるが、筆者の能力的に追及はしない。</p>
<p>◆参考文献<br />・『日本の民話 34 石見篇』（大庭良美／編, 未来社, 1978）pp.324-325.<br />・『島根のむかし話』（島根県小・中学校国語教育研究会／編著, 日本標準, 1976）pp.185-190, 214.<br />・『動かして学ぶ！はじめてのテキストマイニング』（樋口耕一, ナカニシヤ出版, 2022）<br />・『社会調査のための計量テキスト分析　【第２版】　内容分析の継承と発展を目指して』（樋口耕一, ナカニシヤ出版, 2020）</p>]]></content:encoded>


<dc:subject><![CDATA[<!-- 11 //-->昔話]]></dc:subject>

<dc:creator>mitsuzakura</dc:creator>
<dc:date>2026-04-13T23:00:00+09:00</dc:date>
</item>
<item rdf:about="https://woodenplane.air-nifty.com/log/2026/04/post-f4cfef.html">
<title>昔話の計量テキスト分析――話は彦八</title>
<link>https://woodenplane.air-nifty.com/log/2026/04/post-f4cfef.html</link>
<description>未来社『石見の民話』より「話は彦八」とその類和についてKH Coderで計量テキスト分析を実施した。</description>
<content:encoded><![CDATA[<p>◆はじめに</p>
<p>以下はKH Coder（無償版：version 3.Beta.08e）を用いた昔話の計量テキスト分析である。昔話の類話の比較にツールを利用できないか試行してみた。</p>
<p>手持ちの資料が限られるため、分析の対象となる元データの文字数が少ないものの（※本来であれば5000字以上は欲しい）、分析自体は正常に処理されていると判断した。</p>
<p>KH Coderの操作に慣れる目的も兼ねて行った作業で、コーディングルールの記述の事例集、あるいは速習用のチュートリアルとしてでも読んで頂ければ……といったところである。</p>
<p>なお、KH Coderでよく用いられるのは共起ネットワークと対応分析とのことで、それ以外はおまけパートと思って頂いて構わない。操作に習熟するにはコーディングルールの記述に慣れるのが第一である。</p>
<p>◆ファイル</p>
<p>各ファイルをダウンロードしてKH Coderに読み込ませれば同様の分析が再現可能である。</p>
<p><a href="https://woodenplane.air-nifty.com/log/files/ca_pb_034_hanashihahikohachi.xlsx" target="_blank" rel="noopener">ダウンロード - ca_pb_034_hanashihahikohachi.xlsx</a></p>
<p><a href="https://woodenplane.air-nifty.com/log/files/ca_pb_034_codingrules.txt" target="_blank" rel="noopener">ダウンロード - ca_pb_034_codingrules.txt</a></p>
<p><a href="https://woodenplane.air-nifty.com/log/files/kh_coder_startingedition_sagyotejunsho.txt" target="_blank" rel="noopener">ダウンロード - kh_coder_startingedition_sagyotejunsho.txt</a> （※作業手順書）</p>
<p>※「H5」とはHTMLでいうところのヘッダー（見出し）・レベル5で本文に相当すると考えればよい。<br />※[コーディング単位]は「文／段落／H5」から選べるが、状況に応じて適切と思われるものを選択する必要がある。処理が上手くいかないと感じた場合、コーディング単位を切り替えると上手く処理されるケースがままある。</p>
<p>※公式マニュアルでは「集計単位」という用語が使われている。共起関係について、</p>
<p>・「文」では一文単位での分析<br />・「段落」では段落単位の分析<br />・「H5」では表計算ソフトのセル単位とされ、改行を含めた一セルの中身全体が分析単位となる</p>
<p>※レファレンスでも索引で「コーディング単位」の項目は設けられていない。操作性に関わる重要項目であるものの、その仕様について不明瞭な感はある。<br />※当ブログの場合、表計算ソフトのフォーマットで読み込ませているからH5固定でいいだろうと思い込んでいたら、さにあらずだった。</p>
<p>◆あらすじ</p>
<p>・「話は彦八」（未来社『石見の民話』）<br />「話は彦八」と言われるくらいに話上手な彦八という男がいた。その話はみな作り話で、それがまたまじめくさって話すので本気で聞いていると、しまいになって、ああ、かつがれたと気がつくのであった。彦八はある時さる物持ちの楽隠居のところへ行った。入るとすぐ隠居が彦八、何か話せと注文した。いや、話すまい。旦那は聞いた後で、いつでも彦八それは嘘ではないかと言うから、自分にとっては張り合いがないと彦八は断った。いや今日は決してそのような事は言わない。証として、違約したらこの大判を彦八にやると隠居は机の上にあったピカピカする大判を一枚、彦八の前へ出した。しからば話そう。これはつくり話などではなく、また聞いた話でもなく、自分の実見談だから、そのつもりで聞くように。先日自分が浅利の長良屋へ用事があって参る途中、江川の川端で渡し舟を待っていた。ところが自分より先に侍が一人、供を連れて両掛に腰をかけて同じく渡し舟を待っていた。すると松の枝にとまっていた烏が糞をして侍の羽織を汚した。汚らわしいと侍はその羽織を脱ぐが早いか江川に投げ捨てて、両掛から羽織を出させてきちんと着て待っている。ところがまた烏が糞を手の甲にぺたんとやった。汚らわしいと侍は腰の刀を抜くが早いか、自分の手首をすぱっと切って江川に投げ込み、両掛から手を出してぺったり継いで泰然と腰を掛けて待っている。ところがまた烏が糞を、ところもあろうに侍の頭に落とした。侍はむっと腹をたてて、またぞろ一刀抜くが早いか、えいっと首を打ち落として、これまた汚らわしいと江川に投げ入れ、両掛から替えの首を出し、ぐっと継いで泰然自若、待っていた。その有様はいかにも昔物語の英雄豪傑の態度、ものに驚かぬ自分も感嘆、待った渡し舟が来たのも気づかず眺めていたと言った。彦八、それは嘘ではないかと隠居が思わず言ったので、はい、この大判、まことにありがたく頂戴いたしますと言って、彦八は大判を懐にしまった。</p>
<p><br />・「はなせば落ちる」（日本標準『島根のむかし話』）<br />昔々、彦八といってとても頓智の上手な男がいた。ある日、旦那のところへ話に行った。その旦那は話が上手かった。彦八、何か面白い話はないかと言われたので、彦八がこの間、大阪の鴻池へ行ったと答えたら、それでどうしたと聞かれたので、鴻池に大きな池があって、その横に格好の良い松があったので一の枝に登ったと答えた。それからと聞かれたので、次の二の枝に登ったら大分面白いところが見えたと答えた。それからと聞かれたので、三の枝まで登ると大阪の様子が見えたがと言ってから彦八が何も言わなくなってしまった。そこで旦那が、彦八、その先を話せと言ったところ、彦八は、いや、はなせば落ちると言った。</p>
<p><br />◆コーディングルール</p>
<p>※コーディングルールのキーワードは重要と判断したものを人力でピックアップしている。そのため、恣意性を伴う分析となる。</p>
<p>※活用形でなく基本形で入力する。</p>
<p>※[前処理]→[語の抽出結果を確認]でキーワードがどのように分節されているか検索すると結果の一覧[語の抽出結果]が表示される。</p>
<p>※[Result]から確認したい行をクリックして選択、画面下の[詳細表示]ボタンをクリックするとサブ画面が表示され、活用形や基本形が確認できる。</p>
<p>※昔話では「否定／肯定」「肯定／否定」と属性が変化することが多いと考え、否定詞「ない」「まい」「ぬ」「ん」、また禁止を意味する「な」を共通のコードとして設定している。</p>
<p>※[関連語検索]で否定詞の共起語の一覧を表示させたところ、日本の昔話のように掌編レベルのボリュームだと、物語の動因となる箇所に関する語句が上位に表示される傾向が強いのではないか……といった印象があり、検証作業中である。</p>
<p>※無償版では強制抽出語の指定が機能制限で事実上使用できないため以下のような手法をとっている。</p>
<p><br />＊彦八<br />'彦八'<br />＊作り話<br />作り話 or 'つくり話'<br />＊旦那<br />隠居 or 旦那<br />＊手首<br />手首 or ( 手 and 甲 )<br />＊切る<br />切る or ( 打つ and 落とす )<br />＊首<br />首 or 頭<br />＊投げる<br />投げ捨てる or 投げ込む or 投げ入れる</p>
<p>＊ない<br />ない<br />＊ぬ<br />ぬ<br />＊ん<br />ん<br />＊るな<br />'るな'<br />＊るまい<br />'るまい'</p>
<p>＊話<br />話<br />＊上手<br />上手<br />＊かつぐ<br />かつぐ<br />＊話す<br />話す<br />＊嘘<br />嘘<br />＊違約<br />違約<br />＊大判<br />大判<br />＊江川<br />江川<br />＊渡し舟<br />渡し舟<br />＊侍<br />侍<br />＊烏<br />烏<br />＊糞<br />糞<br />＊羽織<br />羽織<br />＊汚す<br />汚す<br />＊汚らわしい<br />汚らわしい<br />＊頂戴<br />頂戴<br />＊頓智<br />頓智<br />＊鴻池<br />鴻池<br />＊池<br />池<br />＊松<br />松<br />＊枝<br />枝<br />＊一<br />一<br />＊二<br />二<br />＊三<br />三<br />＊先<br />先<br />＊放す<br />はなす<br />＊落ちる<br />落ちる</p>
<p><br />◆共起ネットワーク</p>
<p>・[コーディング単位]を[H5]に設定する。</p>
<p>※[描画する共起関係（edge）の選択]で「係数」を「0.2」から「0.3」に修正する。<br />※[強い共起関係ほど濃い線に]にチェックを入れる。</p>
<p>Jaccard係数が0.3以上はかなり強い共起関係にあることを示しているが、分析対象となる元データの文字数が少ないため係数が高めに出てしまう傾向にあるため、こうしている。</p>
<p>※Jaccard係数は共起関係（※ある言葉に続いて出てくる関係）の強さを表し 0≦係数≦1 の範囲の値をとる。</p>
<p>【Jaccard係数】<br />・0.1 →関連あり<br />・0.2 →強い関連あり<br />・0.3以上 →とても強い関連あり<br />※ただし、あくまで目安であって絶対ではない。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_034_con_hanashihahikohachi.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="共起ネットワーク" src="https://woodenplane.air-nifty.com/log/images/ca_pb_034_con_hanashihahikohachi.png" alt="共起ネットワーク" width="480" height="360" border="0" /></a></p>
<p>ざっと確認したところ、共通するキーワードが中央のサブグラフ（バブルが島状に集まった一塊）に表示され、類話によって異なるキーワードがそれぞれのサブグラフとして周辺に表示される形となっている。</p>
<p>※なお、各バブル間の距離や配置に意味はない。</p>
<p>◆対応分析</p>
<p>・[コーディング単位]を[H5]に設定する。</p>
<p>※[外部変数]は[タイトル]のまま続行。<br />※[差異が顕著なコードを分析に使用]で上位「40」とした。また[バブルプロット]にチェックを入れている。これらは文字の重なりを極力避けるためである。<br />※文字が重なって読みづらい場合、オプション画面の[コード選択]で不要なコードのチェックを外してもよい。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_034_ca_hanashihahikohachi.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="対応分析" src="https://woodenplane.air-nifty.com/log/images/ca_pb_034_ca_hanashihahikohachi.png" alt="対応分析" width="480" height="374" border="0" /></a></p>
<p>x、y軸上の原点（0.0）から点線が伸び交差した箇所が原点となる。原点から離れるほど特徴的なキーワードだと分析される。</p>
<p>原点付近には「彦八」「話す」「旦那」といったキーワードがプロットされている。未来社版では「作り話」「大判」「侍」といったキーワードが原点から離れてプロットされている。日本標準版では「鴻池」「放す」「落ちる」といったキーワードが特徴的とされている。</p>
<p>◆解釈</p>
<p>どちらも彦八話である。内容は若干異なる。未来社版ではちゃっかり大判を取り上げてしまう。日本標準版では話したら落ちるとオチのない話としている。</p>
<p>◆階層的クラスター分析</p>
<p>・[コーディング単位]を[文]に変更、実行するとデンドログラム（樹状図）で可視化される。</p>
<p>※キーワード指定しても可。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_034_hca_hanashihahikohachi.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="階層的クラスター分析・デンドログラム（樹状図）" src="https://woodenplane.air-nifty.com/log/images/ca_pb_034_hca_hanashihahikohachi.png" alt="階層的クラスター分析・デンドログラム（樹状図）" width="480" height="825" border="0" /></a> <br /><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_034_hca_gs_hanashihahikohachi.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="階層的クラスター分析・デンドログラム（樹状図）" src="https://woodenplane.air-nifty.com/log/images/ca_pb_034_hca_gs_hanashihahikohachi.png" alt="階層的クラスター分析・デンドログラム（樹状図）" width="480" height="825" border="0" /></a></p>
<p>概ねストーリーに沿った内容でクラスター化されている。</p>
<p>※当ブログの場合、[コーディング単位]が[段落][H5]だと、コードを全て選択するとエラーが返される結果となった。</p>
<p>◆クロス集計</p>
<p>・[コーディング単位]を[文]に変更、[集計]する。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_034_crt_hanashihahikohachi.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="クロス集計" src="https://woodenplane.air-nifty.com/log/images/ca_pb_034_crt_hanashihahikohachi.png" alt="クロス集計" width="480" height="345" border="0" /></a></p>
<p>クロス集計をかけたところ、カイ（χ）2乗値で相関関係を示す結果（※マーク）は得られなかった。テキストのボリュームが足りないのが要因と推測される。これはこの後行う分析でも同様の結果となっている。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_034_crt_bm_hanashihahikohachi.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="クロス集計・バブルマップ" src="https://woodenplane.air-nifty.com/log/images/ca_pb_034_crt_bm_hanashihahikohachi.png" alt="クロス集計・バブルマップ" width="480" height="574" border="0" /></a></p>
<p>マップとして描画したところ、「落ちる」「放す」「池」「松」といったキーワードの残差が大きく（濃く）表示される結果となった。バブルとしては「彦八」「旦那」「話」などが大きく描画された。</p>
<p>◆KWICコンコーダンス</p>
<p>現状ではテキストマイニングのツールに文脈を読む性能はないため実際に該当箇所を読んで人力で判断する他ない。KWICコンコーダンスでキーワード指定すれば指定したキーワードがどのような文脈で用いられているか一覧で抽出される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_034_kwic_hanashihahikohachi.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="KWICコンコーダンス" src="https://woodenplane.air-nifty.com/log/images/ca_pb_034_kwic_hanashihahikohachi.png" alt="KWICコンコーダンス" width="480" height="274" border="0" /></a> <br /><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_034_kwic_doc_hanashihahikohachi.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="KWICコンコーダンス・文書表示" src="https://woodenplane.air-nifty.com/log/images/ca_pb_034_kwic_doc_hanashihahikohachi.png" alt="KWICコンコーダンス・文書表示" width="480" height="509" border="0" /></a></p>
<p>◆関連語検索</p>
<p>・[集計単位]を[文]に変更、[集計]する。<br />・[Search Entry:]の一覧からキーワードを選択してダブルクリックすると[Result]に指定したキーワードの品詞や共起関係が表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_034_rws_hanashihahikohachi.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="関連語検索" src="https://woodenplane.air-nifty.com/log/images/ca_pb_034_rws_hanashihahikohachi.png" alt="関連語検索" width="480" height="452" border="0" /></a></p>
<p>※[Result:]から行指定してダブルクリックするとKWICコンコーダンスに遷移する。<br />※[Result:]の一覧から範囲指定して[コピー]したものを表計算ソフトやテキストファイルにペーストすることも可能である。</p>
<p>[＃直接入力]を指定して「頓智」といったキーワードで検索すると関連語が一覧で表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_034_rws_hanashihahikohachi_02.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="関連語検索" src="https://woodenplane.air-nifty.com/log/images/ca_pb_034_rws_hanashihahikohachi_02.png" alt="関連語検索" width="480" height="452" border="0" /></a></p>
<p>◆属性の転倒</p>
<p>・「ない」の結果上位一覧</p>
<table width="432">
<tbody>
<tr>
<td width="72">N</td>
<td width="72">抽出語</td>
<td width="72">品詞</td>
<td width="72">全体</td>
<td width="72">共起</td>
<td width="72">Jaccard</td>
</tr>
<tr>
<td>1</td>
<td>聞く</td>
<td>動詞</td>
<td> 6 (0.222)</td>
<td> 5 (0.714)</td>
<td>0.625</td>
</tr>
<tr>
<td>2</td>
<td>言う</td>
<td>動詞</td>
<td> 8 (0.296)</td>
<td> 5 (0.714)</td>
<td>0.5</td>
</tr>
<tr>
<td>3</td>
<td>彦</td>
<td>未知語</td>
<td> 10 (0.370)</td>
<td> 4 (0.571)</td>
<td>0.3077</td>
</tr>
<tr>
<td>4</td>
<td>話</td>
<td>サ変名詞</td>
<td> 6 (0.222)</td>
<td> 3 (0.429)</td>
<td>0.3</td>
</tr>
<tr>
<td>5</td>
<td>嘘</td>
<td>名詞C</td>
<td> 2 (0.074)</td>
<td> 2 (0.286)</td>
<td>0.2857</td>
</tr>
<tr>
<td>6</td>
<td>大阪</td>
<td>地名</td>
<td> 2 (0.074)</td>
<td> 2 (0.286)</td>
<td>0.2857</td>
</tr>
<tr>
<td>7</td>
<td>登る</td>
<td>動詞</td>
<td> 3 (0.111)</td>
<td> 2 (0.286)</td>
<td>0.25</td>
</tr>
<tr>
<td>8</td>
<td>枝</td>
<td>名詞C</td>
<td> 4 (0.148)</td>
<td> 2 (0.286)</td>
<td>0.2222</td>
</tr>
</tbody>
</table>
<p>彦八の作り話にまんまと乗せられてしまう……といった粗筋となっている。</p>
<p>短いお話の中で属性の転倒を多用するのが昔話の特徴の一つと考えられる。</p>
<p>ここで「／」（スラッシュ）を「転倒」を意味する記号として用いる。スラッシュは様々な場面で用いられていて文脈依存的な記号という欠点もあるが、視覚的にはイメージしやすいと判断した。</p>
<p>・［旦那｜大判：呈示／取られる］<br />・［彦八｜話：嘘／儲け］<br />・［彦八｜話：はなす／落ちる］</p>
<p>こういった風にお話を転がしていると分析できる。</p>
<p>彦八は巧みな話術で「嘘／大判」と転倒させてしまう。</p>
<p>◆類似度行列</p>
<p>・[コーディング単位]を[文]に変更して[集計]。Jaccard係数がマトリクス形式で確認できる。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_034_sm_hanashihahikohachi.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="類似度行列" src="https://woodenplane.air-nifty.com/log/images/ca_pb_034_sm_hanashihahikohachi.png" alt="類似度行列" width="480" height="295" border="0" /></a></p>
<p>・ある列を選択して画面右下の[コピー（選択列）]をクリックすると、当該のキーワードに関するJaccard係数がコピーされるので、それを表計算ソフトにペーストするといった利用が可能となる。</p>
<p>※当ブログでは[コーディング単位]が[段落][H5]の場合、Jacccard係数が1.0～0.5といった結果がほとんどで、意味のない結果となった。</p>
<p>◆多次元尺度構成法</p>
<p>・[コーディング単位]を[文]に変更して実行。<br />・共起関係を確認したいキーワードを指定。<br />・次元を「2」から「3」に変更して実行、三次元のマップとした。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_034_mds_hanashihahikohachi.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="多次元尺度構成法" src="https://woodenplane.air-nifty.com/log/images/ca_pb_034_mds_hanashihahikohachi.png" alt="多次元尺度構成法" width="480" height="480" border="0" /></a></p>
<p>彦八が巧みに話すくだりに関連したキーワードを指定したところ、「かつぐ」「上手」がやや離れた位置にプロットされた。</p>
<p>※選択するキーワードによって相対的な位置関係は変わり得る。</p>
<p>※実行すると指定したキーワードの幾つかが除外されるとメッセージが表示される。テキストのボリューム不足のためか無償版の仕様によるものか判断がつかない。<br />※当ブログの事例では「文」以外、「段落」と「H5」では除外されるキーワードが増える傾向となった。</p>
<p>◆自己組織化マップ</p>
<p>[コーディング単位]を[文]に変更して実行。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_034_som_hanashihahikohachi.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="自己組織化マップ" src="https://woodenplane.air-nifty.com/log/images/ca_pb_034_som_hanashihahikohachi.png" alt="自己組織化マップ" width="480" height="480" border="0" /></a></p>
<p>記述内容が視覚的に整理され、類似性の高い内容が近くに配置される。概ねストーリーに沿った形で各クラスターが表示される。</p>
<p>※当ブログの事例では「文」以外、「段落」と「H5」ではエラーが返される結果となった。<br />※クラスター化の計算を繰り返すため処理に時間がかかるので要注意。<br />※クラスターの配置、距離に意味はない。</p>
<p>◆トピックの推定</p>
<p>・[ツール]→[文書]→[トピックモデル]→[トピックの推定]を選択。<br />・[集計単位]を[文]に変更。<br />・[OK]ボタンをクリックすると、[トピックの推定結果]画面が表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_034_ter_hanashihahikohachi.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="トピックの推定" src="https://woodenplane.air-nifty.com/log/images/ca_pb_034_ter_hanashihahikohachi.png" alt="トピックの推定" width="480" height="293" border="0" /></a></p>
<p>・各トピックで高い確率で出現する語句がリストアップされる。<br />・[＃1]といった欄をクリックすると、文書検索画面が表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_034_ter_doc_hanashihahikohachi.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="Ca_pb_034_ter_doc_hanashihahikohachi" src="https://woodenplane.air-nifty.com/log/images/ca_pb_034_ter_doc_hanashihahikohachi.png" alt="Ca_pb_034_ter_doc_hanashihahikohachi" width="480" height="360" border="0" /></a></p>
<p>◆ベイズ学習による分類</p>
<p>・[ツール]→[文書]→[ベイズ学習による分類]→[外部変数から学習]を選択。<br />・[分類の単位]を[文]に変更。<br />・[学習する外部変数]は[書名]に変更する。<br />　※「タイトル」のままでもよし。<br />・[OK]ボタンをクリックすると、ファイルの保存画面が表示されるので、任意のファイル名を記述して保存する。</p>
<p>・[ツール]→[文書]→[ベイズ学習による分類]→[学習結果ファイルの内容を確認]を選択。ファイル選択画面が開くので、先ほど保存したファイルを指定して開く。すると[学習結果ファイル]画面が開くので内容の確認を行う。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_034_bl_hanashihahikohachi.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="ベイズ学習による分類" src="https://woodenplane.air-nifty.com/log/images/ca_pb_034_bl_hanashihahikohachi.png" alt="ベイズ学習による分類" width="411" height="369" border="0" /></a></p>
<p>※[学習結果を用いた自動分類]については割愛する。</p>
<p>※[トピックの推定]と[ベイズ学習による分類]は固有名詞などを強制抽出語としてあらかじめ指定しておかないと正確に分析されないケースが生じる。正式に利用したい際は有償版の購入をお勧めする。当ブログのはあくまでテストケースとしてのものである。</p>
<p>※[トピックの推定]と[ベイズ学習による分類]はコーディング・ルールに依らない分析手法となるが、筆者の能力的に追及はしない。</p>
<p>◆参考文献<br />・『日本の民話 34 石見篇』（大庭良美／編, 未来社, 1978）pp.322-323.<br />・『島根のむかし話』（島根県小・中学校国語教育研究会／編著, 日本標準, 1976）pp.212-213.<br />・『動かして学ぶ！はじめてのテキストマイニング』（樋口耕一, ナカニシヤ出版, 2022）<br />・『社会調査のための計量テキスト分析　【第２版】　内容分析の継承と発展を目指して』（樋口耕一, ナカニシヤ出版, 2020）</p>]]></content:encoded>


<dc:subject><![CDATA[<!-- 11 //-->昔話]]></dc:subject>

<dc:creator>mitsuzakura</dc:creator>
<dc:date>2026-04-12T23:00:00+09:00</dc:date>
</item>
<item rdf:about="https://woodenplane.air-nifty.com/log/2026/04/post-ad017d.html">
<title>昔話の計量テキスト分析――大根蒔き</title>
<link>https://woodenplane.air-nifty.com/log/2026/04/post-ad017d.html</link>
<description>未来社『石見の民話』より「大根蒔き」とその類話についてKH Coderで計量テキスト分析を実施した。</description>
<content:encoded><![CDATA[<p>◆はじめに</p>
<p>以下はKH Coder（無償版：version 3.Beta.08e）を用いた昔話の計量テキスト分析である。昔話の類話の比較にツールを利用できないか試行してみた。</p>
<p>手持ちの資料が限られるため、分析の対象となる元データの文字数が少ないものの（※本来であれば5000字以上は欲しい）、分析自体は正常に処理されていると判断した。</p>
<p>KH Coderの操作に慣れる目的も兼ねて行った作業で、コーディングルールの記述の事例集、あるいは速習用のチュートリアルとしてでも読んで頂ければ……といったところである。</p>
<p>なお、KH Coderでよく用いられるのは共起ネットワークと対応分析とのことで、それ以外はおまけパートと思って頂いて構わない。操作に習熟するにはコーディングルールの記述に慣れるのが第一である。</p>
<p>◆ファイル</p>
<p>各ファイルをダウンロードしてKH Coderに読み込ませれば同様の分析が再現可能である。</p>
<p><a href="https://woodenplane.air-nifty.com/log/files/ca_pb_033_daikonmaki.xlsx" target="_blank" rel="noopener">ダウンロード - ca_pb_033_daikonmaki.xlsx</a></p>
<p><a href="https://woodenplane.air-nifty.com/log/files/ca_pb_033_codingrules.txt" target="_blank" rel="noopener">ダウンロード - ca_pb_033_codingrules.txt</a></p>
<p><a href="https://woodenplane.air-nifty.com/log/files/kh_coder_startingedition_sagyotejunsho.txt" target="_blank" rel="noopener">ダウンロード - kh_coder_startingedition_sagyotejunsho.txt</a> （※作業手順書）</p>
<p>※「H5」とはHTMLでいうところのヘッダー（見出し）・レベル5で本文に相当すると考えればよい。<br />※[コーディング単位]は「文／段落／H5」から選べるが、状況に応じて適切と思われるものを選択する必要がある。処理が上手くいかないと感じた場合、コーディング単位を切り替えると上手く処理されるケースがままある。</p>
<p>※公式マニュアルでは「集計単位」という用語が使われている。共起関係について、</p>
<p>・「文」では一文単位での分析<br />・「段落」では段落単位の分析<br />・「H5」では表計算ソフトのセル単位とされ、改行を含めた一セルの中身全体が分析単位となる</p>
<p>※レファレンスでも索引で「コーディング単位」の項目は設けられていない。操作性に関わる重要項目であるものの、その仕様について不明瞭な感はある。<br />※当ブログの場合、表計算ソフトのフォーマットで読み込ませているからH5固定でいいだろうと思い込んでいたら、さにあらずだった。</p>
<p>◆あらすじ</p>
<p>・「大根蒔き」（未来社『石見の民話』）<br />座頭の言うことは何でも信じる旦那がいた。ある日沢山の小作を雇って麻を蒔いていると、そこへ座頭が通りかかった。座頭はあの旦那は自分の言うことは何でも信じるから一つからかってやれと思った。すると仕事をしていた人が座頭に今日はどこへ行くのか訊いた。座頭は今はエダオの方からフシオの方へ行くと答えた。それを聞いた旦那は仕事を止めて枝のある苧（麻）や節のある苧を作ったのでは金にならぬと言って麻を蒔くのを止めた。それから日を変えて大豆を蒔いているとまた座頭が通りかかった。何か長い物を風呂敷に包んで持っているので今日は長いものを持って行きなさるがと声をかけると座頭は長いことは長いが鞘ばかりでと言った。これを聞いた旦那はせっかく大豆を蒔いてもさやばかりできたのでは何にもならないと言って大豆を蒔くのを止めさせた。その内に時期が遅れたので大根しか植えるものが無くなった。それで旦那は小作を集めて大根を蒔くことにした。今日は座頭が通っても何も言うな。何か言うと色々な事を言って気をくじくからと言った。そこへまた座頭がやってきた。座頭がどなたもご苦労ですなと言ったが誰も一口もものを言わない。座頭は自分の言うことをそんなに気にかけなくてもよいではないか。わしの言うことは根も葉もないことだと言った。旦那はこれを聞いて根も葉もない大根を作ったとしても何にもならないと言ってまた大根蒔きを止めさせた。それで旦那は座頭の言葉を信じたばかりに一年中何も作らずじまいであった。</p>
<p><br />・「ダイコンまき」（日本標準『島根のむかし話』）<br />昔、彦八と同じ村に何でも気にする旦那がいた。ある日、旦那が大豆を蒔こうと思って人を雇って畑を打っていた。そこへ彦八が長い刀を差して通りかかった。旦那が、彦八、大層長いのを差しておるなと言ったところ、彦八が旦那さん、これは鞘ばかりで身はございませんと言ったら、旦那は大豆を蒔いても莢ばかりで実がなくては駄目だと言って大豆を蒔くのを止めた。次の日、今度は綿を蒔こうと思っていると、また彦八が通りかかった。旦那が黙っていると、旦那さん、昨日までは風が吹いておりましたが、今日は吹かずにようございますなと言った。旦那は綿を蒔いても吹かないのでは駄目だ（綿が実って莢から綿が出ることを「わたがふく」と言う）と綿を蒔くことを止めた。あくる日、大根を蒔こうとまた人を雇って仕事をしていた。旦那は今日、彦八が通っても決して口をきくなと言っているところへ彦八がやって来た。旦那さん、こんにちはと言っても誰も返事しないので、旦那さん、この間は悪いことを言いました。あれは根も葉もない話ですから、こらえてやってくださいと言った。旦那は大根を蒔いても根も葉もなくてはつまらないと、とうとう大根蒔きを止めてしまった。</p>
<p>◆コーディングルール</p>
<p>※コーディングルールのキーワードは重要と判断したものを人力でピックアップしている。そのため、恣意性を伴う分析となる。</p>
<p>※活用形でなく基本形で入力する。</p>
<p>※[前処理]→[語の抽出結果を確認]でキーワードがどのように分節されているか検索すると結果の一覧[語の抽出結果]が表示される。</p>
<p>※[Result]から確認したい行をクリックして選択、画面下の[詳細表示]ボタンをクリックするとサブ画面が表示され、活用形や基本形が確認できる。</p>
<p>※昔話では「否定／肯定」「肯定／否定」と属性が変化することが多いと考え、否定詞「ない」「まい」「ぬ」「ん」、また禁止を意味する「な」を共通のコードとして設定している。</p>
<p>※[関連語検索]で否定詞の共起語の一覧を表示させたところ、日本の昔話のように掌編レベルのボリュームだと、物語の動因となる箇所に関する語句が上位に表示される傾向が強いのではないか……といった印象があり、検証作業中である。</p>
<p>※無償版では強制抽出語の指定が機能制限で事実上使用できないため以下のような手法をとっている。</p>
<p><br />＊小作<br />小作 or ( 仕事 and 人 ) or ( 雇う and 人 )<br />＊枝<br />枝 or 'エダオ'<br />＊節<br />節 or 'フシオ'<br />＊麻<br />麻 or 苧<br />＊さや<br />鞘 or 莢 or さや<br />＊実<br />身 or 実<br />＊彦八<br />'彦八'<br />＊黙る<br />黙る or ( 返事 and する and ない )<br />＊綿<br />綿 or わた<br />＊吹く<br />吹く or ふく</p>
<p>＊ない<br />ない<br />＊ぬ<br />ぬ<br />＊ん<br />ん<br />＊るな<br />'るな'<br />＊るまい<br />'るまい'</p>
<p>＊座頭<br />座頭<br />＊旦那<br />旦那<br />＊信じる<br />信じる<br />＊蒔く<br />蒔く<br />＊通りかかる<br />通りかかる<br />＊金<br />金<br />＊長い<br />長い<br />＊大豆<br />大豆<br />＊大根<br />大根<br />＊気<br />気<br />＊くじく<br />くじく<br />＊言う<br />言う<br />＊根<br />根<br />＊葉<br />葉<br />＊作る<br />作る<br />＊村<br />村<br />＊やめる<br />やめる</p>
<p><br />◆共起ネットワーク</p>
<p>・[コーディング単位]を[H5]に設定する。</p>
<p>※[描画する共起関係（edge）の選択]で「係数」を「0.2」から「0.3」に修正する。<br />※[強い共起関係ほど濃い線に]にチェックを入れる。</p>
<p>Jaccard係数が0.3以上はかなり強い共起関係にあることを示しているが、分析対象となる元データの文字数が少ないため係数が高めに出てしまう傾向にあるため、こうしている。</p>
<p>※Jaccard係数は共起関係（※ある言葉に続いて出てくる関係）の強さを表し 0≦係数≦1 の範囲の値をとる。</p>
<p>【Jaccard係数】<br />・0.1 →関連あり<br />・0.2 →強い関連あり<br />・0.3以上 →とても強い関連あり<br />※ただし、あくまで目安であって絶対ではない。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_033_con_daikonmaki.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="共起ネットワーク" src="https://woodenplane.air-nifty.com/log/images/ca_pb_033_con_daikonmaki.png" alt="共起ネットワーク" width="480" height="360" border="0" /></a></p>
<p>ざっと確認したところ、共通するキーワードが中央のサブグラフ（バブルが島状に集まった一塊）に表示され、類話によって異なるキーワードがそれぞれのサブグラフとして周辺に表示される形となっている。</p>
<p>※なお、各バブル間の距離や配置に意味はない。</p>
<p>◆対応分析</p>
<p>・[コーディング単位]を[H5]に設定する。</p>
<p>※[外部変数]は[タイトル]のまま続行。<br />※[差異が顕著なコードを分析に使用]で上位「40」とした。また[バブルプロット]にチェックを入れている。これらは文字の重なりを極力避けるためである。<br />※文字が重なって読みづらい場合、オプション画面の[コード選択]で不要なコードのチェックを外してもよい。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_033_ca_daikonmaki.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="対応分析" src="https://woodenplane.air-nifty.com/log/images/ca_pb_033_ca_daikonmaki.png" alt="対応分析" width="480" height="374" border="0" /></a></p>
<p>x、y軸上の原点（0.0）から点線が伸び交差した箇所が原点となる。原点から離れるほど特徴的なキーワードだと分析される。</p>
<p>原点付近には「旦那」「蒔く」「小作」といったキーワードがプロットされている。未来社版では「座頭」「信じる」「くじく」といったキーワードが原点から離れてプロットされている。日本標準版では「彦八」「黙る」「るな」といったキーワードが特徴的とされている。</p>
<p>◆解釈</p>
<p>内容的にはほぼ同じであるが、未来社版では座頭、日本標準版では彦八が主人公と主体が異なっている。</p>
<p>◆階層的クラスター分析</p>
<p>・[コーディング単位]を[文]に変更、実行するとデンドログラム（樹状図）で可視化される。</p>
<p>※キーワード指定しても可。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_033_hca_daikonmaki.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="階層的クラスター分析・デンドログラム（樹状図）" src="https://woodenplane.air-nifty.com/log/images/ca_pb_033_hca_daikonmaki.png" alt="階層的クラスター分析・デンドログラム（樹状図）" width="480" height="685" border="0" /></a> <br /><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_033_hca_gs_daikonmaki.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="階層的クラスター分析・デンドログラム（樹状図）" src="https://woodenplane.air-nifty.com/log/images/ca_pb_033_hca_gs_daikonmaki.png" alt="階層的クラスター分析・デンドログラム（樹状図）" width="480" height="685" border="0" /></a></p>
<p>概ねストーリーに沿った内容でクラスター化されている。</p>
<p>※当ブログの場合、[コーディング単位]が[段落][H5]だと、コードを全て選択するとエラーが返される結果となった。</p>
<p>◆クロス集計</p>
<p>・[コーディング単位]を[文]に変更、[集計]する。</p>
<p>※「タイトル」で集計をかけた。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_033_crt_daikonmaki.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="クロス集計" src="https://woodenplane.air-nifty.com/log/images/ca_pb_033_crt_daikonmaki.png" alt="クロス集計" width="480" height="345" border="0" /></a></p>
<p>クロス集計をかけたところ、「彦八」「座頭」といったキーワードでカイ（χ）2乗値で相関関係を示す結果（※マーク）が得られた。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_033_crt_bm_daikonmaki.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="クロス集計・バブルマップ" src="https://woodenplane.air-nifty.com/log/images/ca_pb_033_crt_bm_daikonmaki.png" alt="クロス集計・バブルマップ" width="480" height="518" border="0" /></a></p>
<p>マップとして描画したところ、「彦八」といったキーワードの残差が大きく（濃く）表示される結果となった。バブルとしては「旦那」「座頭」「言う」が大きく描画された。</p>
<p>◆KWICコンコーダンス</p>
<p>現状ではテキストマイニングのツールに文脈を読む性能はないため実際に該当箇所を読んで人力で判断する他ない。KWICコンコーダンスでキーワード指定すれば指定したキーワードがどのような文脈で用いられているか一覧で抽出される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_033_kwic_daikonmaki.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="KWICコンコーダンス" src="https://woodenplane.air-nifty.com/log/images/ca_pb_033_kwic_daikonmaki.png" alt="KWICコンコーダンス" width="480" height="274" border="0" /></a> <br /><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_033_kwic_doc_daikonmaki.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="KWICコンコーダンス・文書表示" src="https://woodenplane.air-nifty.com/log/images/ca_pb_033_kwic_doc_daikonmaki.png" alt="KWICコンコーダンス・文書表示" width="480" height="509" border="0" /></a></p>
<p>◆関連語検索</p>
<p>・[集計単位]を[文]に変更、[集計]する。<br />・[Search Entry:]の一覧からキーワードを選択してダブルクリックすると[Result]に指定したキーワードの品詞や共起関係が表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_033_rws_daikonmaki.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="関連語検索" src="https://woodenplane.air-nifty.com/log/images/ca_pb_033_rws_daikonmaki.png" alt="関連語検索" width="480" height="452" border="0" /></a></p>
<p>※[Result:]から行指定してダブルクリックするとKWICコンコーダンスに遷移する。<br />※[Result:]の一覧から範囲指定して[コピー]したものを表計算ソフトやテキストファイルにペーストすることも可能である。</p>
<p>[＃直接入力]を指定して「刀」といったキーワードで検索すると関連語が一覧で表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_033_rws_daikonmaki_02.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="関連語検索" src="https://woodenplane.air-nifty.com/log/images/ca_pb_033_rws_daikonmaki_02.png" alt="関連語検索" width="480" height="452" border="0" /></a></p>
<p>◆属性の転倒</p>
<p>・「ない」の結果上位一覧</p>
<table width="432">
<tbody>
<tr>
<td width="72">N</td>
<td width="72">抽出語</td>
<td width="72">品詞</td>
<td width="72">全体</td>
<td width="72">共起</td>
<td width="72">Jaccard</td>
</tr>
<tr>
<td>1</td>
<td>言う</td>
<td>動詞</td>
<td> 17 (0.548)</td>
<td> 9 (0.900)</td>
<td>0.5</td>
</tr>
<tr>
<td>2</td>
<td>止める</td>
<td>動詞</td>
<td> 6 (0.194)</td>
<td> 5 (0.500)</td>
<td>0.4545</td>
</tr>
<tr>
<td>3</td>
<td>根</td>
<td>名詞C</td>
<td> 4 (0.129)</td>
<td> 4 (0.400)</td>
<td>0.4</td>
</tr>
<tr>
<td>4</td>
<td>葉</td>
<td>名詞C</td>
<td> 4 (0.129)</td>
<td> 4 (0.400)</td>
<td>0.4</td>
</tr>
<tr>
<td>5</td>
<td>旦那</td>
<td>名詞</td>
<td> 15 (0.484)</td>
<td> 6 (0.600)</td>
<td>0.3158</td>
</tr>
<tr>
<td>6</td>
<td>蒔く</td>
<td>動詞</td>
<td> 12 (0.387)</td>
<td> 5 (0.500)</td>
<td>0.2941</td>
</tr>
<tr>
<td>7</td>
<td>駄目</td>
<td>形容動詞</td>
<td> 2 (0.065)</td>
<td> 2 (0.200)</td>
<td>0.2</td>
</tr>
<tr>
<td>8</td>
<td>莢</td>
<td>名詞C</td>
<td> 2 (0.065)</td>
<td> 2 (0.200)</td>
<td>0.2</td>
</tr>
<tr>
<td>9</td>
<td>聞く</td>
<td>動詞</td>
<td> 3 (0.097)</td>
<td> 2 (0.200)</td>
<td>0.1818</td>
</tr>
<tr>
<td>10</td>
<td>大豆</td>
<td>名詞</td>
<td> 4 (0.129)</td>
<td> 2 (0.200)</td>
<td>0.1667</td>
</tr>
</tbody>
</table>
<p>・「ぬ」の結果上位一覧</p>
<table width="432">
<tbody>
<tr>
<td width="72">N</td>
<td width="72">抽出語</td>
<td width="72">品詞</td>
<td width="72">全体</td>
<td width="72">共起</td>
<td width="72">Jaccard</td>
</tr>
<tr>
<td>1</td>
<td>作る</td>
<td>動詞</td>
<td> 3 (0.097)</td>
<td> 2 (0.667)</td>
<td>0.5</td>
</tr>
<tr>
<td>2</td>
<td>な</td>
<td>感動詞</td>
<td> 1 (0.032)</td>
<td> 1 (0.333)</td>
<td>0.3333</td>
</tr>
<tr>
<td>3</td>
<td>よう</td>
<td>感動詞</td>
<td> 1 (0.032)</td>
<td> 1 (0.333)</td>
<td>0.3333</td>
</tr>
<tr>
<td>4</td>
<td>一年中</td>
<td>副詞可能</td>
<td> 1 (0.032)</td>
<td> 1 (0.333)</td>
<td>0.3333</td>
</tr>
<tr>
<td>5</td>
<td>金</td>
<td>名詞C</td>
<td> 1 (0.032)</td>
<td> 1 (0.333)</td>
<td>0.3333</td>
</tr>
<tr>
<td>6</td>
<td>言葉</td>
<td>名詞</td>
<td> 1 (0.032)</td>
<td> 1 (0.333)</td>
<td>0.3333</td>
</tr>
<tr>
<td>7</td>
<td>昨日</td>
<td>副詞可能</td>
<td> 1 (0.032)</td>
<td> 1 (0.333)</td>
<td>0.3333</td>
</tr>
<tr>
<td>8</td>
<td>枝</td>
<td>名詞C</td>
<td> 1 (0.032)</td>
<td> 1 (0.333)</td>
<td>0.3333</td>
</tr>
<tr>
<td>9</td>
<td>節</td>
<td>名詞C</td>
<td> 1 (0.032)</td>
<td> 1 (0.333)</td>
<td>0.3333</td>
</tr>
<tr>
<td>10</td>
<td>苧</td>
<td>名詞C</td>
<td> 1 (0.032)</td>
<td> 1 (0.333)</td>
<td>0.3333</td>
</tr>
</tbody>
</table>
<p>旦那は畑打ちで座頭や彦八の軽口を信じたばかりに種蒔きを止めてしまう……といった粗筋となっている。</p>
<p>短いお話の中で属性の転倒を多用するのが昔話の特徴の一つと考えられる。</p>
<p>ここで「／」（スラッシュ）を「転倒」を意味する記号として用いる。スラッシュは様々な場面で用いられていて文脈依存的な記号という欠点もあるが、視覚的にはイメージしやすいと判断した。</p>
<p>・［旦那｜種：蒔く／止める］<br />・［座頭｜種蒔き：謎かけ／妨害］<br />・［彦八｜種蒔き：軽口／妨害］<br />・［種蒔き｜時節：得る／逃す］</p>
<p>こういった風にお話を転がしていると分析できる。</p>
<p>旦那は座頭や彦八の言葉を意味深に解釈、「無意味／意味あり」と転倒させて、せっかくの種蒔きの時節を逃してしまう。</p>
<p>◆類似度行列</p>
<p>・[コーディング単位]を[文]に変更して[集計]。Jaccard係数がマトリクス形式で確認できる。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_033_sm_daikonmaki.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="類似度行列" src="https://woodenplane.air-nifty.com/log/images/ca_pb_033_sm_daikonmaki.png" alt="類似度行列" width="480" height="295" border="0" /></a></p>
<p>・ある列を選択して画面右下の[コピー（選択列）]をクリックすると、当該のキーワードに関するJaccard係数がコピーされるので、それを表計算ソフトにペーストするといった利用が可能となる。</p>
<p>※当ブログでは[コーディング単位]が[段落][H5]の場合、Jacccard係数が1.0～0.5といった結果がほとんどで、意味のない結果となった。</p>
<p>◆多次元尺度構成法</p>
<p>・[コーディング単位]を[文]に変更して実行。<br />・共起関係を確認したいキーワードを指定。<br />・次元を「2」から「3」に変更して実行、三次元のマップとした。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_033_mds_daikonmaki.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="多次元尺度構成法" src="https://woodenplane.air-nifty.com/log/images/ca_pb_033_mds_daikonmaki.png" alt="多次元尺度構成法" width="480" height="480" border="0" /></a></p>
<p>旦那が座頭や彦八に気をくじかれてしまうくだりに関連したキーワードを指定したところ、「気」「彦八」が離れた位置にプロットされた。</p>
<p>※選択するキーワードによって相対的な位置関係は変わり得る。</p>
<p>※実行すると指定したキーワードの幾つかが除外されるとメッセージが表示される。テキストのボリューム不足のためか無償版の仕様によるものか判断がつかない。<br />※当ブログの事例では「文」以外、「段落」と「H5」では除外されるキーワードが増える傾向となった。</p>
<p>◆自己組織化マップ</p>
<p>[コーディング単位]を[文]に変更して実行。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_033_som_daikonmaki.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="自己組織化マップ" src="https://woodenplane.air-nifty.com/log/images/ca_pb_033_som_daikonmaki.png" alt="自己組織化マップ" width="480" height="480" border="0" /></a></p>
<p>記述内容が視覚的に整理され、類似性の高い内容が近くに配置される。概ねストーリーに沿った形で各クラスターが表示される。</p>
<p>※当ブログの事例では「文」以外、「段落」と「H5」ではエラーが返される結果となった。<br />※クラスター化の計算を繰り返すため処理に時間がかかるので要注意。<br />※クラスターの配置、距離に意味はない。</p>
<p>◆トピックの推定</p>
<p>・[ツール]→[文書]→[トピックモデル]→[トピックの推定]を選択。<br />・[集計単位]を[文]に変更。<br />・[OK]ボタンをクリックすると、[トピックの推定結果]画面が表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_033_ter_daikonmaki.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="トピックの推定" src="https://woodenplane.air-nifty.com/log/images/ca_pb_033_ter_daikonmaki.png" alt="トピックの推定" width="480" height="293" border="0" /></a></p>
<p>・各トピックで高い確率で出現する語句がリストアップされる。<br />・[＃1]といった欄をクリックすると、文書検索画面が表示される。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_033_ter_doc_daikonmaki.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="トピックの推定・文書検索" src="https://woodenplane.air-nifty.com/log/images/ca_pb_033_ter_doc_daikonmaki.png" alt="トピックの推定・文書検索" width="480" height="360" border="0" /></a></p>
<p>◆ベイズ学習による分類</p>
<p>・[ツール]→[文書]→[ベイズ学習による分類]→[外部変数から学習]を選択。<br />・[分類の単位]を[文]に変更。<br />・[学習する外部変数]は[書名]に変更する。<br />　※「タイトル」のままでもよし。<br />・[OK]ボタンをクリックすると、ファイルの保存画面が表示されるので、任意のファイル名を記述して保存する。</p>
<p>・[ツール]→[文書]→[ベイズ学習による分類]→[学習結果ファイルの内容を確認]を選択。ファイル選択画面が開くので、先ほど保存したファイルを指定して開く。すると[学習結果ファイル]画面が開くので内容の確認を行う。</p>
<p><a href="https://woodenplane.air-nifty.com/photos/uncategorized/ca_pb_033_bl_daikonmaki.png" target="_blank" rel="noopener"><img style="margin: 3px;" title="ベイズ学習による分類" src="https://woodenplane.air-nifty.com/log/images/ca_pb_033_bl_daikonmaki.png" alt="ベイズ学習による分類" width="411" height="369" border="0" /></a></p>
<p>※[学習結果を用いた自動分類]については割愛する。</p>
<p>※[トピックの推定]と[ベイズ学習による分類]は固有名詞などを強制抽出語としてあらかじめ指定しておかないと正確に分析されないケースが生じる。正式に利用したい際は有償版の購入をお勧めする。当ブログのはあくまでテストケースとしてのものである。</p>
<p>※[トピックの推定]と[ベイズ学習による分類]はコーディング・ルールに依らない分析手法となるが、筆者の能力的に追及はしない。</p>
<p>◆参考文献<br />・『日本の民話 34 石見篇』（大庭良美／編, 未来社, 1978）pp.219-220.<br />・『島根のむかし話』（島根県小・中学校国語教育研究会／編著, 日本標準, 1976）pp.218-220.<br />・『動かして学ぶ！はじめてのテキストマイニング』（樋口耕一, ナカニシヤ出版, 2022）<br />・『社会調査のための計量テキスト分析　【第２版】　内容分析の継承と発展を目指して』（樋口耕一, ナカニシヤ出版, 2020）</p>]]></content:encoded>


<dc:subject><![CDATA[<!-- 11 //-->昔話]]></dc:subject>

<dc:creator>mitsuzakura</dc:creator>
<dc:date>2026-04-11T23:00:00+09:00</dc:date>
</item>


</rdf:RDF>
