昔話の計量テキスト分析――弓の名人
◆はじめに
以下はKH Coder(無償版:version 3.Beta.08e)を用いた昔話の計量テキスト分析である。昔話の類話の比較にツールを利用できないか試行してみた。
手持ちの資料が限られるため、分析の対象となる元データの文字数が少ないものの(※本来であれば5000字以上は欲しい)、分析自体は正常に処理されていると判断した。
KH Coderの操作に慣れる目的も兼ねて行った作業で、コーディングルールの記述の事例集、あるいは速習用のチュートリアルとしてでも読んで頂ければ……といったところである。
なお、KH Coderでよく用いられるのは共起ネットワークと対応分析とのことで、それ以外はおまけパートと思って頂いて構わない。操作に習熟するにはコーディングルールの記述に慣れるのが第一である。
◆ファイル
各ファイルをダウンロードしてKH Coderに読み込ませれば同様の分析が再現可能である。
ダウンロード - ca_pb_022_yuminomeijin.xlsx
ダウンロード - ca_pb_022_codingrules.txt
ダウンロード - kh_coder_startingedition_sagyotejunsho.txt (※作業手順書)
※「H5」とはHTMLでいうところのヘッダー(見出し)・レベル5で本文に相当すると考えればよい。
※[コーディング単位]は「文/段落/H5」から選べるが、状況に応じて適切と思われるものを選択する必要がある。処理が上手くいかないと感じた場合、コーディング単位を切り替えると上手く処理されるケースがままある。
※公式マニュアルでは「集計単位」という用語が使われている。共起関係について、
・「文」では一文単位での分析
・「段落」では段落単位の分析
・「H5」では表計算ソフトのセル単位とされ、改行を含めた一セルの中身全体が分析単位となる
※レファレンスでも索引で「コーディング単位」の項目は設けられていない。操作性に関わる重要項目であるものの、その仕様について不明瞭な感はある。
※当ブログの場合、表計算ソフトのフォーマットで読み込ませているからH5固定でいいだろうと思い込んでいたら、さにあらずだった。
◆あらすじ
・「弓の名人」(未来社『石見の民話』)
昔、ある田舎に百姓の息子がいた。毎日毎日仕事をしていたが、百姓が嫌になったので、一つこれから侍になってやろう。侍になったら威張ることができると思った。そこで刀を二本求めて腰に差し、旅に出た。その内に日が暮れたので宿へ泊まった。部屋に通されたところ、床の間に長刀が飾ってあった。この長刀は自分がいつも使う鎌とは大分違うと息子はつくづく長刀を見て感心した様につぶやいた。刀かけを見ると刀がかけてある。息子は手にとって抜いて見た。刀はぴかぴか光っている。これが本当の名剣というものだと息子はつぶやいた。ほとりに弓があった。息子は弓を取り上げると、矢をつがえてみた。一生懸命引き絞ってパッと放した。すると矢は障子をぶすっと射ぬいて外へ飛んでいってしまった。しまった。これは大事になった。誰かやかましく言ってくるに違いない。早く出ていこう。息子は慌てて庭へ下りて草鞋を履いていると、隣の家の人がごめんくださいと宿屋へ入ってきた。何を言うかと思って聴いていると、この宿にお侍さんが泊まっているかとその人は宿の者に尋ねた。これはしまった。あの弓を射たのでやられるに違いないと思っていると、それでは今弓を射てくれたのはその人に違いない。実はうちの蔵へ盗人が入って物を盗って出ようとするところへ矢が当たって盗人が倒れたので、おかげで物を盗られずに済んだと言った。息子はそれを聞くと、早速草履を脱いで座敷へ上がってかしこまっていた。するとそこへ、弓を射てくださったお侍というのはあなたかと言ってさっきの隣の人が入ってきた。その人はお礼に沢山の金をくれた。それからこの話が段々伝わって隣の村へ聞こえた。隣の村では猪が出て田畑を荒らす。何とかして退治せねばと言っているところだったので、隣の村に弓の名人がいるということだ。それに頼んで退治してもらおうということになって頼みに来た。息子は引き受けた。馬の用意をせよと言った。馬を連れてきたが、息子は馬に乗ったこともなければ、馬に乗ったのを見たこともないので、大きなことを言ったが困ったと思った。それから馬の上へ這い上がって後ろ向きに乗った。そして尻尾を固く握りしめた。この侍は不思議な侍だと言いながら隣村の百姓たちは馬の後ろへついて行った。その内に川へ来た。馬が川へ下りていくと、尻尾の方が高くなって、とてもいい具合だった。百姓たちは感心した。ところが川を渡ると、今度は向こうの岸へ上がることになった。馬は立った様に前が高くなったので、息子は弓を持ったまま、どぶんと川へ落ちてしまった。百姓たちがたまげると、その方ども、何を騒ぐかと言って息子は鮎を二尾ほど矢へ突き刺して、これを獲りに入ったのだと言って上がってきた。なるほど、名人というものは違ったものだ、百姓たちはまた感心した。それからまた馬に乗って、いよいよ隣村へ着いた。猪はどこに出るかと聞くと、あの向こうの山へ出るとなって、明くる日になると、息子は大きな高い崖のほとりへ行って待っていた。ところがいくら待っても猪が出てこない。退屈になったので、着物を脱いで蚤を取りはじめた。そこへ大きな音がしたかと思うと、大きな猪が飛んできた。あまり急に来たので、弓を射る間もありはしない。慌てて蚤をとっていた着物を振ると、猪が真っ直ぐに飛んでいって崖の上から下へ落ちてしまった。息子は急いで下りてみると、猪は足を折って死んでいる。百姓たちが来ては具合が悪い。矢を尻の穴に力いっぱい差し込んでおいた。それから上へあがって着物を着て休んでいると百姓たちがやって来た。あそこの崖の下にいるはずだから行ってみよと言い、一緒に下りてみると、大きな猪が死んでいる。百姓たちは感心して見ていたが、どこにも矢が立っていない。よくよく見ると尻の穴から羽根が覗いている。これは上手なこと。肉を少しも痛めずに射たものだ。これがまことの名人だと百姓たちはますます感心した。この話がどんどん広がって殿さまの耳に入った。殿さまには姫がいたが、いい聟がいなくて困っていた。そういう弓の名人がいるなら、この頃山賊が出て困っているからこれを退治させて、退治したら姫の聟にすることにしようと殿さまは言った。百姓の息子は殿さまの前へ召し出された。姫が見ると出来の悪い百姓の様な男なので、どうもこの男は自分の聟には欲しくないと思って、どうかして殺してやりたいと思った。そこで握飯を沢山こしらえて、その中へ毒を入れて持たせて山賊の出るところへ連れていった。息子はそれがしは弓の名人である。山賊どもが毎晩出て荒らすということを聞いて征伐に参った。すぐに出てこいと大きな声で怒鳴った。すると何をぬかすか、小せがれめと言って五六人の山賊が岩屋から出てきた。息子は弓を射ることも何もできない。これは敵わないと思って、どんどん逃げ出した。山賊たちはどこまでも追っかけてくるので、息子は敵わないので木へ登った。木登りはとても上手なので猿の様に上っていくと、腰に結んでいた握飯の紐が解けてボトボトみな落ちた。山賊たちはこれを見ると、腹が減っていたと見えてわれ勝ちに拾って食べたので皆死んでしまった。息子はこの様を見ると、木の上から下りてきて皆首を切って、殿さまのところへ持って帰った。いいつけ通り、山賊をことごとく退治したから、約束通り姫の聟にしてくれと殿さまに申し上げた。そして殿さまも姫も息子を聟にした。
・「運のよいむすこ」(偕成社『島根県の民話』)
昔、ある田舎に百姓の息子がいた。毎日毎日畑打ちをしていたが、つらくていけない。ああ、嫌だ。こんなことをしていてもちっとも面白くない。畑打ちしないで威張っているのは侍だ。よし、侍になろう。侍になれば威張れると思った。それで刀を二本買って腰に差し、旅に出かけた。歩いている内に日が暮れかかったので宿へ泊った。そうしたら弓と矢が床の間に置いてあった。感心しながら弓に矢をつがえパッと放した。すると矢は障子をぶち抜けて外へ飛んでいってしまった。しまった、早く逃げなければ。息子は慌てて庭へ下り草鞋を履きかけた。そうしたら玄関の方でこの宿にお侍さんが泊っているか尋ねる声がした。聞いていると、隣の屋敷に盗人が入って物を盗って逃げようとしたら矢が飛んできて当たった。盗人はびっくりして跳んで逃げた。お陰で助かったという。そこで息子はそれなら逃げなくていいと草鞋を脱いで素知らぬ顔をしていた。そこへ隣の人がやって来て礼を言ってから沢山お礼の金や土産物をくれた。何日かすると、このことが隣村へ知れた。そうしたら、隣村の人が来て猪退治を依頼してきた。息子は馬と弓矢を用意するよう指示して承諾した。やがて馬が来たが、馬に乗ったことがない。仕方なくなんとかなるだろうと思って後ろ向きに乗った。そして片手で尻尾を固く握って歩かせた。不思議に思いながら隣村の百姓たちはついて行った。その内に川へ来た。馬が川へ下りていくと尻尾を握っている方が高くなっていい具合だった。なるほどと感心していると、今度は向こう岸に上がることになった。そうしたら馬の前が高くなり、息子は弓矢を持ったまま川へ落ちてしまった。百姓たちがたまげていると、息子は鮎を二匹、矢に突き刺したのを見せてこれを獲りに川に入ったのだと言い張った。百姓たちはまた感心した。隣村に着くと息子は猪のいる山奥の崖に連れていかれた。そして、そこで待っていたが、猪は一向に出てこない。その内、暑いので着物を脱いで寝ていた。すると、そこへ大きな猪が跳んで出た。あまり急に来たので仕方なく着物を振った。猪は着物めがけて真っ直ぐ飛んできて、崖の下に真っ逆さまに突っ込んだ。息子が急いで降りてみると、猪はコロッと死んでいた。弓で退治したことにしなければならないのに、落ちて死んでしまっては具合が悪いと息子は猪の尻の穴に矢を差し込んでおいた。そして崖の上へあがって待っていると百姓たちがやって来た。息子の言う通りに百姓たちが崖の下へ降りてみると大きな猪が矢に当たって死んでいたので、これは皮や肉を傷めないように尻に矢が入っている。これは真の名人だ。百姓たちはますます感心してしまった。この話がどんどん広がって殿さまの耳に入った。そんなに弓の上手な侍がいるなら呼んでこい。近頃、山賊が出て困っておる。山賊を退治したら姫の婿にしてやろうと殿さまは言った。息子は殿さまの前に連れてこられたが、あまりいい格好ではなかったので姫さまはいい顔をしなかった。あんな侍は嫌だ。山賊にやられてしまえばいいと思って、しびれ薬を入れた握り飯を作って息子に持たせた。山賊のいる山へ出かけた息子は自分は弓の名人だ。征伐に参った。いるなら出てこいと大声で怒鳴った。すると、洞穴の中から五、六人の山賊が出てきたから弓を射るどころではなくこれは敵わないとどんどん逃げた。山賊はどこまでも追っかけてくるので高い木に登って隠れていた。そうしたら、握り飯を入れておいた袋の紐が解けて握り飯がみんな落ちてしまった。ちょうどそこへ山賊が来た。山賊たちは腹が減っていたので握り飯を拾ってみんな食べてしまった。すると、体がしびれて動けなくなってしまった。息子は山賊たちを皆縛ってから殿さまのところへ行った。山へ行ってみると、本当に山賊が縛られていた。どうやって独りで捕まえたのだろうかと誰もが不思議に思ったが、見事に捕まえているので文句の言いようがなかった。姫さまも息子が強い侍と分かって初めほど嫌でなくなった。そして息子は姫さまの婿になって仲良く暮らした。
・「怪我の功名」(未来社『石見の民話』)
昔、大ほら吹きの男がいた。どこへ行って何を殺したと剣術が上手だとかほらを吹いていた。そこへ余所の村からそんなに強いならうちの村で化物が出て困っているが来て退治してくれないかと頼みに来た。どうも行かれないとは言えない。それで応じてその村へ出かけた。これは大変なことになった。どんな物が出るだろうと思って来てみると、大きな蜘蛛の巣の張った空き家で長押に五人張り二十五束という弓が掛けてあった。これはいいものがあると思って弓を取ってみた。さて、夜遅く静かになってから向こうの山がごうっといってしばらくすると破風でダダダッと大きな音がした。すると天井の間から一ツ目の大きな化物がニューっと覗いた。それで恐ろしくなってその方へ向けて五人張りの弓をパーンと投げた。すると化物はギャーッといって逃げてしまった。そうこうする内に鶏が鳴いて夜が明けた。夕べの男はどうなったかと村の者たちが連れ立って見に来た。男は元気で座っているので、どうしたかと言うと、確かに化物が出た。ここにあった弓で自分が退治した。確かに手応えがあったから見よ、血を落として逃げていると答えた。村の者が見るとずうっと血が落ちているので、跡をつけて行くと山の奥の洞穴に大きな古狸が死んでいた。それで化物を退治してくれたというので村では手のたつ名人ということになった。とうとう村一番の身上のよい家の聟に貰われた。その家の娘はとてもきれいな娘だった。ところが大ほらふきの男は手がたつとは言っても大変みっともない男だった。それで娘はこんな聟では恥ずかしいからどうにかして帰ってもらいたいと思ったが、どうしても帰らない。そこである日、遠くの村からうちの村で山賊がたくさん出て悪いことをして困っている、ここには大変手の立つ人がいたので来て退治してくれないかと頼みに来た。男は快く引き受けた。これはいい。山賊を退治しに行けば弁当を持っていくからその時に毒むすびをこしらえて持たせればいいと思って女房はむすびの中へ毒を入れて風呂敷に包んで持たせた。さて、山賊がいるという山へ行ってみると、山賊たちは大きな松の木の根元へ鍋やら釜やら置いてそこで寝起きしていた。ちょうど山賊たちは出かけていない。戻ったら恐ろしいので松の木のずっと上の方へ登って隠れていた。そんなことを知らない山賊は夕方になると分捕ったものをたくさん持って帰って飲み食いした。ところが松の木の下で火を焚いて酒を沸かすので煙たくてどうしようも無い。それで風上へあっち行きこっち行きして廻っていたところ、腰へつけていたおむすびがいつの間にか落ちてしまった。山賊は大騒ぎをして飲んだり歌ったりしていたが、その内に静かになった。山賊は寝た塩梅だから、むすびでも一つ出て食おうと思って男は腰を探したがむすびは一つも無い。ははあ、ああだこうだする内に落ちたのだろうと思って降りてみると山賊たちは皆酒に酔ったのか死んだのか分からないようになって寝ている。男はそれを片っ端から首を切って、山賊は皆退治したと言って戻った。山賊は男の弁当を拾って食べたので毒にあたって死んだのだ。これは本当に手のたつ偉い人だと思って、それからは女房も男を大切にして仲良く暮らした。
◆コーディングルール
※コーディングルールのキーワードは重要と判断したものを人力でピックアップしている。そのため、恣意性を伴う分析となる。
※活用形でなく基本形で入力する。
※[前処理]→[語の抽出結果を確認]でキーワードがどのように分節されているか検索すると結果の一覧[語の抽出結果]が表示される。
※[Result]から確認したい行をクリックして選択、画面下の[詳細表示]ボタンをクリックするとサブ画面が表示され、活用形や基本形が確認できる。
※昔話では「否定/肯定」「肯定/否定」と属性が変化することが多いと考え、否定詞「ない」「まい」「ぬ」「ん」、また禁止を意味する「な」を共通のコードとして設定している。
※[関連語検索]で否定詞の共起語の一覧を表示させたところ、日本の昔話のように掌編レベルのボリュームだと、物語の動因となる箇所に関する語句が上位に表示される傾向が強いのではないか……といった印象があり、検証作業中である。
※無償版では強制抽出語の指定が機能制限で事実上使用できないため以下のような手法をとっている。
*宿
宿 or 宿屋
*矢
矢 or 羽根
*家
家 or 屋敷
*退治
退治 or 征伐
*聟
聟 or 婿
*握り飯
'握飯' or 握り飯 or 'むすび' or 'おむすび'
*毒
毒 or 薬
*百姓
百姓 or '畑打ち' or 仕事
*隣
隣 or 余所
*みっともない
みっともない or ( いい and 格好 and ない ) or ( 出来 and 悪い )
*女房
娘 or 女房
*名人
名人 or ( 手 and 立つ )
*肛門
尻 and 穴
*ない
ない
*ぬ
ぬ
*ん
ん
*るな
'るな'
*るまい
'るまい'
*息子
息子
*嫌
嫌
*侍
侍
*刀
刀
*旅
旅
*弓
弓
*盗人
盗人
*話
話
*村
村
*猪
猪
*馬
馬
*後ろ向き
後ろ向き
*川
川
*落ちる
落ちる
*山
山
*着物
着物
*崖
崖
*感心
感心
*殿さま
殿さま
*姫
姫
*山賊
山賊
*木
木
*登る
登る
*死ぬ
死ぬ
*隠れる
隠れる
*しびれる
しびれる
*動く
動く
*縛る
縛る
*不思議
不思議
*仲良し
仲良し
*ほら
ほら
*男
男
*化物
化物
*空き家
空き家
*逃げる
逃げる
*血
血
*洞穴
洞穴
*古狸
古狸
*身上
身上
*帰る
帰る
*困る
困る
*煙たい
煙たい
*首
首
*切る
切る
◆共起ネットワーク
・[コーディング単位]を[H5]に設定する。
※[描画する共起関係(edge)の選択]で「係数」を「0.2」から「0.3」に修正する。
※[強い共起関係ほど濃い線に]にチェックを入れる。
Jaccard係数が0.3以上はかなり強い共起関係にあることを示しているが、分析対象となる元データの文字数が少ないため係数が高めに出てしまう傾向にあるため、こうしている。
※Jaccard係数は共起関係(※ある言葉に続いて出てくる関係)の強さを表し 0≦係数≦1 の範囲の値をとる。
【Jaccard係数】
・0.1 →関連あり
・0.2 →強い関連あり
・0.3以上 →とても強い関連あり
※ただし、あくまで目安であって絶対ではない。
ざっと確認したところ、共通するキーワードが中央のサブグラフ(バブルが島状に集まった一塊)に表示され、類話によって異なるキーワードがそれぞれのサブグラフとして周辺に表示される形となっている。
※なお、各バブル間の距離や配置に意味はない。
◆対応分析
・[コーディング単位]を[H5]に設定する。
※[外部変数]は[タイトル]のまま続行。
※[差異が顕著なコードを分析に使用]で上位「40」とした。また[バブルプロット]にチェックを入れている。これらは文字の重なりを極力避けるためである。
※文字が重なって読みづらい場合、オプション画面の[コード選択]で不要なコードのチェックを外してもよい。
x、y軸上の原点(0.0)から点線が伸び交差した箇所が原点となる。原点から離れるほど特徴的なキーワードだと分析される。
原点付近に「矢」「殿さま」「弟」「猪」といったキーワードが多数プロットされている。未来社版では「ほら」「化物」「女房」といったキーワードが離れてプロットされている。偕成社版では「しびれる」「縛る」が原点から離れた特徴的なキーワードとされている。
◆解釈
「弓の名人」と「運のよいむすこ」はほぼ同じ話である。偕成社版では山賊は殺されず捕まるといったマイルドな結末となっている。「怪我の功名」は類話ではあるものの、やや異なる展開をみせる。そこが上記の差となって表れたのだろう。
◆階層的クラスター分析
・[コーディング単位]を[文]に変更、実行するとデンドログラム(樹状図)で可視化される。
※キーワード指定しても可。
概ねストーリーに沿った内容でクラスター化されている。
※当ブログの場合、[コーディング単位]が[段落][H5]だと、コードを全て選択するとエラーが返される結果となった。
◆クロス集計
・[コーディング単位]を[文]に変更、[集計]する。
※「タイトル」で集計をかけた。
クロス集計をかけたところ、「百姓」「女房」「息子」といったキーワードでカイ(χ)2乗値で相関関係を示す結果(※マーク)が得られた。
マップとして描画したところ、「化物」「女房」というキーワードの残差が大きく(濃く)表示される結果となった。バブルとしては「男」「息子」「山賊」「ない」が大きく描画された。
◆KWICコンコーダンス
現状ではテキストマイニングのツールに文脈を読む性能はないため実際に該当箇所を読んで人力で判断する他ない。KWICコンコーダンスでキーワード指定すれば指定したキーワードがどのような文脈で用いられているか一覧で抽出される。
◆関連語検索
・[集計単位]を[文]に変更、[集計]する。
・[Search Entry:]の一覧からキーワードを選択してダブルクリックすると[Result]に指定したキーワードの品詞や共起関係が表示される。
※[Result:]から行指定してダブルクリックするとKWICコンコーダンスに遷移する。
※[Result:]の一覧から範囲指定して[コピー]したものを表計算ソフトやテキストファイルにペーストすることも可能である。
[#直接入力]を指定して「刀」といったキーワードで検索すると関連語が一覧で表示される。
◆属性の転倒
・「ない」の結果上位一覧
| N | 抽出語 | 品詞 | 全体 | 共起 | Jaccard |
| 1 | 奥 | 名詞C | 1 (0.005) | 1 (0.250) | 0.25 |
| 2 | 何とか | 副詞 | 1 (0.005) | 1 (0.250) | 0.25 |
| 3 | 古狸 | 名詞 | 1 (0.005) | 1 (0.250) | 0.25 |
| 4 | 済む | 動詞 | 1 (0.005) | 1 (0.250) | 0.25 |
| 5 | 少し | 副詞 | 1 (0.005) | 1 (0.250) | 0.25 |
| 6 | 跡 | 名詞C | 1 (0.005) | 1 (0.250) | 0.25 |
| 7 | 蔵 | 名詞C | 1 (0.005) | 1 (0.250) | 0.25 |
| 8 | 痛める | 動詞 | 1 (0.005) | 1 (0.250) | 0.25 |
殿さまの頼みで息子は山賊退治にでかける。姫さまは息子が気に入らないので毒入りのむすび飯を持たせて密かに殺してしまおうとするが、その毒むすびを山賊たちが食べてしまい、山賊たちは退治された……といった粗筋となっている。
このように短いお話の中で属性の転倒を多用するのが昔話の特徴の一つと考えられる。
ここで「/」(スラッシュ)を「転倒」を意味する記号として用いる。スラッシュは様々な場面で用いられていて文脈依存的な記号という欠点もあるが、視覚的にはイメージしやすいと判断した。
・[姫|息子:気に入らない/認める]
・[山賊|毒むすび:生/死]
・[男|偶然:ほら/実現]
こういった風にお話を転がしていると分析できる。旅に出た息子の立場は「百姓/侍」へと転倒する。
◆類似度行列
・[コーディング単位]を[文]に変更して[集計]。Jaccard係数がマトリクス形式で確認できる。
・ある列を選択して画面右下の[コピー(選択列)]をクリックすると、当該のキーワードに関するJaccard係数がコピーされるので、それを表計算ソフトにペーストするといった利用が可能となる。
※当ブログでは[コーディング単位]が[段落][H5]の場合、Jacccard係数が1.0~0.5といった結果がほとんどで、意味のない結果となった。
◆多次元尺度構成法
・[コーディング単位]を[文]に変更して実行。
・共起関係を確認したいキーワードを指定。
・次元を「2」から「3」に変更して実行、三次元のマップとした。
息子ないし男が山賊を退治する粗筋に関連したキーワードを指定したところ、「しびれる」「首」がやや離れた位置にプロットされた。
※選択するキーワードによって相対的な位置関係は変わり得る。
※実行すると指定したキーワードの幾つかが除外されるとメッセージが表示される。テキストのボリューム不足のためか無償版の仕様によるものか判断がつかない。
※当ブログの事例では「文」以外、「段落」と「H5」では除外されるキーワードが増える傾向となった。
◆自己組織化マップ
[コーディング単位]を[文]に変更して実行。
記述内容が視覚的に整理され、類似性の高い内容が近くに配置される。概ねストーリーに沿った形で各クラスターが表示される。
※当ブログの事例では「文」以外、「段落」と「H5」ではエラーが返される結果となった。
※クラスター化の計算を繰り返すため処理に時間がかかるので要注意。
※クラスターの配置、距離に意味はない。
◆トピックの推定
・[ツール]→[文書]→[トピックモデル]→[トピックの推定]を選択。
・[集計単位]を[文]に変更。
・[OK]ボタンをクリックすると、[トピックの推定結果]画面が表示される。
・各トピックで高い確率で出現する語句がリストアップされる。
・[#1]といった欄をクリックすると、文書検索画面が表示される。
◆ベイズ学習による分類
・[ツール]→[文書]→[ベイズ学習による分類]→[外部変数から学習]を選択。
・[分類の単位]を[文]に変更。
・[学習する外部変数]は[書名]に変更する。
※「タイトル」のままでもよし。
・[OK]ボタンをクリックすると、ファイルの保存画面が表示されるので、任意のファイル名を記述して保存する。
・[ツール]→[文書]→[ベイズ学習による分類]→[学習結果ファイルの内容を確認]を選択。ファイル選択画面が開くので、先ほど保存したファイルを指定して開く。すると[学習結果ファイル]画面が開くので内容の確認を行う。
※[学習結果を用いた自動分類]については割愛する。
※[トピックの推定]と[ベイズ学習による分類]は固有名詞などを強制抽出語としてあらかじめ指定しておかないと正確に分析されないケースが生じる。正式に利用したい際は有償版の購入をお勧めする。当ブログのはあくまでテストケースとしてのものである。
※[トピックの推定]と[ベイズ学習による分類]はコーディング・ルールに依らない分析手法となるが、筆者の能力的に追及はしない。
◆参考文献
・『日本の民話 34 石見篇』(大庭良美/編, 未来社, 1978)pp.156-159, 437-444.
・『島根県の民話 やまたのおろちほか』(日本児童文学者協会/編, 偕成社, 2000)pp.173-180.
・『動かして学ぶ!はじめてのテキストマイニング』(樋口耕一, ナカニシヤ出版, 2022)
・『社会調査のための計量テキスト分析 【第2版】 内容分析の継承と発展を目指して』(樋口耕一, ナカニシヤ出版, 2020)
| 固定リンク

































































































































































































































































































































