テキストマイニングとは、テキスト(text:文章)とマイニング(mining:採掘)を合わせた造語である。
多くのテキストから、重要かつ貴重な情報を抜き出すという技術分野である。
参考サイト:テキストマイニングとは
今回、課題で行った手順をしるす。
資料(今回は新聞記事)から調べるものについての情報を一つにまとめる。今回は得られた情報を比べるので
一つにまとめたときに文字数や対象とした日時などをできるかぎり同じ条件にする。
次に、まとめたテキストをpythonを使い、分析する。
分析したものをわかりやすいように可視化する。
比較して分かったことをしるす
1969年4月13日から1969年10月13日間の大阪万博についての記事と2024年4月13日から10月13日間の記事
を比べた。過去のほうは朝日新聞縮刷版を参考にし、現在のほうは朝日新聞の記事を参考にした。
文字数は2万字ずつにした
昔の共起ネットワーク図
今の共起ネットワーク図
昔のサンバースト
今のサンバースト
昔の単語頻出
今の単語頻出