htmlとは

Mariaのxbpポートフォリオ 第1回 htmlとは gitとは


テキストマイニング



テキストマイニングとは



テキストマイニングとは、テキスト(text:文章)とマイニング(mining:採掘)を合わせた造語である。

多くのテキストから、重要かつ貴重な情報を抜き出すという技術分野である。

参考サイト:テキストマイニングとは



テキストマイニングの方法



今回、課題で行った手順をしるす。


  1. 資料(今回は新聞記事)から調べるものについての情報を一つにまとめる。今回は得られた情報を比べるので

    一つにまとめたときに文字数や対象とした日時などをできるかぎり同じ条件にする。


  2. 次に、まとめたテキストをpythonを使い、分析する。


  3. 分析したものをわかりやすいように可視化する。


  4. 比較して分かったことをしるす



今回のテーマ:昔と今の大阪万博



1969年4月13日から1969年10月13日間の大阪万博についての記事と2024年4月13日から10月13日間の記事

を比べた。過去のほうは朝日新聞縮刷版を参考にし、現在のほうは朝日新聞の記事を参考にした。

文字数は2万字ずつにした



昔と今の共起ネットワーク図



昔の共起ネットワーク図




今の共起ネットワーク図





昔と今のサンバースト



昔のサンバースト





今のサンバースト






昔と今の単語頻出



昔の単語頻出




今の単語頻出




以上の結果よりわかったこと