24.1.4. 課題
別の文章で平均情報量を計算してみましょう.
ファイルの取得 #
教員の指示する方法で「EntropyData.zip」を取得し,ファイルを復元(伸長/解凍)しなさい.EntropyDataというディレクトリができるはずです.
提出用ファイル #
提出テンプレートFile から Make a copy で自分用の複製を作ってから,作業を始めましょう.
データの選択 #
EntropyDataというディレクトリには Data0からData9までの10個のサブディレクトリがあります.
サブディレクトリData0~Data9のうち,学生証番号の末尾番号と同じ番号を持つもののファイルについて,作業してください.各サブディレクトリ内には,いずれもabc.txt, Alice.txt, random.txtという3つのファイルがあるはずです.
- abc.txt
- 偏った(限られた)文字からなるファイルです.アルファベット26文字のうちの一部しか使われていませんが,存在しない文字は文字数0として計算します.
- Alice.txt
- 通常の英文ファイル,
- random.txt
- 文字がランダムに出現するファイルです.
内容 #
提出用テンプレートには,4つのシートがあります.
最初のシート「Summary」のなかの,科類クラス,学生証番号,氏名,実行環境,OS,OSバージョン,バージョンの欄と,表中の12個の空欄を埋めてください.その準備として,残り3つのワークシートをそれぞれ対応するファイルについて平均情報量の計算とソートしたグラフの作成を行ってください.