26.4.4. ファイルの圧縮と展開
ファイルの可逆圧縮を体験しましょう.可逆ですので,元の情報は損なわれることなく,復元することが可能です.つまり,元の情報を適切に符号化することによって,ファイルサイズを小さくするものです.
複数の方法があり,ファイル名の拡張子 zip や tar.gz などと対応します.
colab へのアップロード #
ここでは,colab を使う方法を紹介します.
11. Colabとファイル操作
まず,これまで使ってきた日本国憲法前文の冒頭をファイルとしてダウンロードします.
つづいて colab のノートブックを開きます
hwb-zip.ipynb
colab に,constitution.txt をアップロードしましょう.
左のサイドバーを,ファイルブラウザに切り替えます.右クリックから upload を選ぶ,もしくは,ツールバー上向き矢印のアップロードボタンで開いたダイアログで constitution.txt を指定しましょう.
ファイルサイズ #
colab の資料内の
アップロードされたファイルの確認 に進んで,
ls -l ファイル名 でファイルサイズを調べましょう.play_circle
%%shell
ls -l constitution.txt手元のGUIで constitution.txt のファイルサイズを調べられる場合は,colabでのサイズと比較してみましょう
圧縮 #
zip コマンドで圧縮します.
zip コマンドは,圧縮後のファイル名と 圧縮対象のファイル名の2つを指定します.今は使いませんが,圧縮対象のファイル名は複数指定することもできます
play_circle
%%shell
zip constitution.zip constitution.txtほとんどの環境で,GUIからzip圧縮することもできます.手元のPCで試して,圧縮率を比較ましょう.
展開 #
もとのファイル群を取り出すことを,展開あるいは伸張と呼びます.
zip で圧縮されたファイルの展開には,
unzip コマンドを使います.play_circle
%%shell
unzip constitution.zipunar コマンドが利用可能な場合は,
さまざまな方式を展開可能できるので,そちらがお勧めです.続く演習では,平均情報量と可逆圧縮の圧縮効率を比較します.


