25.1.4. ファイルの圧縮と展開
ファイルの可逆圧縮を体験しましょう.可逆ですので,元の情報は損なわれることなく,復元することが可能です.つまり,元の情報を適切に符号化することによって,ファイルサイズを小さくするものです.
複数の方法があり,ファイル名の拡張子 zip や tar.gz などと対応します.
colab へのアップロード #
ここでは,colab を使う方法を紹介します.
まず,これまで使ってきた日本国憲法前文の冒頭をファイルとしてダウンロードします.
つづいて colab のノートブックを開きます
zip.ipynb
colab に,constitution.txt をアップロードしましょう.
左のサイドバーを,ファイルブラウザに切り替えます.右クリックから upload を選ぶ,もしくは,ツールバー上向き矢印のアップロードボタンで開いたダイアログで constitution.txt を指定しましょう.
ファイルサイズ #
colab の資料の
アップロードされたファイルの確認 に進んで, ls -l ファイル名 でファイルサイズを調べましょう.
手元のGUIで constitution.txt のファイルサイズを調べられる場合は,colabでのサイズと比較してみましょう
圧縮 #
zip コマンドで圧縮します.
zip コマンドは,圧縮後のファイル名と 圧縮対象のファイル名の2つを指定します.
zip constitution.zip constitution.txt
今は使いませんが,圧縮対象のファイル名は複数指定することもできます
ほとんどの環境でGUIでの圧縮も可能です.手元のPCでzip圧縮して,圧縮率を比較してみましょう.
展開 #
もとのファイル群を取り出すことを,展開あるいは伸張と呼びます.
zip で圧縮されたファイルの展開には,
unzip コマンドを使います.
unzip constitution.zip
unar コマンドが利用可能な場合は,
さまざまな方式を展開可能できるので,そちらがお勧めです.続く演習では,平均情報量と可逆圧縮の圧縮効率を比較します.


