ファイルの圧縮と展開

26.4.4. ファイルの圧縮と展開

ファイルの可逆圧縮を体験しましょう.可逆ですので,元の情報は損なわれることなく,復元することが可能です.つまり,元の情報を適切に符号化することによって,ファイルサイズを小さくするものです.

複数の方法があり,ファイル名の拡張子 zip や tar.gz などと対応します.

colab へのアップロード #

ここでは,colab を使う方法を紹介します.

Colab の基本的な操作は,11章を確認してください.

11. Colabとファイル操作

まず,これまで使ってきた日本国憲法前文の冒頭をファイルとしてダウンロードします.
つづいて colab のノートブックを開きます hwb-zip.ipynb

colab に,constitution.txt をアップロードしましょう.

左のサイドバーを,ファイルブラウザに切り替えます.右クリックから upload を選ぶ,もしくは,ツールバー上向き矢印のアップロードボタンで開いたダイアログで constitution.txt を指定しましょう.

ファイルサイズ #

colabのファイルブラウザに,constitution.txt が表示されれば成功です.
colab の資料内の アップロードされたファイルの確認 に進んで, ls -l ファイル名 でファイルサイズを調べましょう.
play_circle
%%shell
ls -l constitution.txt
手元のGUIで constitution.txt のファイルサイズを調べられる場合は,colabでのサイズと比較してみましょう

圧縮 #

zip コマンドで圧縮します. zip コマンドは,圧縮後のファイル名と 圧縮対象のファイル名の2つを指定します.
今は使いませんが,圧縮対象のファイル名は複数指定することもできます
play_circle
%%shell
zip constitution.zip constitution.txt
ほとんどの環境で,GUIからzip圧縮することもできます.手元のPCで試して,圧縮率を比較ましょう.

展開 #

もとのファイル群を取り出すことを,展開あるいは伸張と呼びます. zip で圧縮されたファイルの展開には, unzip コマンドを使います.
play_circle
%%shell
unzip constitution.zip
unar コマンドが利用可能な場合は, さまざまな方式を展開可能できるので,そちらがお勧めです.

続く演習では,平均情報量と可逆圧縮の圧縮効率を比較します.

グラフ描画と並べ替え previous page 26.4.4. ファイルの圧縮と展開 next page 課題
このサイトは開発版の はいぱーワークブック です.