12.6.2. 文字コードと改行コード
文字コードは utf-8 が広く使われているが、他のコードも使われてきたことを 12.4. 人のための文字 で学びました。 mi でいろいろな文字コードのファイルを開いてみましょう。
文字コード #
前ページで練習した /home/hwb/exercise/text
から japanese-1.txt
を mi で開いた画面です。
ウィンドウ上部のツールバーの部分にISO-2022-JP
と表示されています。
これが mi が自動で認識した文字コードです。
練習 #
同じフォルダには japanese-1.txt
, japanese-2.txt
, japanese-3.txt
, japanese-4.txt
の4つのテキストファイルがあります。
- それぞれの文字コードを mi で調べてみましょう
- 4つのファイルの中で「テキストエディット」で開けるのはどれでしょう? 理由を検討してください
使われている文字コードは 12.4.3. 多言語環境とUnicode で紹介した utf-8 と 12.4.4. 日本語文字コードと変換 で紹介した3種類のいずれかです。
また文章は以下のいずれかの冒頭です
吾輩は猫である (夏目漱石) 源氏物語 桐壺 (與謝野晶子訳) 柿の種 (寺田寅彦) 東京大学憲章 前文
変更と保存
改行コード #
文字のなかで改行を表すために CR
と LF
という制御文字があり、環境によって
使い方に流儀があることを 12.2. ASCII
で紹介しました。
mi は自動で判別します。
認識した改行コードは文字コードの隣に示されています。図なら
LF (Mac/UNIX)
です。