UTF-8

文字コードの一種であるUnicodeにはBOM無しとBOM付きの2種類が存在します。BOMはバイトオーダーマーク(byte order mark)の略で、Unicodeで符号化したテキストの先頭に付与される数バイトのデータのことです。

フリーのテキストエディタであるTeraPadの場合は上部メニューの「ファイル」→「文字/改行コード指定保存」で確認することができます。ちなみに「UTF-8」がBOM付き、「UTF-8N」がBOM無しを意味しています。同じくフリーウェアのサクラエディタなどもBOMの設定が可能なので、少しリッチな機能の付いたテキストエディタを色々と試してみてはいかがでしょうか。

UTF-8にはBOMありとBOMなしの2種類がある。

BOM(Byte Order Mark)

BOMは16進数で「FEFF」という16ビットの値

秀丸エディタで「名前を付けて保存」ダイアログの右下でBOMの有無を確認する

UTF-8 のテキストファイルを作成するとき、「BOM 付き」とか「BOM なし」といった言葉を耳にする。

文字コードを「ANSI」「UTF-16 LE」「UTF-16 BE」「UTF-8」「UTF-8(BOM付き)」の6種から選択可能に。