2026.04.22文字コードとは?仕組みと文字化けの基本についてTECH BLOG

  • HOME
  • TECH BLOG
  • 文字コードとは?仕組みと文字化けの基本について

文字コードとは?仕組みと文字化けの基本について

文字コードとは

文字コードとは、文字をコンピュータで扱うためのルールです。

コンピュータは「あ」や「A」といった文字をそのまま理解できないため、
すべての文字は「数値の並び(バイト列)」として保存されています。

例えば、「A」という文字は「65」といった数値で表されます。
このように「どの文字をどの数値に変換するか」を決めたものが文字コードです。


なぜ文字コードが必要なのか

もし文字コードがなければ、同じデータでも環境によって違う文字に見えてしまいます。

  • 保存する側
  • 読み込む側

この両方が同じルール(文字コード)を使うことが重要です。


主な文字コード

実務でよく使うものだけ押さえておけば十分です。

文字コード 特徴
UTF-8 世界標準。ほぼすべての文字に対応
Shift_JIS 日本のWindowsで使われてきた
UTF-16 一部のシステム内部で使用

基本は UTF-8を使えば問題ない ことがほとんどです。


文字化けの原因

文字化けはシンプルに言うと、違う文字コードで読み込んでしまうことで発生します。

  • UTF-8で保存したデータを
  • Shift_JISとして読み込む

このような場合、正しく表示されず、意味不明な文字になります。


(補足)CSVとExcelで文字化けする理由

実務でよくあるのが、CSVをExcelで開いたときの文字化けです。

主な原因はこれです。

ExcelがCSVをShift_JISとして読み込むことがあるため

  • CSV:UTF-8で作成
  • Excel:Shift_JISとして解釈

→ 文字化け


対処方法(軽く押さえる)

  • UTF-8(BOM付き)でCSVを保存する
  • Excelの「インポート」機能で文字コードを指定する

このどちらかで大体解決できます。