桶屋ブログ

風が吹いても儲からないSE(仮)のブログ

Python 2.7.xの文字コードまとめ

苦戦しました・・・

備忘録書きます

 

open = str型でオープン

codecs.open(,文字コード) = 文字コード型の文字をunicode

 

.encode() = unicodeに変換

.decode() = unicodeを変換

 

codecs.openを使った場合、unicode型で書き込み可能(弊害不明)

 

あとダメ文字は化ける

結局解決策なし

 

また、os.~など自分のプログラムで生成しないものはOS側の文字コードに依存する(とりあえずWindowsならshift-jis、あとはutf-8?)

Winで動かすだけでなく鯖(UnixとかLinuxUTF-8だったかと)でもテストする必要がある

或いはそれでも動くように設定すべし

 

とりあえずこれだけ覚えておけば大丈夫だと思います

ダメ文字はダメだけど