🐿
Git Bash のコンソールで UnicodeEncodeError が出たときの対処法
作成日:
2021/11/23
0
Windows での話です。
Git Bash のコンソールで作業していて、print文で cp932(≒shift-JIS) の範囲外の文字を出力しようとしたらしく "UnicodeEncodeError" が出ました。
UnicodeEncodeError: 'cp932' codec can't encode character '\u0125' in position 5: illegal multibyte sequence
調べてみたら、Windows の Git Bash コンソールは cp932 がデフォルトらしいです。utf-8 を通すためには環境変数 PYTHONIOENCODING を設定する必要があるということでした。
export PYTHONIOENCODING='utf-8'
これで print 文でエラーが出ることはなくなりました。
この1行を ~/.bash_profile に追記しておけば、いつでも大丈夫だということです。
pythonで自然言語処理プログラムが書けるようになりたいと思っています。Ticketnoteで自分の到達度を確認できれば嬉しいです。