chardet python版にCP932対応しました

Sublime Text2でMicrosoftコードページ932のファイルを編集する方法」の続きエントリです。

chardet にて CP932 のテキストファイルでの判定が可能になるよう修正してみました。 現時点では ConvertToUTF8 へ反映してテスト中です。chardetの方は Pull Request を行ったところです。ただし、途中でエラーにならずに計算が通った程度です。CP932の範囲内すべての文字で構成されたテキストファイルでテストをすると、数値計算していますが他のエンコーディングへ判定してしまうという状況です。 chardetライブラリのテスト中に、タブや改行コードが含めた文字列で判定させるとシフトJISファイルでも判定エラーになっていましたので、この問題へも対応しています。シフトJISファイルを開いても文字コード指定のポップアップが出ていたのはタブ文字入りだと判定しないという問題があった為でした。 ブランチはGithubのこれですが状況をみてから将来 master へ反映させる予定です。

追伸: idの数字1126は11月26日誕生日をさします というわけで、age++ 誕生日おめでとう俺