5月 202013
 

chardetのことができます簡単に文字列/ファイルエンコーディング検出を使用してください。あなたには、いくつかのページを登るする必要がある場合は特に、日本語のWebページ、一部のページshift-jis/euc-jp、UTF8いくつかの使用では、HTMLページのcharsetタグは、時にはそれが正しいではないですが、Webは、非常に重要なコーディングを知っています。私たちは忙しい役立つchardetの。

chardetのインスタンス

>>> import urllib
>>> rawdata = urllib.urlopen('http://www.google.co.jp/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'confidence': 0.98999999999999999, 'encoding': 'utf-8'}
>>>

chardetの検出機能は直接文字エンコーディングを検出することができる。この関数は、辞書の値、2元、1が信頼性を検出され、他のいずれかが検出されたエンコーディングを返します。
chardetのインストール

直接ダウンロードchardetの、解凍chardetのアーカイブ、アプリケーションディレクトリにchardetのフォルダには、インポートchardetのスタートベータchardetのを使用することができます。

またはすべてインポートchardetのはできる限り、プログラムをのpythonので、Pythonのシステムディレクトリにsetup.pyインストールファイル、chardetのコピーを使用しています。

python setup.py install
5月 202013
 

Notepad++開発環境は無料であって、各開発言語にも対応できるので、非常にお勧めのソフトウェアである。

今回ではNotepad++開発環境でPythonを直接実行する方法を紹介する。

  1. Python 2.7とNotepad++ V6.3.2のソフトウェアのご用意。
  2. Plugins > Plugin Manager > Show Plugin Managerを開く
  3. Availableタブで NppExec(Latest update: Version 0.5:) にチェックしてInstall。自動的にRestartする。
  4. Plugins > NppExec > Excute (F6)
  5. Command(s)に pythonw -u “$(FULL_CURRENT_PATH)” としてOKで実行

以上、設定が完了。今度実行するとき、F6をクリックすることだけ。