Chardet 通用字符编码检测器开源项目

我要开发同款
匿名用户2017年03月03日
70阅读
开发技术PythonHTML/CSS
所属分类文档/文本编辑、应用工具
授权协议LGPL

作品详情

Chardet是一款通用字符编码检测器。

支持

ASCII、UTF-8、UTF-16(2种变体)、UTF-32(4种变体)

Big5、GB2312、EUC-TW、HZ-GB-2312、ISO-2022-CN(繁体中文和简体中文)

EUC-JP、SHIFT_JIS、CP932、ISO-2022-JP(日语)

EUC-KR、ISO-2022-KR(韩语)

KOI8-R、MacCyrillic、IBM855、IBM866、ISO-8859-5、windows-1251(斯拉夫语)

ISO-8859-5、windows-1251(保加利亚文)

ISO-8859-1、windows-1252(西欧语言)

ISO-8859-7、windows-1253(希腊语)

ISO-8859-8、windows-1255(希伯来语)

TIS-620(泰语)

注意:ISO-8859-2和windows-1250(Hungarian) 检测器模型有待重新训练,暂时还不可用。

要求Python2.6及以上版本

安装

PyPI :

pip install chardet
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论