设为首页收藏本站
查看: 97|回复: 0

[PHP] 分享一个用python遍历字符串(含汉字)的方法

[复制链接]

论坛元老

Rank: 6Rank: 6

积分
34268
主题
17031
UID
1347
M币
67
贡献
17170

  • 发表于 2017-5-14 02:44:00 | 显示全部楼层 |阅读模式
    这篇文章主要介绍了python 遍历字符串(含汉字)实例详解的相关资料,需要的朋友可以参考下
    python 遍历字符串(含汉字)实例详解
    s = "中国china" for j in s: print j首先一个,你这个'a'是什么编码?可能不是你所想的gbk
    >>> a='中国' >>> a这样试试看,如果出来是6个字(word),说明是utf-8,如果是4个字,说明gbk。
    另外,不管是utf-8还是gbk,都不能这样遍历,因为这里它会一个字一个字拿出来。虚拟机把a当成一个长度为len(a)的字符串了。
    接下来是遍历问题。
    Linux的shell大都默认是utf-8,所以一个中文字符是三个字,所以要三个三个地读,你可以试下:
    >>> a[:3]出来就是个”中”字
    windows的command的默认是cp936,也就是gbk,一个中文字符是两个字,所以两个字两个字地读(a[:2])。
    还有另一种遍历的方法,把字符串转换成unicode,这样中文英文都是一个字,就可以用你的for i in a的方法遍历了。这个的好处是中文英文字符都是一个字,而utf-8和gbk里,英文字母只占一个字。
    s = u"中国china" for j in s: print j输出如下:
    中 国 c h i n a
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    在我站开通SVIP可同时获得17个站点VIP资源 立即登录 立即注册
    快速回复 返回顶部 返回列表