内容正文:
1 3.2 Python程序设计 6、字符串 6.1 字符串 除了支持序列通用操作(包括双向索引、比较大小、计算长度、元素访问、切片、成员测试、使用运算符 + 连接字符串、与整数相乘表示重复等操作),字符串类型还支持一些特有的操作方法,如字符串格式化、查找、替换、排版等。 字符串属于不可变序列,不能直接对字符串对象进行元素增加、修改与删除等操作,切片操作也只能访问其中的部分元素而无法修改字符串中的字符。字符串对象提供的方法 replace() 和 translate() 也不是对原字符串直接进行修改替换,而是返回一个新字符串。 2 6.2 字符串编码格式 GB2312 是我国制定的中文编码,使用 1 个字节表示英语, 2 个字节表示中文; GBK 是 GB2312 的扩充,而 CP936 是微软公司在 GBK 基础上开发的编码方式。 GB2312、 GBK和 CP936 都使用 2 个字节表示中文。 不同编码格式之间相差很大,采用不同的编码格式意味着不同的表示和存储形式,当将同一字符存入文件时,写入的内容可能不同。在理解其内容时必须了解编码规则并进行正确解码,否则无法还原信息,也无法正常理解。 Python 3.x 默认使用 UTF-8 编码格式,完美支持中文字符。 3 6.2 字符串编码格式 >>> s = '肩背一匹布,手提一瓶醋,走了一里路,看见一只兔,卸下布,放下醋,去捉兔。跑了兔,丢了布,洒了醋。' >>> len(s) # 字符串长度,或者包含的字符个数 48 >>> s[:17] # 切片,前17个字符 '肩背一匹布,手提一瓶醋,走了一里路' >>> s = '人生苦短,我用Python。' # 中文与英文字符同样对待,都算一个字符 >>> len(s) 14 >>> 姓名 = '张三' # 使用中文作为变量名 >>> print(姓名) # 输出变量的值 张三 4 6.3 转义字符 5 转义字符 含义 \b 退格,把光标移动到前一列位置 \f 换页符
换行符 \r 回车 \t 水平制表符 \v 垂直制表符 \\ 一个斜线\ \' 单引号 \'' 双引号 \ooo 3位八进制数对应的字符 \xhh 2位十六进制数对应的字符 \uhhhh 4位十六进制数表示的Unicode字符 6.3 转义字符 例5-12 编写程序,显示进度条。 import t