字符串是Python中常用的数据类型,本篇来记录下字符串的类型及操作。
字符串的表示:
字符串是由0个或多个字符组成的有序字符序列。由一对单引号或者一对双引号表示。例如:
"a = har"或者'a = har'
一对三单引号或者三双引号表示,可以表示多行字符串。
字符串有2类共4种表示方法:
- 在字符串中包含双引号或者单引号:
'这里有个双引号(")' 或者 "这里有个单引号(')"
- 在字符串中既包括单引号又包括双引号:
'''这里既有单引号(')又有双引号(")'''
字符编码
ASCII编码:
ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言,它是现今最通用的系统。计算机中,所有的数据在存储和运算时都要使用二进制数表示,像a、b、c、d这样的52个字母(包括大写)以及0、1等数字还有一些常用的符号(例如*、#、@等)在计算机中存储时也要使用二进制数来表示,大家必须使用相同的编码规则,于是美国有关的标准化组织就出台了ASCII编码。
- 比较字符ASCII码值的大小:
空格<数字<大写字母<小写字母
Unicode编码:
- 统一字符编码,既覆盖几乎所有字符的编码方式
- 从0到1114111(0x10FFFF)空间,每个编码对应一个字符
- Python字符串中每个字符都是Unicode编码字符
可以通过chr()来输入编码查找字符,也可以通过ord()来查询字符编码。
字符串操作符
a = 'http'
b = 'map' #下面表格以这两个为例
操作符 | 描述 | 使用 |
---|---|---|
a + b | 字符串连接 | ‘httpmap’ |
b * 2 | 重复输出字符串 | ‘mapmap’ |
a[2] | 通过索引获取字符串中字符 | ‘t’ |
a[2:3] | 截取字符串中的一部分 | ‘tp’ |
in | 成员运算符-如果字符串中包含指定的字符返回True | >>>'h' in a 结果:True |
not in | 成员运算符-如果字符串中不包含给定的字符返回 True | >>>'m' not in b’ 结果:Fales |
r/R | 原始字符串 - 原始字符串:所有的字符串都是直接按照字面的意思来使用,没有转义特殊或不能打印的字符。 原始字符串除在字符串的第一个引号前加上字母"r"(可以大小写)以外,与普通字符串有着几乎完全相同的语法。 | >>>print r'\n' |
Python访问字符串中的值
Python访问子字符串,用法与列表相似,使用方括号来截取字符串。示例: