前言

序列是Python中最基本的一种数据结构 , 数据结构指计算机中数据存储的方式 , 序列用于保存一组有序的数据,所有的数据在序列当中都有一个唯一的位置(索引) , 并且序列中的数据会按照添加的顺序来分配索引 .

序列的分类:

  1. 可变序列(序列中的元素可以改变):
    • 列表(list)
  2. 不可变序列(序列中的元素不能改变):
    • 字符串(str)
    • 元组(tuple)

列表

列表是Python中的一个对象 , 对象(object)就是内存中专门用来存储数据的一块区域 , 之前我们学习的对象,像数值,它只能保存一个单一的数据 , 列表中可以保存多个有序的数据 , 列表是用来存储对象的对象 .

列表的创建

创建列表,通过[ ]来创建列表 .

1
2
my_list = [] # 创建了一个空列表
print(my_list , type(my_list)) # [] <class 'list'>

列表存储的数据,我们称为元素 , 一个列表中可以存储多个元素,也可以在创建列表时,来指定列表中的元素 .

1
my_list = [10] # 创建一个只包含一个元素的列表

当向列表中添加多个元素时,多个元素之间使用,隔开

1
my_list = [10,20,30,40,50] # 创建了一个保护有5个元素的列表

列表中可以保存任意的对象

1
my_list = [10,'hello',True,None,[1,2,3],print]

列表中的对象都会按照插入的顺序存储到列表中,第一个插入的对象保存到第一个位置,第二个保存到第二个位置 . 我们可以通过索引(index)来获取列表中的元素 , 索引是元素在列表中的位置,列表中的每一个元素都有一个索引 , 引是从0开始的整数,列表第一个位置索引为0,第二个位置索引为1,第三个位置索引为2,以此类推 .

通过索引获取列表中的元素 , 语法:my_list[索引] ,my_list[0]

len()函数,通过该函数可以获取列表的长度 , 也就是列表中元素的个数 . 获取到的长度的值,是列表的最大索引 + 1

列表的索引可以是负数 , 如果索引是负数,则从后向前获取元素,-1表示倒数第一个,-2表示倒数第二个 以此类推 .

1
2
3
4
5
6
my_list = [10,20,30,40,50]
print(my_list[4]) # 50
# 如果使用的索引超过了最大的范围,会抛出异常
# print(my_list[5]) IndexError: list index out of range
print(len(my_list)) # 5
print(my_list[-2]) # 40

切片

切片指从现有列表中,获取一个子列表 , 创建一个列表,一般创建列表时,变量的名字会使用单词复数 .

通过切片来获取指定的元素 , 语法:

  1. 列表[起始索引:结束索引]

    通过切片获取元素时,会包括起始位置的元素,不会包括结束位置的元素

    做切片操作时,总会返回一个新的列表,不会影响原来的列表

    起始和结束位置的索引都可以省略不写

    如果省略结束位置,则会一直截取到最后

    如果省略起始位置,则会从第一个元素开始截取

    如果起始位置和结束位置全部省略,则相当于创建了一个列表的副本

  2. 列表[起始索引:结束索引:步长]

    步长表示,每次获取元素的间隔,默认值是1

    步长不能是0,但是可以是负数

    如果是负数,则会从列表的后部向前边取元素

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
stus = ['孙悟空','猪八戒','沙和尚','唐僧','蜘蛛精','白骨精'] # 创建一个列表

print(stus[1:])
# ['猪八戒', '沙和尚', '唐僧', '蜘蛛精', '白骨精']
print(stus[:3])
# ['孙悟空', '猪八戒', '沙和尚']
print(stus[:])
# ['孙悟空', '猪八戒', '沙和尚', '唐僧', '蜘蛛精', '白骨精']
print(stus)
# ['孙悟空', '猪八戒', '沙和尚', '唐僧', '蜘蛛精', '白骨精']
print(stus[0:5:3])
# ['孙悟空', '唐僧']
print(stus[::-1])
# ['白骨精', '蜘蛛精', '唐僧', '沙和尚', '猪八戒', '孙悟空']

# print(stus[::0]) ValueError: slice step cannot be zero

通用操作

+可以将两个列表拼接为一个列表 , *可以将列表重复指定的次数 .

1
2
3
4
my_list = [1,2,3] + [4,5,6]
print(my_list) # [1, 2, 3, 4, 5, 6]
my_list = [1,2,3] * 4
print(my_list) # [1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3]

in用来检查指定元素是否存在于列表中 , 如果存在,返回True,否则返回False .

not in用来检查指定元素是否不在列表中 , 如果不在,返回True,否则返回False .

1
2
3
4
# 创建一个列表
stus = ['孙悟空','猪八戒','沙和尚','唐僧','蜘蛛精','白骨精','沙和尚','沙和尚']
print('牛魔王' not in stus) # True
print('牛魔王' in stus) # False

len()获取列表中的元素的个数

max()获取列表中的最大值

min()获取列表中的最小值

1
2
arr = [10,1,2,5,100,77]
print(min(arr) , max(arr)) # 1 100

下面介绍两个方法(method) , 方法和函数基本上是一样,只不过方法必须通过 对象.方法() 的形式调用 , 例如 xxx.print() 方法实际上就是和对象关系紧密的函数 .

s.index() 获取指定元素在列表中的第一次出现时索引 . index()的第二个参数,表示查找的起始位置索引 , 第三个参数,表示查找的结束索引 , 依然是包括起始位置 不包括结束位置 . 如果要获取列表中没有的元素,会抛出异常 .

s.count() 统计指定元素在列表中出现的次数.

1
2
3
4
5
6
7
8
stus = ['孙悟空','猪八戒','沙和尚','唐僧','蜘蛛精','白骨精','沙和尚','沙和尚']

print(stus.index('沙和尚')) # 2
print(stus.index('沙和尚',3,7)) # 6
# print(stus.index('沙和尚',3,6)) ValueError: '沙和尚' is not in list
# print(stus.index('牛魔王')) ValueError: '牛魔王' is not in list

print(stus.count('牛魔王')) # 0

修改元素

  1. 直接通过索引来修改元素 ; 通过del来删除元素 .

    1
    2
    3
    4
    5
    6
    7
    8
    9
    stus = ['孙悟空','猪八戒','沙和尚','唐僧','蜘蛛精','白骨精']
    stus[0] = 'sunwukong'
    stus[2] = '哈哈'
    print('修改后',stus)
    # 修改后 ['sunwukong', '猪八戒', '哈哈', '唐僧', '蜘蛛精', '白骨精']

    del stus[2]
    print('删除后',stus)
    # 删除后 ['sunwukong', '猪八戒', '唐僧', '蜘蛛精', '白骨精']
  2. 通过切片来修改列表 , 在给切片进行赋值时,只能使用序列 .

    1
    2
    3
    4
    5
    6
    stus[0:2] = ['牛魔王','红孩儿'] # 使用新的元素替换旧元素
    stus[0:2] = ['牛魔王','红孩儿','二郎神'] # 也可以成功替换
    stus[0:0] = ['牛魔王'] # 向索引为0的位置插入元素

    # 当设置了步长时,序列中元素的个数必须和切片中元素的个数一致
    stus[::2] = ['牛魔王','红孩儿','二郎神']
  3. 通过切片来删除元素

    1
    2
    3
    del stus[0:2]
    del stus[::2]
    stus[1:3] = []

以上操作,只适用于可变序列

1
2
3
4
5
6
7
s = 'hello'
# s[1] = 'a' 不可变序列,无法通过索引来修改

# 可以通过 list() 函数将其他的序列转换为list
s = list(s)
print(s)
# ['h', 'e', 'l', 'l', 'o']

列表的方法

  1. append() : 向列表的最后添加一个元素
  2. insert() : 向列表的指定位置插入一个元素
    • 参数1: 要插入的位置
    • 参数2: 要插入的元素
  3. extend() : 使用新的序列来扩展当前序列
  4. clear() : 清空序列
  5. pop() : 根据索引删除并返回被删除的元素
  6. remove() : 删除指定值得元素,如果相同值得元素有多个,只会删除第一个
  7. reverse() : 用来反转列表
  8. sort() : 用来对列表中的元素进行排序,默认是升序排列 . 如果需要降序排列,则需要传递一个reverse=True作为参数
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
stus = ['孙悟空','猪八戒','沙和尚','唐僧']
print('原列表:',stus)

stus.append('唐僧')
print('尾插后:',stus)
# ['孙悟空', '猪八戒', '沙和尚', '唐僧', '唐僧']

stus.insert(2,'唐僧')
print('在索引2处插入后:',stus)
# ['孙悟空', '猪八戒', '唐僧', '沙和尚', '唐僧', '唐僧']

stus.extend(['唐僧','白骨精'])
print('扩充后',stus)
# ['孙悟空', '猪八戒', '唐僧', '沙和尚', '唐僧', '唐僧', '唐僧', '白骨精']

a = stus.pop(2) # 删除索引为2的元素
print('删除',a,'后:',stus)
# ['孙悟空', '猪八戒', '沙和尚', '唐僧', '唐僧', '唐僧', '白骨精']

b = stus.pop() # 删除最后一个元素
print('删除最后一个元素后: ',stus)
# ['孙悟空', '猪八戒', '沙和尚', '唐僧', '唐僧', '唐僧']

stus.pop(-1) # 删除最后一个元素
print('删除最后一个元素后: ',stus)
# ['孙悟空', '猪八戒', '沙和尚', '唐僧', '唐僧']

stus.remove('唐僧')
print('删除第一个唐僧后:',stus)
# ['孙悟空', '猪八戒', '沙和尚', '唐僧']

stus.reverse()
print('列表反转:',stus)
# ['唐僧', '沙和尚', '猪八戒', '孙悟空']

stus.clear()
print('清空后:',stus)
# []

1
2
3
4
5
6
7
8
9
my_list = [10,1,20,3,4,5,0,-2]

print('修改前',my_list)
# [10, 1, 20, 3, 4, 5, 0, -2]
my_list.sort(reverse=True)
print('修改后',my_list)
# [20, 10, 5, 4, 3, 1, 0, -2]

# 对于字符串,则按Unicode编码进行排序.

遍历列表

通过while循环来遍历列表

1
2
3
4
5
stus = ['孙悟空','猪八戒','沙和尚','唐僧','白骨精','蜘蛛精']
i = 0
while i < len(stus):
print(stus[i])
i += 1
通过for循环来遍历列表
1
2
3
4
5
6
7
8
# 语法:
# for 变量 in 序列 :
# 代码块
# for循环的代码块会执行多次,序列中有几个元素就会执行几次
# 每执行一次就会将序列中的一个元素赋值给变量,
# 所以我们可以通过变量,来获取列表中的元素.
for s in stus :
print(s)

for()循环除了创建方式以外,其余的都和while一样 , 包括else、包括break continue都可以在for循环中使用 , 并且for循环使用也更加简单 .

range( )

range()是一个函数,可以用来生成一个自然数的序列 . 该函数需要三个参数:

  1. 起始位置(可以省略,默认是0)
  2. 结束位置
  3. 步长(可以省略,默认是1)

通过range()可以创建一个执行指定次数的for循环 .

1
2
3
4
5
6
7
8
9
10
11
12
r = range(5)
print(r) # range(0, 5)
print(list(r)) # [0, 1, 2, 3, 4]

r = range(2,10)
print(list(r)) # [2, 3, 4, 5, 6, 7, 8, 9]

r = range(3,99,18)
print(list(r)) # [3, 21, 39, 57, 75, 93]

for i in range(1,11):
print(i,end=" ") # 1 2 3 4 5 6 7 8 9 10

元组(tuple)

元组是一个不可变的序列 , 它的操作的方式基本上和列表是一致的 , 所以你在操作元组时,就把元组当成是一个不可变的列表就ok了 , 一般当我们希望数据不改变时,就使用元组,其余情况都使用列表 .

使用()来创建元组

1
2
3
4
5
6
7
my_tuple = () # 创建了一个空元组
print(my_tuple,type(my_tuple)) # () <class 'tuple'>

my_tuple = (1,2,3,4,5) # 创建了一个5个元素的元组
# 元组是不可变对象,不能尝试为元组中的元素重新赋值
# my_tuple[3] = 10 TypeError: 'tuple' object does not support item assignment
print(my_tuple[3]) # 4

当元组不是空元组时,括号可以省略

1
my_tuple = 10,20,30,40

如果元组不是空元组,它里边至少要有一个, , 原因是, 如果不加都逗号 , 就无法区分是元组还是变量了 .

1
my_tuple = 40,

元组的解包(解构), 解包指就是将元组当中每一个元素都赋值给一个变量 .

1
2
3
4
5
6
my_tuple = 10 , 20 , 30 , 40
a,b,c,d = my_tuple
print("a =",a) # a = 10
print("b =",b) # b = 20
print("c =",c) # c = 30
print("d =",d) # d = 40

交互a 和 b的值,这时我们就可以利用元组的解包

1
2
3
4
5
6
7
8
9
10
a = 100
b = 300
print('a = ',a , "b = ",b)

# 交换变量a , b的值
a , b = b , a
# 此条语句可以理解为, 首先利用a,b两个变量创建一个元组(b,a)
# 在利用元组的解包 , 将元组(b , a)中的两个值赋值给a ,b

print('a = ',a , "b = ",b)

在对一个元组进行解包时,变量的数量必须和元组中的元素的数量一致 .

也可以在变量前边添加一个*,这样变量将会获取元组中所有剩余的元素

1
2
3
4
5
6
7
8
9
10
my_tuple = 10 , 20 , 30 , 40
a , b , *c = my_tuple
a , *b , c = my_tuple
*a , b , c = my_tuple

a , b , *c = [1,2,3,4,5,6,7] # 列表和字符串也可以解包
a , b , *c = 'hello world'

# 不能同时出现两个或以上的*变量
# *a , *b , c = my_tuple SyntaxError: two starred expressions in assignment

不带*的变量 , 解包后会获得原元组中的变量类型 , 带 *的变量会被解包为列表类型的变量.

1
2
3
4
5
6
7
8
9
10
11
a , b , *c = 'hello world'
print(type(a),type(c))
# <class 'str'> <class 'list'>

a , b , *c = ['str' , 10 , 20 , 'str']
print(type(a),type(b),type(c))
# <class 'str'> <class 'int'> <class 'list'>

a , b , *c = [1,2,3,4,5,6,7]
print(type(a),type(b),type(c))
# <class 'int'> <class 'int'> <class 'list'>

可变对象

每个对象中都保存了三个数据:

  1. id(标识)
  2. type(类型)
  3. value(值)

列表就是一个可变对象 .

1
2
3
4
5
6
7
8
9
10
11
12
a = [1,2,3]
a[0] = 10 # 改对象
# 这个操作是在通过变量去修改对象的值
# 这种操作不会改变变量所指向的对象
# 当我们去修改对象时,如果有其他变量也指向了该对象,则修改也会在其他的变量中体现

a = [4,5,6] # 改变量
# 这个操作是在给变量重新赋值
# 这种操作会改变变量所指向的对象
# 为一个变量重新赋值时,不会影响其他的变量

## 一般只有在为变量赋值时才是修改变量,其余的都是修改对象
1
2
3
4
5
6
7
8
a = [1,2,3]
print('修改前:', a , id(a))
a[0] = 10 # 通过索引修改列表
print('修改后:', a , id(a)) # 此id与上一个id 相同 , 说明是同一个对象

# 为变量重新赋值
a = [4,5,6]
print('修改后:', a , id(a)) # 此id与上面的id不同 , 说明这是一个新的对象
1
2
3
4
5
6
7
8
a = [1,2,3]
b = a # 此操作相当于把变量 b 也指向列表 [1,2,3]
b[0] = 10
print("a",a,id(a))
print("b",b,id(b))
# a [10, 2, 3] 2854805625984
# b [10, 2, 3] 2854805625984
# 由于变量 a 和 b 指向同一个对象, 因此修改变量b会影响到变量a

此处可以回顾一下 ==yuis的区别 .

  • == !=是比较两个变量的值是否相等
  • is is not比较的是两个变量是否是同一个对象 , 也就是id是否相等.
1
2
3
4
5
6
a = [1,2,3]
b = [1,2,3]
print(a,b)
print(id(a),id(b))
print(a == b) # a和b的值相等,使用==会返回True
print(a is b) # a和b不是同一个对象,内存地址不同,使用is会返回False

字典

字典属于一种新的数据结构,称为映射(mapping) , 字典的作用和列表类似,都是用来存储对象的容器 , 列表存储数据的性能很好,但是查询数据的性能的很差 . 在字典中每一个元素都有一个唯一的名字,通过这个唯一的名字可以快速的查找到指定的元素 , 在查询元素时,字典的效率是非常快的 . 在字典中可以保存多个对象,每个对象都会有一个唯一的名字 . 这个唯一的名字,我们称其为键(key),通过key可以快速的查询value . 所以字典,我们也称为叫做键值对(key-value)结构 , 每个字典中都可以有多个键值对,而每一个键值对我们称其为一项(item).

使用 { }来创建字典

1
2
d = {} # 创建了一个空字典

创建一个有数据的字典 , 语法:

  • {key:value,key:value,key:value}
  • 字典的值可以是任意对象
  • 字典的键可以是任意的不可变对象(int、str、bool、tuple …),但是一般我们都会使用str . 字典的键是不能重复的,如果出现重复的后边的会替换前边的
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
# d = {'name':'孙悟空' , 'age':18 , 'gender':'男' , 'name':'sunwukong'}
# 大括号可以换行写 , 这样键值对看起来更清晰
d = {
'name':'孙悟空' ,
'age':18 ,
'gender':'男' ,
'name':'sunwukong'
}

print(d , type(d))
# {'name': 'sunwukong', 'age': 18, 'gender': '男'} <class 'dict'>

# 需要根据键来获取值
print(d['name'],d['age'],d['gender'])
# sunwukong 18 男

# 如果使用了字典中不存在的键,会报错
# print(d['hello']) KeyError: 'hello'

使用 dict()函数来创建字典 , 每一个参数都是一个键值对,参数名就是键,参数名就是值(这种方式创建的字典,key都是字符串)

1
d = dict(name='孙悟空',age=18,gender='男') 

也可以将一个包含有双值子序列的序列转换为字典 . 双值序列,也就是序列中只有两个值,[1,2] (‘a’,3) ‘ab’ 等. 如果序列中的元素也是序列,那么我们就称这个元素为子序列 .

1
2
3
4
my_list = [('name','孙悟饭'),['age',18]]
d = dict(my_list)
print(d , type(d))
# {'name': '孙悟饭', 'age': 18} <class 'dict'>

下面介绍一些字典相关的函数 , 运算符和方法 .

这里参数里中括号的内容为可选项 , 不是列表的意思.

  1. len(): 获取字典中键值对的个数
  2. in,not in:检查字典中是否包含指定的键
  3. del: 删除,可以使用 del 来删除字典中的 key-value
  4. popitem()方法 :随机删除字典中的一个键值对,一般都会删除最后一个键值对
  5. pop(key[, default])方法: 根据key删除字典中的key-value , 会将被删除的value返回!如果删除不存在的key,会抛出异常 ; 如果指定了默认值,再删除不存在的key时,不会报错,而是直接返回默认值 .
  6. clear()方法: 用来清空字典
  7. copy()方法: 该方法用于对字典进行浅复制 , 复制以后的对象,和原对象是独立,修改一个不会影响另一个 . 注意,浅复制会简单复制对象内部的值,如果值也是一个可变对象,这个可变对象不会被复制 .
  8. get(key[, default])方法: 该方法用来根据键来获取字典中的值 , 果获取的键在字典中不存在,会返回None , 而不是抛出异常 . 可以指定一个默认值,来作为第二个参数,这样获取不到值时将会返回默认值 .
  9. setdefault(key[, default])方法: 可以用来向字典中添加key-value , 如果key已经存在于字典中,则返回key的值,不会对字典做任何操作 . 如果key不存在,则向字典中添加这个key,并设置value .
  10. update([other])方法: 将其他的字典中的key-value添加到当前字典中 , 如果有重复的key,则后边的会替换到当前的 .
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
my_list = [('name','孙悟空'),('age',18),('性别','男')]
my_dict = dict(my_list)
print("初始字典:",my_dict)
print("长度为:",len(my_dict)) # 3
print('孙悟空' in my_dict) # False
print('name' in my_dict) # True

# 获取字典中的值,根据键来获取值
print(my_dict['age'])
my_dict['name'] = 'sunwukong'# 修改字典的key-value
my_dict['address'] = '花果山' # 向字典中添加key-value

# 通过get(key[, default]) 方法来根据键来获取字典中的值
print(my_dict.get('name'))
print(my_dict.get('hello','默认值')) # 没有hello键 , 会返回默认值 : 默认值

# setdefault(key[, default]) 可以用来向字典中添加key-value
result = my_dict.setdefault('name','猪八戒') # 如果key已经存在于字典中,则返回key的值,不会对字典做任何操作
print(result)
result = my_dict.setdefault('hello','猪八戒') # 如果key不存在,则向字典中添加这个key,并设置value
print(result)

# update([other])
d = {'a':1,'b':2,'c':3}
my_dict.update(d)
print('更新后' , my_dict)
d = [['name','孙悟空'],['a',2]]
my_dict.update(d)
print('第二次更新后:',my_dict)

# del 删除
del my_dict['a']
print('删除后:',my_dict)

# popitem()
print('删除键值对:',my_dict.popitem())

# pop
result = my_dict.pop('b')
print('pop',result,'后:',my_dict)
result = my_dict.pop('z','这是默认值')
print(result) # 如果指定了默认值,再删除不存在的key时,不会报错,而是直接返回默认值

# copy
d = my_dict.copy()
print(d)
print('id(my_dict):',id(my_dict),'id(d)',id(d))

# clear
d.clear()
print(d)

# 字典嵌套
d = {'a':{'name':'孙悟空','age':18},'b':2,'c':3}
d2 = d.copy()
d2['a']['name'] = '猪八戒' # 使用两次索引

print('d = ',d , id(d))
print('d2 = ',d2 , id(d2))

上面代码的执行结果如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
初始字典: {'name': '孙悟空', 'age': 18, '性别': '男'}
长度为: 3
False
True
18
sunwukong
默认值
sunwukong
猪八戒
更新后 {'name': 'sunwukong', 'age': 18, '性别': '男', 'address': '花果山', 'hello': '猪八戒', 'a': 1, 'b': 2, 'c': 3}
第二次更新后: {'name': '孙悟空', 'age': 18, '性别': '男', 'address': '花果山', 'hello': '猪八戒', 'a': 2, 'b': 2, 'c': 3}
删除后: {'name': '孙悟空', 'age': 18, '性别': '男', 'address': '花果山', 'hello': '猪八戒', 'b': 2, 'c': 3}
删除键值对: ('c', 3)
pop 2 后: {'name': '孙悟空', 'age': 18, '性别': '男', 'address': '花果山', 'hello': '猪八戒'}
这是默认值
{'name': '孙悟空', 'age': 18, '性别': '男', 'address': '花果山', 'hello': '猪八戒'}
id(my_dict): 1633070753280 id(d) 1633069955264
{}
d = {'a': {'name': '猪八戒', 'age': 18}, 'b': 2, 'c': 3} 1633070014144
d2 = {'a': {'name': '猪八戒', 'age': 18}, 'b': 2, 'c': 3} 1633069955264

遍历字典.

可以通过keys()方法来获取所有的键, 通过for循环来遍历字典.

1
2
for k in d.keys() :
print(k , d[k])

values()方法会返回一个序列,序列中保存有字典的所有的值.

1
2
for v in d.values():
print(v)

items()方法会返回字典中所有的项 , 它会返回一个序列,序列中包含有双值子序列 , 双值分别是,字典中的key和value .

1
2
3
for k,v in d.items() :
print(k , '=' , v)
# 一定要使用两个变量去接收items()方法的返回值.

集合(set)

集合和列表非常相似 !

下面列举不同点:

  1. 集合中只能存储不可变对象
  2. 集合中存储的对象是无序(不是按照元素的插入顺序保存)
  3. 集合中不能出现重复的元素

使用 {}来创建集合

1
2
3
s = {10,3,5,1,2,1,2,3,1,1,1,1} # <class 'set'>
# 存放可变对象会抛出异常
# s = {[1,2,3],[4,6,7]} TypeError: unhashable type: 'list'

使用 set() 函数来创建集合

1
2
3
4
5
6
s = set() # 空集合

# 可以通过set()来将序列和字典转换为集合
s = set([1,2,3,4,5,1,1,2,3,4,5])
s = set('hello')
s = set({'a':1,'b':2,'c':3}) # 使用set()将字典转换为集合时,只会包含字典中的键

集合的常用操作与方法:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
# 创建集合
s = {'a' , 'b' , 1 , 2 , 3 , 1}

# 使用in和not in来检查集合中的元素
print('c' in s) # False

# 使用len()来获取集合中元素的数量
print(len(s)) # 6

# add() 向集合中添加元素
s.add(10)
s.add(30)

# update() 将一个集合中的元素添加到当前集合中
# update()可以传递序列或字典作为参数,字典只会使用键
s2 = set('hello')
s.update(s2)
s.update((10,20,30,40,50))
s.update({10:'ab',20:'bc',100:'cd',1000:'ef'})
print(s)
# pop()随机删除并返回一个集合中的元素
result = s.pop()
print(result)

# remove()删除集合中的指定元素
s.remove(100)
s.remove(1000)

# copy()对集合进行浅复制
print(s.copy(),type(s.copy()))

# clear()清空集合
s.clear()
print(s)

上述代码的所有打印结果

1
2
3
4
5
6
False
5
{1, 2, 3, 100, 'h', 40, 1000, 10, 'o', 'b', 'a', 50, 20, 'e', 'l', 30}
1
{2, 3, 'h', 40, 10, 'b', 'l', 'a', 50, 20, 'e', 'o', 30} <class 'set'>
set()

下面介绍集合的几种基本运算 , 这些运算和数学中集合的运算基本一致 .

在对集合做运算时,不会影响原来的集合,而是返回一个运算结果 .

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
s = {1,2,3,4,5}
s2 = {3,4,5,6,7}

# & 交集运算
result = s & s2
print('result =',result)

# | 并集运算
result = s | s2
print('result =',result)

# - 差集
result = s - s2
print('result =',result)

# ^ 异或集 获取只在一个集合中出现的元素
result = s ^ s2
print('result =',result)

# <= 检查一个集合是否是另一个集合的子集
# 如果a集合中的元素全部都在b集合中出现,那么a集合就是b集合的子集,b集合是a集合超集
a = {1,2,3}
b = {1,2,3,4,5}

result = a <= b # True
result = {1,2,3} <= {1,2,3} # True
result = {1,2,3,4,5} <= {1,2,3} # False

# < 检查一个集合是否是另一个集合的真子集
# 如果超集b中含有子集a中所有元素,并且b中还有a中没有的元素,则b就是a的真超集,a是b的真子集
result = {1,2,3} < {1,2,3} # False
result = {1,2,3} < {1,2,3,4,5} # True

# >= 检查一个集合是否是另一个的超集
# > 检查一个集合是否是另一个的真超集

本节练习

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
# 显示系统的欢迎信息
print('-'*20 , '欢迎使用员工管理系统', '-'*20)
# 创建一个列表,用来保存员工的信息,员工的信息以字符串的形式统一保存到列表
emps = ['孙悟空\t18\t男\t花果山','猪八戒\t28\t男\t高老庄']

# 创建一个死循环
while True:
# 显示用户的选项
print('请选择要做的操作:')
print('\t1.查询员工')
print('\t2.添加员工')
print('\t3.删除员工')
print('\t4.退出系统')
user_choose = input('请选择[1-4]:')
print('-'*62)
# 根据用户的选择做相关的操作
if user_choose == '1' :
# 查询员工
# 打印表头
print('\t序号\t姓名\t年龄\t性别\t住址')
# 创建一个变量,来表示员工的序号
n = 1
# 显示员工信息
for emp in emps :
print(f'\t{n}\t{emp}')
n += 1
elif user_choose == '2':
# 添加员工
# 获取要添加员工的信息,姓名、年龄、性别、住址
emp_name = input('请输入员工的姓名:')
emp_age = input('请输入员工的年龄:')
emp_gender = input('请输入员工的性别:')
emp_address = input('请输入员工的住址:')

# 创建员工信息
# 将四个信息拼接为一个字符串,然后插入到列表中
emp = f'{emp_name}\t{emp_age}\t{emp_gender}\t{emp_address}'
# 显示一个提示信息
print('以下员工将被添加到系统中')
print('-'*62)
print('姓名\t年龄\t性别\t住址')
print(emp)
print('-'*62)
user_confirm = input('是否确认该操作[Y/N]:')

# 判断
if user_confirm == 'y' or user_confirm == 'yes' :
# 确认
emps.append(emp)
# 显示提示信息
print('添加成功!')
else :
# 取消操作
print('添加已取消!')

elif user_choose == '3':
# 删除员工,根据员工的序号来删除员工
# 获取要删除的员工的序号
del_num = int(input('请输入要删除的员工的序号:'))

# 判断序号是否有效
if 0 < del_num <= len(emps) :
# 输入合法,根据序号来获取索引
del_i = del_num - 1
# 显示一个提示信息
print('以下员工将被删除')
print('-'*62)
print('\t序号\t姓名\t年龄\t性别\t住址')
print(f'\t{del_num}\t{emps[del_i]}')
print('-'*62)
user_confirm = input('该操作不可恢复,是否确认[Y/N]:')
# 判断
if user_confirm == 'y' or user_confirm == 'yes' :
# 删除元素
emps.pop(del_i)
# 显示提示
print('员工已被删除!')
else :
# 操作取消
print('操作已取消!')
else :
# 输入有误
print('您的输入有误,请重新操作!')

elif user_choose == '4':
# 退出
print('欢迎使用!再见!')
input('点击回车键退出!')
break
else :
print('您的输入有误,请重新选择!')

# 打印分割线
print('-'*62)