2023-08-04发表AI 秘籍 / Python

7. Python 的内置函数

茶桁的 AI 秘籍-1

Hi，大家好。我是茶桁。

讲完了基础函数和高阶函数之后，我们这一节来研究下 Python 的内置函数，看看 Python 在安装完毕之后的解释器里，到底都预先给我们提供好了哪些可用的函数。

本节内容着重介绍一些常用函数，并且会做一些应用上的示例。当然，对于 Python 的内置函数，我们还可以查询官方文档，我这节参照的为3.10 版本文档

`range()`函数

这几节课中，我们频繁使用并且着重介绍过这个函数，那我们就从它开始介绍吧。

一般我们需要遍历一个数值序列的时候，range()函数就会派上用场，它生成算数级数。

'''
range() 函数
功能： 能够生成一个置顶的数值序列
参数：
    start: 开始的值，默认为 0
    stop: 结束的值
    [, step]: 可选，步进值， 默认为 1
返回值： 可迭代的对象，数字序列
'''
range(start, stop, [, step])

让我们来看一下：

res = range(10)
print(res, type(res))

-----------------------------
range(0, 10) <class 'range'>

可以看到这其实就是一个range的类，其实在我们 Python 中，任何数据都是一个对象而已。

来看案例：

# range 函数的使用方式
res = range(11)
print(list(res))

-----------------------------
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

当我们的range内只写一个参数时，这个参数就是stop值，也就是从start的默认值 0 开始到输入的参数值（stop）之前为止，比如这段代码中，stop会结束到11之前，也就是10。

我们在这段代码中，将range的内容转化成一个list并打印了出来。当然，我们也可以使用循环，依次去除range内的内容：

for i in res:
  print(i, end=" ")
  
-----------------------------
0 1 2 3 4 5 6 7 8 9 10

记得上节课我们提到过，range()是不支持next()函数的，不过如果我们将其转成迭代器，就可以使用next()函数调用：

res = iter(range(11))
print(next(res))
print(next(res))
print(list(res))

-----------------------------
0
1
[2, 3, 4, 5, 6, 7, 8, 9, 10]

可以看到，使用iter转成迭代器之后，可以正常使用next()函数，并且我们再次查看res的内容，0,1已经被拿走，只将剩余内容转化为list打印了出来。

当我们在range中添加两个参数的时候，start就是第一个参数，第二个参数就是stop值。

# 添加两个参数
for i in range(5, 10):
    print(i, end=" ")

-----------------------------
5 6 7 8 9

当我们输入三个参数的时候，第一个参数为start, 第二个参数为stop, 第三个参数就是[, step]，比如：

# 添加三个参数
for i in range(1, 10, 3):
    print(i, end=" ")
    
-----------------------------
1 4 7

这段代码的含义就是从1开始, 以3为步进来提取数字，并打印出来，一直到10之前的数字为止。

如果不太理解步进值的可以执行数一遍就理解了，比如我们从1开始顺序往后数3个数，那就是 2、3、4，数到了4, 再继续往后数3个数，就是 5、6、7，数到了7。再继续往后就是 8、9、10。但是，我们代码中的stop值为10，所以到9就结束了，也就是说，我们这段代码就只取出了1, 4, 7三个值。

三种参数值的情况我们都了解之后我们可以思考下，难道我们只能选择顺序取值吗？其实不然，我们还可以倒叙取值，聪明的小伙伴可能想到了，调换一下start和stop值不就可以了嘛？我们从10开始取值，取到0为止：

1 2	`for i in range(10, 0): print(i, end=" ")`

执行一下，哎，似乎什么都没打印出来。这又是为什么呢？是不是出 BUG 了？

其实，什么都没打印出来才是正确的，这是因为，虽然我们给了开始和结束值，但是我们遗忘了一个重要的参数，那就是步进值step，这个值默认可是1，从10开始+1来计数，无论如何也算不到0。所以，我们将步进值改成负数，也就是倒着数了:

for i in range(10, 0, -1):
    print(i, end=" ")
    
-----------------------------
10 9 8 7 6 5 4 3 2 1

至此，我们可以得到结论，是否倒叙取值除了开始和结束值，更重要的是看step是正数还是负数。

res = range(-10,-20,-1) 
# [-10, -11, -12, -13, -14, -15, -16, -17, -18, -19]
res = range(-20,-10) 
# [-20, -19, -18, -17, -16, -15, -14, -13, -12, -11]
res = range(-10,10)
# [-10, -9, -8, -7, -6, -5, -4, -3, -2, -1, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

`zip()`函数

zip() 函数可以接受多个可迭代的对象，然后把每个可迭代对象中的第 i 隔元素组合在一起，形成一个新的迭代器。

'''
参数： *iterables, 任意个的可迭代对象
返回值： 返回一个元组的迭代器
'''
zip(*iterables)

让我们来直接看示例：

n1 = '1234'
n2 = ['a', 'b', 'c']
n3 = ['A', 'B', 'C', 'D']
# 调用 zip 函数，合成新的元组迭代器
res = zip(n1, n2, n3)
print(list(res))

-----------------------------
[('1', 'a', 'A'), ('2', 'b', 'B'), ('3', 'c', 'C')]

我知道你们看到这个执行结果会有很多疑问，先别着急，我们先看一下它是否包含迭代器的特性：

1 2	`for i in res: print(i)`

当你执行这段代码的时候就会发现，似乎什么都没发生。

那到底是怎么回事？我们不用for，让我们再转换一次list之后看看里边有什么：

print(list(res))

-----------------------------
[]

列表居然是空的。是不是瞬间想到了什么？

没错，这个似乎就是迭代器的特性之一，当其中元素被使用之后，会删掉使用过的元素。而我们之前在执行print(list(res))的时候，已经将内部元素都转成list并展现过，所以现在res内的元素都被删掉了。

没事，让我们再重新来定义一次，也就是重新给res内填满元素然后直接for循环一次看看：

n1 = '1234'
n2 = ['a', 'b', 'c']
n3 = ['A', 'B', 'C', 'D']
# 调用 zip 函数，合成新的元组迭代器
res = zip(n1, n2, n3)

for i in res:
  print(i)
  
-----------------------------：
('1', 'a', 'A')
('2', 'b', 'B')
('3', 'c', 'C')

我们可以看到，每次打印i的时候都打印了一个元组，而这个元组就是一个新元素，比如第一行('1', 'a', 'A'), 这整个元组就是一个新元素。

让我们再用next试试（当然我又重新填满了res）：

print(next(res))
print(next(res))

-----------------------------
('1', 'a', 'A')
('2', 'b', 'B')

next函数也能正常执行，那可以说明，zip确实组合成了一个新的迭代器。

现在我们返回来再看一遍代码中的n1,n2,n3, 分别是1234, [‘a’, 'b', 'c'], ['A', 'B', 'C', 'D']。最后组成的迭代器对象为：[('1', 'a', 'A'), ('2', 'b', 'B'), ('3', 'c', 'C')]。

通过分析可以看出来，zip的工作原理是先分别取可迭代对象的第一个元素组合成一个元组，然后再分别取第二个元素组合成一个元组，依次往后取...

可是n1, n3分别都是四个元素，为什么我们最后只组合成了三个元组？那是因为n2中只包含了三个元素，当在其中找不到第四个元素的时候，就会放弃组合。

来，让我们在看一个示例：

n1 = [1, 2, 3, 4]
n2 = [22, 33, 44, 55]
res = zip(n1, n2)
print(list(res))

-----------------------------
[(1, 22), (2, 33), (3, 44), (4, 55)]

大家看到最后的执行结果有没有觉得很眼熟？可能很多小伙伴一时间想不到，我们来调整一下：

[
	(1, 22), 
	(2, 33), 
	(3, 44), 
	(4, 55)
]

记住这个数据结构，我们在后期做数据分析的时候，当我们做矩阵运算的时候用的非常多。

不知道大家是否都学过高等数学里的线性代数、微积分，包括概率统计。这些在我们之后做数据分析，数据挖掘，包括机器学习、人工智能这些科学运算里面，非常重要的一些数学功底。

不太记得了也没关系，这些我后面将会专门拿几节出来给大家补一下这方面。

让我们继续，zip还有一种应用方式，当其与*运算符结合使用的时候，可以用来拆解列表：

# zip 与 * 运算符相结合使用
x = [1, 2, 3]
y = [4, 5, 6]

print(zip(x, y))
print(*zip(x, y))

-----------------------------
<zip object at 0x107b8d200>
(1, 4) (2, 5) (3, 6)

可以看到，zip是一个迭代器，*zip这生成了组合好的多个元组数据。

比如：

x1 = [1, 2, 3]
y1 = [4, 5, 6]

x2, y2 = zip(*zip(x, y))
print(x2, y2)

-----------------------------
(1, 2, 3) (4, 5, 6)

这样，我们就将两个列表转换成了两个元组。当然，其实我们这样操作还不如直接使用tuple函数来的方便快捷一点。

那下面，我们就看看都有哪些数据类型转换相关的内置函数。

数据类型转换相关的内置函数

这些函数的功能非常简单和单一，属于拿来就用的函数，我们就仅列出来，不多做介绍了。

int() 将其它类型数据转为整型
float()转为浮点类型
bool()转为布尔类型
complex()转为复数
str()转为字符串类型
list 转为列表类型
tuple转为元组类型
dict 转为字典类型
set 转为集合类型

变量相关函数

id() 获取当前数据的 ID 标识
type() 获取当前数据的类型字符串
print()数据的打印
input()获取输入的数据
isinstance()检测是否为指定的数据类型

数学相关函数

abs()获取一个数的绝对值

print(abs(-99.99))

-----------------------------
99.99

sum()求和从 start 开始自左向右对 iterable 中的项求和并返回总计值

print(sum([1,2,3]))

-----------------------------
6

max() 获取最大值

print(max([1,2,3]))
print(max(99,12,45))

-----------------------------
3
99

min() 获取最小值

print(min([2,1,6,-9]))
print(min(6,7,1,0,-2))

-----------------------------
-9
-2

pow(x, y)幂运算返回 x 的 y 次幂

print(pow(2,3))
      
-----------------------------
8

round(x, n) 对 x 四舍五入，小数点保留 n 位

print(round(3.1415926))
print(round(3.1415926,2))

-----------------------------
3
3.14

round这个函数不是绝对意义上的四舍五入，在取整这个问题是是奇进偶退：

print(round(3.5))
print(round(4.5))

-----------------------------：
4
4

进制函数及字符集

bin() 将数值类型转为二进制

print(bin(123)) 

-----------------------------
0b1111011

int() 将二进制转化为整型

print(int(0b1111011))

-----------------------------
123

oct() 转为八进制数

print(oct(123))

-----------------------------
0o173

hex() 转为十六进制数

print(hex(123))

-----------------------------
0x7b

ASCII 及字符集

ASCII，全称为美国信息互换标准代码。是一套基于拉丁字母的字符编码，共收录了 128 个字符，用一个字节就可以存储，它等同于国际标准 ISO/IEC 646。它一共有 128 个支付，最后更新是 1986 年。

我们要知道的是，ASCII 编码是美国人给自己设计的，他们并没有考虑欧洲那些扩展的拉丁字母，也没有考虑韩语和日语，我大中华几万个汉字更是不可能被重视。计算机也是美国人发明的，起初使用的就是 ASCII 码，只能显示英文字符。各个国家为了让本国公民也能正常使用计算机，开始效仿 ASCII 开发自己的字符编码，例如 ISO/IEC 8859（欧洲字符集）、shift_Jis（日语字符集）、GBK（中文字符集）等。

从 65 开始到 90 为止，是大写字母（A ~ Z), 97 到 122 是小写字母(a ~ z)，48 到 57 是 0 ~ 9。

而我们经常使用的是 GB2312-80, GBK 和 GBK18030 以及 Unicode 字符集。

GB2312-80 是 1980 年制定的中国汉字编码国家标准。共收录 7445 个字符，其中汉字 6763 个。

GBK 于 1995 年制定收录了 21003 个汉字。GBK 向下与 GB 2312 编码兼容，

GBK18030 2001 年的 1 月正式强制执行，是我国制订的以汉字为主并包含多种我国少数民族文字（如藏、蒙古、傣、彝、朝鲜、维吾尔文等）的超大型中文编码字符集强制性标准，其中收入汉字 70000 余。

Unicode（统一码、万国码、单一码）是计算机科学领域里的一项业界标准，包括字符集、编码方案等。

它为每种语言中的每个字符设定了统一并且唯一的二进制编码，以满足跨语言、跨平台进行文本转换、处理的要求。1990 年开始研发，1994 年正式公布。
UTF-8 以字节为单位对 Unicode 进行编码。

我们现在写代码的时候基本遵循 UTF-8 编码为主。

有的时候，我们是需要将字符转为 ASCII，也有对应的方法：

print(ord('a'))

-----------------------------
a

将 ASCII 转为字符也一样：

print(chr(65))

-----------------------------
A

高阶函数

和上一节课不同，我们现在要讲的高阶函数，是 Python 解释器里的内置高阶函数。

`sorted()`

很多时候，我们在处理数据的时候都需要对数据进行排序。不管是以序号，名称还是日期的方式。sorted()就是我们最常用的排序函数：

sorted(iterable, [reverse, key])
‘’‘
运行原理：把可迭代数据里面的元素，一个一个的取出来，放到 key 这个函数中进行处理，并按照函数中 return 的结果进行排序，返回一个新的列表
功能：排序
参数：
    iterable:可迭代的数据 （容器类型数据，range 数据序列，迭代器）
    reverse:可选，是否反转，默认为 False，不反转， True 反转
    key:可选， 函数，可以是自定义函数，也可以是内置函数
返回值：排序后的结果
’‘’

我们来看几个示例，首先我们先来看看默认的排序方式：从小到大：

arr = [3,7,1,-9,20,10]
res = sorted(arr) 
print(res)

-----------------------------
[-9, 1, 3, 7, 10, 20]

当然，既然我们能从小到大来进行排序，那就可以用从大到小的方式：

arr = [3,7,1,-9,20,10]
print(sorted(arr,reverse=True))

-----------------------------
[20, 10, 7, 3, 1, -9]

现在我们得到了从小到大排序，也得到了从大到小排序。然后我们再来作妖：能不能按照所有数字的绝对值大虾哦进行排序呢？哎，还记得我们刚讲过的数学相关的函数里有一个求绝对值的函数嘛？既然sorted()这个函数里的参数key可以接收函数，那让我们结合在一起试试看：

arr = [3,7,1,-9,20,10]
res = sorted(arr,key=abs)
print(res)

-----------------------------
[1, 3, 7, -9, 10, 20]

果然，我们得到了想要的结果。来分析下内部到底做了什么：

[3,7,1,-9,20,10] # 原始列表
3 7 1 9 20 10  # 求绝对值
1 3 7 9 10 20 # 给绝对值进行排序
1 3 7 -9 10 20  # 转换成原本的值

那现在，我再多尝试一下，我试试看自己定义一个函数：

1 2	`def func(num): return num % 2`

函数定义好了，让我们尝试使用自定义函数对数据进行排序：

arr = [3,2,4,6,5,7,9]
print(sorted(arr, key = func))

-----------------------------
[2, 4, 6, 3, 5, 7, 9]

看似起结果了。那到底函数内干了些什么呢？让我们在其中多打印一点东西出来，看个明白：

def func(num):
    print(num, num % 2, end=" ")
    print()
    return num % 2
  
arr = [3,2,4,6,5,7,9]
print(sorted(arr, key = func))

-----------------------------
3 1 
2 0 
4 0 
6 0 
5 1 
7 1 
9 1 
[2, 4, 6, 3, 5, 7, 9]

这样我们就很清晰的看到了对原数字和取余结果，在对取余进行排序之后，再在取余的结果上进行默认的从小到大进行排序，就得到了最后的结果[2, 4, 6, 3, 5, 7, 9]

不过，这种功能大多数时候我们基本是临时用一下，特意写一个方法似乎有点多余。还记得咱们之前讲的匿名函数吧？让我们用匿名函数优化一下：

# 用匿名函数优化
arr = [3,2,4,6,5,7,9]
res = sorted(arr, key=lambda num:num%2)
print(res)

-----------------------------
[2, 4, 6, 3, 5, 7, 9]

正是我们所要的结果。

从这就能看出来，高阶函数sorted()的key因为能接收自定义函数，所以给了我们很大的可玩空间。小伙伴们还能想到哪些方法，快去做做实验。

`map()`

这个函数在对传入的可迭代数据中的每一个元素进行处理，然后返回一个新的迭代器：

map(func, *iterables)
'''
功能： 对传入的可迭代数据中的每个元素放入到函数中进行处理，返回一个新的迭代器
参数：
    func 函数  自定义函数|内置函数
    iterables：可迭代的数据
返回值：迭代器
'''

让我们先来看一个普通的函数：

# 把一个字符串数字的列表转为整型列表
items = ['1', '2', '3', '4']
new_list = []
for i in items:
    new_list.append(int(i))

print(new_list)

-----------------------------
[1, 2, 3, 4]

我们将一个内部元素均为字符串的列表，转成了一个整型列表。

不过这个函数看起来似乎还是有些麻烦，让我们再用map试试看：

items = ['1', '2', '3', '4']
res = map(int, items)
print(list(res))

-----------------------------
[1, 2, 3, 4]

看，是不是简便多啦？当然，最后map最后生成的是迭代器而并不是列表，我们还是需要转化一下数据类型。

这段代码中map的处理方式其实非常简单，它将items里的每一个元素用int方法转换成整型，转换完之后形成一个新的迭代器，然后返回。

再让我们看一个示例感受一下, 这次我们将两段对比写在一起：

# 普通方法进行实现
items = [1, 2, 3, 4]
res = []
for i in items:
    x = i ** 2
    res.append(x)
print(res)

# 使用 map 函数处理
items = [1, 2, 3, 4]
def func(x):
    return x ** 2
res = map(func, items)
print(res, list(res))

-----------------------------
[1, 4, 9, 16]
<map object at 0x107ea5030> [1, 4, 9, 16]

我们看到执行结果完全一样，不过使用map()的方式更简洁，逻辑也更清晰。我们要知道，Python 本身是自带幂次方方法的。即便是我们自己来实现，其实我们还可以把代码写的更简洁：

items = [1, 2, 3, 4]
res = map(lambda x:x**2, items)
print(res,list(res))

-----------------------------
<map object at 0x107c98610> [1, 4, 9, 16]

基于map的应用，我们来个小作业吧：

我们现在有这样一个列表：['a','b','c','d']

要求将其转换成：[65,66,67,68]

最后，再给大家留个课后作业，我给大家两个函数及其功能介绍，大家自己去尝试看看，然后自己琢磨下其用法。

reduce(func, iterable)

功能：每一次从 iterable 拿出两个元素，放入到 func 函数中进行处理，得出一个计算结果，然后把这个计算结果和 iterable 中的第三个元素，放入到 func 函数中继续运算，得出的结果和之后的第四个元素，加入到 func 函数中进行处理，以此类推，直到最后的元素都参与了运算

filter(func, iterable)

功能：过滤数据，把 iterable 中的每个元素拿到 func 函数中进行处理，如果函数返回 True 则保留这个数据，返回 False 则丢弃这个数据。

这两个函数在处理数据上作用都非常大。

好了，下课。大家有问题记得留言。

7. Python 的内置函数

https://hivan.me/python-Built-in-functions/

作者

Hivan Du

发布于

2023-08-04

更新于

2024-01-16

许可协议

#Python

7. Python 的内置函数

`range()`函数

`zip()`函数

数据类型转换相关的内置函数

变量相关函数

数学相关函数

进制函数及字符集

ASCII 及字符集

高阶函数

`sorted()`

`map()`

作者

发布于

更新于

许可协议

喜欢这篇文章？打赏一下作者吧

评论

链接

分类

最新文章

7. Python 的内置函数

range()函数

zip()函数

数据类型转换相关的内置函数

变量相关函数

数学相关函数

进制函数及字符集

ASCII 及字符集

高阶函数

sorted()

map()

作者

发布于

更新于

许可协议

喜欢这篇文章？打赏一下作者吧

评论

链接

分类

最新文章

`range()`函数

`zip()`函数

`sorted()`

`map()`