在Python语言发展的过程中,PEP提案发挥了巨大的作用,如PEP 3107 和 PEP 484提案,分别给我们带来了函数注解(Function Annotations)和类型提示(Type Hints)的功能。

PEP 3107:定义了函数注解的语法,允许为函数的参数和返回值添加元数据注解。

PEP 484:按照PEP 3107函数注解的语法,从Python语法层面全面支持类型提示,类型提示可以是内置类型、内置类、抽象基类、types模块中提供的类型和开发人员自定义的类。

另外 PEP 526, PEP 544, PEP 586, PEP 589, PEP 591 这些东西对 PEP 3107 和 PEP 484 进行了补充,比如添加了变量注释,字面量注释这些东西。

需要注意的是,类型提示仅有提示的作用,这里的提示是指用户阅读Python代码的时候的提示,仅在语法层面支持,对代码的运行没有任何影响,Python 解释器在运行代码的时候会忽略类型提示,也就是说,Python的类型提示仅是为了提升代码可读性,一定程度上缓解"动态语言一时爽,代码重构火葬场"的尴尬。

下面将函数注解和类型提示,统称为类型注解。

类型注解优点

1、可以使Python拥有部分静态语言的特性,利用类型注解可以实现一种类似类型声明的效果,提升代码的可读性及后续的可维护性。

2、类型注解可以让IDE(如pycharm)像静态语言那样分析我们的代码,及时给我们相应的提示,如下图对比:

Python 类型注解
VS
Python 类型注解

3、多多使用类型注解,不仅可以让Python拥有强类型语言的严谨,还能保持Python作为动态类型语言的灵活性。

普通变量类型注解

在声明变量时,变量的后面可以加一个冒号,后面再写上变量的类型,如 int、list 等等,以此实现类型注解。

a: int = 22
b: str = "name"
c: float = 55.5
d: bool = True
e: list = [1, 2, 3]
f: set = {1, 2, 3}
g: dict = {"name": "ming", "age": 22}
h: tuple = (1, 2, 3)
i: bytes = b'world'
j: bytearray = bytearray("world")

函数参数及返回值类型

函数参数的类型声明就是冒号+类型即可,和普通变量类型声明没区别。

函数返回值的类型声明是用箭头指向具体的类型,如果是返回值有多个,使用元组包裹即可(因为函数的多个返回值就是以元组形式返回的),需要注意的是,箭头左右两边都要留有空格。

def handler(a: int, b: int) -> int:
    return a + b
def handler2(a: int, b: int, *args: int) -> int:
    return a + b + sum(args)
def handler3(a: int, b: int, *args: int, **kwargs: int) -> (int, str):
    return a + b + sum(args) + sum(kwargs.values()), ""

typing模块

typing模块的加入不会影响程序的运行,也不会报正式的错误,pycharm支持检测基于typing注解的错误,不符合规定类型注解时会出现黄色警告,但不会影响程序运行。

容器类型 & 复合类型

列表、字典、元组等包含元素的复合类型,用简单的 list,dict,tuple 不能够明确说明内部元素的具体类型。

此外,Python本身就是动态类型的语言,如果我们强制使用某种类型,一定程度上会丧失Python作为动态语言的优势,因此 typing 模块提供了一种复合类型注解的语法,即一个参数即可以是类型A,也可以是类型B或者类型C

from typing import Dict, List, Set, Tuple, Union
# 字典
d: Dict[str, int] = {"a": 1, "b": 2}
d1: Dict[str, int or str] = {"a": 1, "b": "2"}  	# 使用or表示支持多个类型
# 列表
l: List[int] = [1, 2, 3]
l1: List[int or str] = [1, 2, "3"]
# 元组
t: Tuple[str, int] = ("a", 1)		# 代表了构成元组的第一个元素是 str 类型,第二个元素是 int 类型
t1: Tuple[str, ...] = ("a", "b", "c", "d", "e", "f", "g")		# 代表接受多个 str 类型的元素
t2: Tuple[str or int, ...] = ("a", "b", 2)		# 代表接受多个 str 或 int 类型的元素
# 集合
s: Set[int] = {1, 2, 3, 4}
s1: Set[Union[int, str, float]] = {1, "2", 3.333, 4}	# Union 同 or

TypedDict

TypedDict声明一个字典类型,该类型期望它的所有实例都有一组固定的keys,其中每个key都与对应类型的值关联。

from typing import TypedDict
class Student(TypedDict):
    name: str
    age: int
    height: float
s1: Student = {
    "name": "xiao ming",
    "age": 22,
    "height": 55.5
}
s2: Student = {
    "name": "xiao hong",
    "age": 21,
}

Python 类型注解

可以看出,pycharm也会警告我们字典实例中缺失的key。

同时,在我们生成字典实例的时候,pycharm也会给我们key的提示。

Python 类型注解

类型别名

类型别名是通过将类型分配给别名来定义的,类型别名可用于简化复杂类型提示。

from typing import Union
Number = Union[int, float]
def process(v: Number) -> Number:
    return v
x: Number = 2
y: Number = 2.2
process(x)
process(22)		# 类型检查成功,类型别名和原始类型是等价的

NewType

使用NewType辅助类来创建不同的类型

from typing import NewType
Number = NewType("Number", int)
def process(v: Number) -> Number:
    return v
x: Number = Number(22)
process(x)
process(22)     # 类型检查异常:Expected type 'Number', got 'int' instead 
# 原因就是NewType创建的是原始类型的“子类型”

因此,类型别名 和 NewType 具体使用哪个,要视情况而定,不知道使用哪个,可以先使用类型别名。

NoReturn

当一个方法没有返回结果时,为了注解它的返回类型,我们可以将其注解为 NoReturn。

因为Python 的函数运行结束时隐式返回 None ,这和真正的无返回值是有区别的。

from typing import NoReturn
def process() -> NoReturn:
    pass

可选类型:Optional

使用 Optional[] 表示可能为 None 的值

from typing import Optional
def handler(x: int) -> Optional[int]:
    if x % 2 == 0:
        return x

可调用对象:Callable

若一个变量类型是可调用函数,则可以用 Callable[[Arg1Type, Arg2Type], ReturnType] 实现类型提示

from typing import Optional, Callable
def handler(x: int) -> Optional[int]:
    if x % 2 == 0:
        return x
def handler2(func: Callable[[int], Optional[int]]):
    pass
handler2(handler)

字面量:Literal

指示相应的变量或函数参数只接收与提供的字面量(或多个字面量之一)等效的值,可以理解为规定了某个参数或变量的所有枚举值。

from typing import Literal, NoReturn
Mode = Literal["r", "w"]
def process(mode: Mode) -> NoReturn:
    pass
process("s")

Python 类型注解

可以看出,pycharm检查出了我们输入的值并不符合字面量规定的值,进而出现了黄色警告。

Python 类型注解

Any

是一种特殊的类型,每种类型都视为与Any兼容,同样,Any也与所有类型兼容。可以对Any类型的值执行任何操作或方法调用,并将其分配给任何变量。将Any类型的值分配给更精确的类型(more precise type)时,不会执行类型检查,所有没有返回类型或参数类型的函数都将隐式地默认使用Any。

使用Any,说明值是动态类型。

把所有的类型都注解为 Any 将毫无意义,因此 Any 应当尽量少使用

from typing import Any
def foo() -> Any:
    pass

抽象基类

# 在某些情况下,我们可能并不需要严格区分一个变量或参数到底是列表 list 类型还是元组 tuple 类型
# 可以使用一个更为泛化的类型,叫做 Sequence,其用法类似于 List
class typing.Sequence(Reversible[T_co], Collection[T_co])
# collections.abc.Iterator的泛型版本
# 注释函数参数中的迭代类型时,推荐使用的抽象集合类型
class typing.Iterable(Generic[T_co])
def print_iterable(x: Iterable):
    for i in x:
        print(i)
# collections.abc.Mapping的泛型(generic)版本
# 注释函数参数中的Key-Value类型时,推荐使用的抽象集合类型
class typing.Mapping(Sized, Collection[KT], Generic[VT_co])

泛型:TypeVar

先抛出问题:

假设有一个函数,要求它既能够处理字符串,又能够处理数字。那么你可能很自然地想到了 Union ,如下:

from typing import Union
AddValue = Union[int, str]
def add(a: AddValue, b: AddValue) -> AddValue:
    return a + b
if __name__ == "__main__":
    print(add(1, 2))        # 类型检查通过,输出 3
    print(add("1", "2"))    # 类型检查通过,输出 12
    print(add("1", 2))      # 类型检查通过,报错 TypeError: can only concatenate str (not "int") to str

在类型检查通过的情况下,我们完成并运行了这段代码,可是代码却报错了!

原因就是我们的初衷是数字和数字相加实现求和,字符串和字符串相加实现拼接,没有考虑到字符串与数字混用的问题,从而引发错误。

根据以上问题,我们可以引入泛型来解决这个问题:

from typing import TypeVar
AddT = TypeVar("AddT", int, str)
def add(a: AddT, b: AddT) -> AddT:
    return a + b
if __name__ == "__main__":
    print(add(1, 2))		# 类型检查通过,输出 3
    print(add("1", "2"))	# 类型检查通过,输出 12
    print(add("1", 2))		# 类型检查失败,pycharm告警 Expected type 'str' (matched generic type 'AddT'), got 'int' instead

"""
通过告警,我们提前发现了混用类型的问题,避免了程序运行时发生异常的可能。
"""

泛型很巧妙地对类型进行了参数化,同时又保留了函数处理不同类型时的灵活性。

引用

1、Python 标准库 typing 类型注解标注

2、Python类型注解,你需要知道的都在这里了

发表回复