Python 数据模型：魔术方法与对象行为定制 · Python 专题

返回专题首页

Python 专题第 11 篇 / 39 篇5 分钟

很多 Python 代码看起来很“自然”，比如对象可以被打印、可以参与运算、可以像容器一样迭代、甚至可以像函数一样调用。这些行为背后依赖的，其实就是 Python 数据模型以及一系列魔术方法。

这一节我们会从最常见的 __init__、__repr__、__iter__、__call__ 等成员切入，理解对象行为是如何被语言本身“约定”出来的。掌握这一层以后，你会对 Python 的表达力有更深的感受。

什么是 Python 数据模型？

所谓 Python 数据模型，可以先把它理解成：当一个对象想表现得像某种“语言内建角色”时，需要遵守的一套约定。

比如：

想让对象能被 len() 处理，就实现相关长度协议；
想让对象能被 for 遍历，就实现迭代协议；
想让对象打印出来更友好，就实现字符串表示相关方法。

这些能力并不是靠某个统一接口类强制继承来的，而是通过一组特殊命名的方法完成的，这些方法通常被称为魔术方法或 dunder 方法。

所以数据模型真正重要的不是“背方法名”，而是理解：Python 语言很多看起来天然的行为，背后其实都是对象和解释器之间的约定。

对象初始化：`new` 与 `init`

最常见的魔术方法，通常是 __init__。我们前面已经接触过，它负责实例创建后的初始化。

class User:
    def __init__(self, name):
        self.name = name

但在它之前，其实还有 __new__。它负责“创建实例对象本身”。

对于大多数日常业务代码来说，你通常只需要写 __init__ 就够了。__new__ 更多出现在不可变对象定制、元编程或某些特殊底层场景里。

所以这里最重要的结论不是去频繁使用 __new__，而是知道两者职责不同：

__new__ 负责创建对象；
__init__ 负责初始化对象。

一旦这个分工清楚了，你对对象生命周期的理解就会更完整。

可读表示：`repr` 与 `str`

如果你打印一个自定义对象，默认输出往往不太友好：

<__main__.User object at 0x...>

这时就可以通过 __repr__ 或 __str__ 改善可读性。

class User:
    def __init__(self, name):
        self.name = name

    def __repr__(self):
        return f"User(name={self.name!r})"

一般可以这样理解：

__repr__ 更偏向开发者视角，强调准确、可调试；
__str__ 更偏向用户视角，强调友好、易读。

如果你只实现一个，优先实现 __repr__ 往往更有价值，因为它对调试、日志和 REPL 体验帮助很大。

很多库之所以用起来顺手，一个很重要的细节就是它们把对象表示写得足够清楚。你一打印，就知道里面有什么。

容器行为：`len`、`iter` 与 `contains`

如果一个对象想表现得像容器，就需要实现相应协议。

例如长度：

class Team:
    def __init__(self, members):
        self.members = members

    def __len__(self):
        return len(self.members)

这样你就可以直接写：

team = Team(["a", "b", "c"])
print(len(team))

如果希望对象能被遍历，可以实现 __iter__：

class Team:
    def __init__(self, members):
        self.members = members

    def __iter__(self):
        return iter(self.members)

这样对象就能直接用于 for 循环。

而 __contains__ 则决定 in 判断的行为：

def __contains__(self, item):
    return item in self.members

这些方法的价值在于，它们让你的对象不只是“自定义数据块”，而是真正能融入 Python 原生语法生态。

不过也要记住，不要为了“炫技”而乱加协议。只有当对象确实具备某种角色语义时，再去实现对应方法，否则就会制造误导。

可调用对象：`call` 的实际意义

有些对象创建出来后，可以像函数一样直接调用，这背后对应的就是 __call__：

class Greeter:
    def __call__(self, name):
        return f"Hello, {name}"

然后：

g = Greeter()
print(g("Colin"))

这类设计常见于：

带状态的处理器；
策略对象；
装饰器对象；
某些机器学习或规则引擎里的可执行实例。

它的核心意义是：这个对象本身不仅保存状态，还代表一种“可执行行为”。

所以 __call__ 并不是为了把代码写得更魔幻，而是为了让“对象 + 行为”在语义上收拢成一个整体。

运算符重载与行为定制边界

Python 还允许你通过 __add__、__eq__ 等方法定制运算行为：

class Money:
    def __init__(self, amount):
        self.amount = amount

    def __add__(self, other):
        return Money(self.amount + other.amount)

这样两个 Money 对象就可以直接相加。

这类能力非常强，但也要特别克制。因为运算符重载一旦不符合直觉，代码就会变得很难猜。

好的行为定制，应该满足两个条件：

符合语言用户的直觉；
能清楚表达领域对象的语义。

如果一个对象明明不是数字，却硬要重载一堆算术运算；或者某个比较操作的结果和常识不一致，那这种“灵活”反而会伤害可读性。

所以，数据模型带来的自由越大，越需要你守住语义边界。

总结与预告

这一节我们从多个高频魔术方法出发，理解了 Python 对象行为背后的数据模型约定。很多“看起来很自然”的语言体验，其实都来自这些底层约定在默默工作。

下一节我们会从对象行为转向程序健壮性，系统讲清异常处理、自定义异常以及错误边界应该如何设计。

什么是 Python 数据模型？

对象初始化：__new__ 与 __init__

可读表示：__repr__ 与 __str__