高质量 Python 项目的骨架

高质量 Python 项目是分层设计、基础设施、日志监控与工程化管理的综合产物。以下是个人在实战中沉淀的项目“骨架”核心准则：

准则：DTO 是系统稳定性的基石。必须区分：
- Req/Resp：外部交互协议。
- Params/Result：内部 Service 契约。
- PO/BO/FO：细分持久化、业务与展现对象。
推荐：首选 pydantic 或 msgspec。

路径：Schema (结构) -> Service (业务) -> Controller (入口)。
原则：先定义结构，再填充逻辑。
解耦准则：模块间严禁循环依赖。
- 依赖抽象：高层不应直接依赖底层实现。应通过 typing.Protocol 或抽象基类（ABC）定义的接口进行注入。
- 单向流动：依赖链必须单向。双向通信应引入中转模块（Schema/Event）或回调机制。
设计模式：
- 组合优于继承：优先使用 Mixin 模式。
- 面向协议：使用 typing.Protocol 实现鸭子类型校验。

纯函数优先：纯函数是逻辑校验、单元测试及并行计算的一等公民。它无副作用，给定相同输入必得相同输出。核心业务逻辑应尽可能抽离为纯函数，并与 IO 操作严格分离。
警惕特性：除非核心开发完全掌握，否则严禁在业务逻辑中引入 异步 (Asyncio) 或 元类 (Metaclass)。
状态隔离：异步或并发环境下，必须使用 contextvars 替代 threading.local 管理上下文（如 Trace ID），确保数据在协程间隔离。
作用域最小化：
- 精简暴露：优先使用私有（_）成员；严禁非必要全局变量。
- 变量寿命：缩短变量生命周期，防止状态混淆。
核心风险：
- Asyncio 陷阱：阻塞协程（如同步 requests 或 time.sleep）会导致进程假死。性能监控必开 PYTHONASYNCIODEBUG=1。
- 元类副作用：劫持创建行为，极难调试。
限制：禁止使用自定义描述符或 sys._getframe() 等堆栈劫持技术。

环境管理：必须使用 lock 机制。首选 uv；备选 Poetry/PDM。
IDE 与 Linter：强制集成 Pylance/Pyright、Mypy 及 Ruff。
Conda：仅限涉及 CUDA 等系统级依赖的深度学习场景。
工具链选择：
- HTML 解析：数据抓取场景 selectolax 性能远超 lxml。
- 序列化：优先 msgspec。解析与校验速度优于 pydantic 与 orjson。

无幂等不重试：引入指数退避重试前必确保接口幂等。
回归底线：存量变更必配自动化回归测试。
无测试不开发：复杂功能强制 TDD。
ID 策略：
- 可读型：包含时间戳 + 类型前缀（用于人工审计）。
- 有序型：如 Snowflake 或 UUIDv7。MySQL 严禁使用无序 UUID 作主键；Snowflake 产生的 64位有序 int 能显著提升聚簇索引写入性能，且占用空间更小。
- 随机型：用于匿名化或防业务量泄露。

生命周期管理：Redis 键必须包含 Namespace 前缀（如 app:module:key），并设置合理的 TTL，严禁产生永久键值。
命名规范：遵循 PEP 8，名字反映意图。
- 严禁歧义：如 process_data、obj、item 等模糊词汇。
- 拒绝冗余：如 User.name 而非 User.user_name。

精简骨架，面向未来。