8.7 KiB
8.7 KiB
inclusion
| inclusion |
|---|
| manual |
OfferPie Python AI 项目结构说明
1️⃣ 项目整体层次
offerpie_python_ai/
│
├─ .env / .env.test / .env.prod # 环境变量配置(dev/test/prod)
├─ requirements.txt # Python 依赖清单
│
└─ app/ # 应用主目录
├─ main.py # FastAPI 应用入口(注册异常处理、中间件、CORS、路由)
├─ banner.txt # 启动 Banner
│
├─ config/ # **配置层**
│ └─ settings.py # Pydantic Settings 统一配置(环境、数据库、Redis、LLM供应商、JWT、CORS、日志等)
│
├─ core/ # **核心基础设施层**
│ ├─ auth.py # 权限校验依赖(require_login、func_permission 装饰器)
│ ├─ context.py # 请求上下文变量(RequestContext:request_id、user_id)
│ ├─ database.py # SQLAlchemy 异步引擎 + 会话工厂(init_db、close_db、get_db)
│ ├─ redis.py # Redis 异步连接池(init_redis、close_redis、get_redis)
│ ├─ lifespan.py # FastAPI 生命周期管理(启动初始化 DB/Redis,关闭释放资源)
│ ├─ logger.py # Loguru 日志配置(控制台+文件,自动注入 request_id/user_id)
│ ├─ middleware.py # 中间件注册(RequestID、JWT鉴权、登录拦截、请求日志、响应统一包装)
│ ├─ exceptions.py # 全局异常处理器(HTTP异常、验证异常、断言异常、未知异常)
│ └─ schemas/
│ └─ responses.py # 统一响应模型 StandardResponse(code/msg/data/timestamp/uuid)
│
├─ ai/ # **AI 能力层**
│ └─ models.py # LLM 模型枚举(LLM.DOUBAO_PRO_256K、DEEPSEEK_V3、GPT_4O 等),基于 LangChain ChatOpenAI
│
├─ api/ # **路由层**(REST API 接口)
│ ├─ health.py # 健康检查接口 GET /health/
│ └─ resume.py # 简历接口 POST /resume/upload(上传文件AI解析)
│
├─ models/ # **ORM 模型层**(SQLAlchemy 声明式映射)
│ ├─ func_permission.py # 功能权限定义表(bg_func_permission)
│ ├─ user_func_permission_stock.py # 用户功能权限库存表(bg_user_func_permission_stock)
│ ├─ user_func_usage_log.py # 用户功能使用记录表(bg_user_func_usage_log)
│ ├─ user_resume.py # 用户简历主表(bg_user_resume)
│ ├─ user_resume_education.py # 简历-教育经历表(bg_user_resume_education)
│ ├─ user_resume_work.py # 简历-工作经历表(bg_user_resume_work)
│ ├─ user_resume_internship.py # 简历-实习经历表(bg_user_resume_internship)
│ ├─ user_resume_project.py # 简历-项目经历表(bg_user_resume_project)
│ └─ user_resume_competition.py # 简历-竞赛经历表(bg_user_resume_competition)
│
├─ tool/ # **工具层**(无状态、无业务依赖的通用工具)
│ ├─ file_parser.py # 文件解析工具(PDF/Word/TXT → 纯文本,parse_to_text 入口方法)
│ └─ snowflake.py # 雪花 ID 生成工具(next_id)
│
└─ services/ # **业务逻辑层**
├─ func_permission_service.py # 功能权限服务(校验+扣减+回退,逻辑与Java端一致)
└─ resume_parse_service.py # 简历解析服务(文件解析→AI结构化→写入主表+5张子表)
2️⃣ 各层模块职责
| 层级 | 主要职责 | 关键类/文件 |
|---|---|---|
| config | 统一配置管理,基于 Pydantic Settings,支持 .env 文件加载 | Settings(数据库、Redis、LLM供应商、JWT、CORS、日志等全部配置项) |
| core | 核心基础设施:数据库连接、Redis连接、鉴权、日志、中间件、异常处理、统一响应 | database.py、redis.py、auth.py、middleware.py、exceptions.py、logger.py、StandardResponse |
| ai | AI 模型管理,封装多供应商 LLM 实例创建,基于 LangChain ChatOpenAI | LLM 枚举(火山引擎:doubao/deepseek,心缘:gpt-4o/claude) |
| api | REST API 路由定义 | health.py(健康检查)、resume.py(简历上传解析) |
| models | SQLAlchemy ORM 模型,与 Java 端共享同一数据库 | FuncPermission、UserFuncPermissionStock、UserFuncUsageLog、UserResume、UserResumeEducation/Work/Internship/Project/Competition |
| tool | 无状态通用工具,不依赖数据库/Redis/用户上下文 | file_parser.py(PDF/Word/TXT 文件解析为纯文本)、snowflake.py(雪花ID生成) |
| services | 业务逻辑实现 | FuncPermissionService(功能权限校验、扣减、回退)、ResumeParseService(简历文件解析→AI结构化→入库) |
3️⃣ 技术栈
| 类别 | 技术选型 | 说明 |
|---|---|---|
| Web 框架 | FastAPI + Uvicorn + Gunicorn | 异步 ASGI 框架 |
| ORM | SQLAlchemy 2.0 (asyncio) + asyncmy | 异步 MySQL 驱动 |
| 缓存 | redis-py (asyncio) | 异步 Redis 客户端 |
| AI/LLM | LangChain + LangChain-OpenAI + LangGraph | AI 编排框架,兼容 OpenAI 协议的多供应商接入 |
| 配置 | Pydantic Settings + python-dotenv | 类型安全的环境变量管理 |
| 日志 | Loguru | 结构化日志,自动注入请求上下文 |
| 鉴权 | PyJWT | JWT 解析,与 Java 端共享同一 jwt_secret |
| 数据处理 | Pandas + NumPy | 数据分析与处理 |
| HTTP | httpx | 异步 HTTP 客户端 |
| 文件解析 | pdfplumber + python-docx | PDF 和 Word 文件内容提取 |
4️⃣ 中间件执行链(由外到内)
| 顺序 | 中间件 | 职责 |
|---|---|---|
| 1 | RequestIDMiddleware |
生成 ShortUUID 请求ID,写入响应头 X-Request-ID |
| 2 | JwtAuthMiddleware |
从 Cookie/Header 解析 JWT,校验 Redis 登录信息,续期,写入 RequestContext.user_id |
| 3 | AuthRequiredMiddleware |
非白名单路径必须有 user_id,否则返回 401 |
| 4 | RequestLogMiddleware |
记录请求方法、URL、参数、响应状态码和耗时 |
| 5 | ResponseWrapMiddleware |
将业务路由的 JSON 响应统一包装为 StandardResponse 格式 |
5️⃣ 鉴权体系
- 与 Java 端共享同一 JWT Secret 和 Redis 登录信息
- Token 来源:优先 Cookie
Token,其次 HeaderToken - 白名单路径(
/health/**、/docs/**、/redoc/**、/openapi.json)跳过鉴权 - 功能权限校验通过
func_permission(func_code)依赖注入实现,逻辑与 Java 端FuncPermissionAspect完全一致:- 校验每日免费额度
- 查付费库存(时间+次数维度)
- SQL 原子扣减
- 业务异常自动回退
6️⃣ AI 模型配置
| 供应商 | 模型 | 枚举值 |
|---|---|---|
| 火山引擎 | doubao-pro-256k | LLM.DOUBAO_PRO_256K |
| 火山引擎 | doubao-pro-32k | LLM.DOUBAO_PRO_32K |
| 火山引擎 | doubao-lite-128k | LLM.DOUBAO_LITE_128K |
| 火山引擎 | deepseek-v3-250324 | LLM.DEEPSEEK_V3 |
| 火山引擎 | deepseek-r1-250528 | LLM.DEEPSEEK_R1 |
| 心缘 | gpt-4o | LLM.GPT_4O |
| 心缘 | gpt-4o-mini | LLM.GPT_4O_MINI |
| 心缘 | claude-sonnet-4-20250514 | LLM.CLAUDE_SONNET_4 |
所有模型通过 LLM.XXX.create(**kwargs) 创建 LangChain ChatOpenAI 实例,kwargs 透传 temperature、max_tokens 等参数。
7️⃣ 与 Java 后端的关系
- 共享数据库:Python 端与 Java 端(back-end)连接同一 MySQL 数据库(offerpie),ORM 模型对应相同的表
- 共享 Redis:共享登录态(
login:token:{userId}),JWT Secret 一致 - 共享权限体系:功能权限校验逻辑与 Java 端
FuncPermissionAspect完全对齐 - 职责分工:Java 端负责业务 CRUD(用户、简历、岗位等),Python 端负责 AI 能力(LLM 调用、智能分析等)
8️⃣ 构建与运行
- 虚拟环境:项目使用
.venv目录管理 Python 虚拟环境 - 依赖安装:
pip install -r requirements.txt - 开发启动:
python -m app.main(默认 ENV=dev,端口由 settings.server_port 控制) - 生产部署:通过 Gunicorn + Uvicorn Worker 运行
- 环境切换:通过
.env/.env.test/.env.prod文件控制环境变量