行政处罚决定书类案检索系统,包含向量检索与 LLM 分析流程,并提供 Web UI 与 API。
快速开始
pip install -r requirements.txtpython app.py(开发服务默认http://localhost:5001)gunicorn app:app --timeout 600(生产风格启动)
常用脚本
python scripts/build_index.py --force(重建 Chroma 索引)python scripts/build_index.py --abstracts(构建摘要索引)python scripts/generate_jsonl.py --input-dir ./total_texts --output batch_requests.jsonlpython scripts/insert_abstracts.py(默认读取total_texts/abstract/results.jsonl)python verify_config.py(校验配置与 API Key)
目录结构
app.py:Flask 入口与 API 路由modules/:核心 RAG 逻辑(配置、加载、检索、合并)prompts/:提示词模板scripts/:索引构建与批处理脚本templates/、static/:Web UI 视图与资源tests/:测试与问题复现脚本total_texts/:案件原始文本与索引数据(含chroma_db/、abstract/)artifacts/:运行产物与归档artifacts/logs/:运行日志artifacts/debug/:调试输出artifacts/intermediate_results/:Embedding 中间结果artifacts/legacy/:历史备份与旧产物
配置与数据
config.yaml:本地配置config.yaml.example:配置模板.env或secrets.yaml:敏感配置(请勿提交)