Commit Graph

21 Commits

Author SHA1 Message Date
ca9ff55587 feat: duration_ms-logging, bulk-semaphore und erweitertes README
- Pipeline-Stages (download/extract/embed/qdrant) loggen jetzt duration_ms
- bulk-import dispatcht mit Semaphore(4) statt unbounded → Backpressure
- README dokumentiert Webhook-Payload-Schema mit curl-Beispiel
- README enthaelt Recovery-Runbook (dim-mismatch, crash-recovery, single-file reindex)
2026-05-04 22:54:58 +02:00
a91150c41f chore: 502 bei propfind-fail, min_length path, exact-call assertion 2026-05-04 22:45:23 +02:00
8c50ab008c feat: bulk-import endpoint mit propfind walk 2026-05-04 22:42:21 +02:00
4792f0277f feat: fastapi app mit lifespan, webhook handler und /health 2026-05-04 22:37:23 +02:00
61e00028e8 chore: vector/chunk count assertion und page_num rename in pipeline 2026-05-04 22:35:17 +02:00
02c8f5d338 feat: pipeline-orchestrator fuer single-file ingest 2026-05-04 22:32:29 +02:00
81f6201cfc feat: webhook event-model und shared-secret auth 2026-05-04 22:28:10 +02:00
a861f4ec2b chore: docstrings und tighter upsert-test fuer qdrant store 2026-05-04 22:27:03 +02:00
7ebb63501e feat: qdrant store mit ensure/upsert/delete-by-path 2026-05-04 22:24:44 +02:00
dabab742de chore: backoff als tuple, exception-chain via raise-from 2026-05-04 22:23:12 +02:00
afbd946e0a feat: ollama embedder mit exponential backoff retry 2026-05-04 22:20:52 +02:00
b5b46e41ad feat: webdav download via httpx mit basic-auth 2026-05-04 22:18:01 +02:00
ec55110ae4 feat: extractors fuer pdf/md/docx/xlsx mit dynamic fixtures 2026-05-04 22:14:59 +02:00
2f2024f168 feat: word-based chunker mit sentence-boundary look-back 2026-05-04 22:11:14 +02:00
0224581587 refactor: klarere typ-extraktion, fullmatch, root-prefix-test 2026-05-04 22:09:41 +02:00
8d15f02187 feat: pfad-metadata-parser mit semester/fach/typ 2026-05-04 22:06:59 +02:00
e5032c7e59 feat: key=value logging formatter 2026-05-04 22:03:43 +02:00
a22b8e6fe7 refactor: lru_cache fuer get_settings, vollere field-coverage in tests 2026-05-04 22:02:50 +02:00
d2c2466abd chore: unbenutzten Field-import entfernen 2026-05-04 22:00:31 +02:00
ce630ff1c7 feat: pydantic-settings config mit allen env-vars 2026-05-04 21:58:52 +02:00
db46a154c8 chore: project scaffolding mit uv und pyproject.toml 2026-05-04 21:54:17 +02:00