|
|
ca9ff55587
|
feat: duration_ms-logging, bulk-semaphore und erweitertes README
- Pipeline-Stages (download/extract/embed/qdrant) loggen jetzt duration_ms
- bulk-import dispatcht mit Semaphore(4) statt unbounded → Backpressure
- README dokumentiert Webhook-Payload-Schema mit curl-Beispiel
- README enthaelt Recovery-Runbook (dim-mismatch, crash-recovery, single-file reindex)
|
2026-05-04 22:54:58 +02:00 |
|
|
|
61e00028e8
|
chore: vector/chunk count assertion und page_num rename in pipeline
|
2026-05-04 22:35:17 +02:00 |
|
|
|
02c8f5d338
|
feat: pipeline-orchestrator fuer single-file ingest
|
2026-05-04 22:32:29 +02:00 |
|
|
|
dabab742de
|
chore: backoff als tuple, exception-chain via raise-from
|
2026-05-04 22:23:12 +02:00 |
|
|
|
afbd946e0a
|
feat: ollama embedder mit exponential backoff retry
|
2026-05-04 22:20:52 +02:00 |
|
|
|
b5b46e41ad
|
feat: webdav download via httpx mit basic-auth
|
2026-05-04 22:18:01 +02:00 |
|
|
|
ec55110ae4
|
feat: extractors fuer pdf/md/docx/xlsx mit dynamic fixtures
|
2026-05-04 22:14:59 +02:00 |
|
|
|
2f2024f168
|
feat: word-based chunker mit sentence-boundary look-back
|
2026-05-04 22:11:14 +02:00 |
|
|
|
0224581587
|
refactor: klarere typ-extraktion, fullmatch, root-prefix-test
|
2026-05-04 22:09:41 +02:00 |
|
|
|
8d15f02187
|
feat: pfad-metadata-parser mit semester/fach/typ
|
2026-05-04 22:06:59 +02:00 |
|
|
|
db46a154c8
|
chore: project scaffolding mit uv und pyproject.toml
|
2026-05-04 21:54:17 +02:00 |
|