Commit Graph

33 Commits

Author SHA1 Message Date
4b9280a972 test: ungenutzte imports entfernen (ruff F401)
All checks were successful
CI / ci (push) Successful in 37s
Release / release (push) Successful in 53s
v0.1.0
2026-05-07 16:06:55 +02:00
b95071a95e ci: manueller checkout statt actions/checkout
Some checks failed
CI / ci (push) Failing after 24s
actions/checkout@v4 ist eine node-action; python:3.12-slim hat kein node
installiert -> 'exec: node not found'. ersatz durch git clone analog
release.yml.
2026-05-07 15:59:24 +02:00
11acf0eb92 ci: gitea workflows für ci-pipeline und release
Some checks failed
CI / ci (push) Failing after 12s
- ci.yml: lint (ruff), test (pytest), build (uv build) auf jedem push/PR
- release.yml: docker image build + push auf v*-tag, gitea release mit changelog
2026-05-07 15:42:02 +02:00
ca9ff55587 feat: duration_ms-logging, bulk-semaphore und erweitertes README
- Pipeline-Stages (download/extract/embed/qdrant) loggen jetzt duration_ms
- bulk-import dispatcht mit Semaphore(4) statt unbounded → Backpressure
- README dokumentiert Webhook-Payload-Schema mit curl-Beispiel
- README enthaelt Recovery-Runbook (dim-mismatch, crash-recovery, single-file reindex)
2026-05-04 22:54:58 +02:00
7fe2d853ec docs: readme mit endpoints, struktur und entwicklung 2026-05-04 22:49:34 +02:00
964b10dfe8 chore: dockerignore und header comment fuer compose 2026-05-04 22:48:49 +02:00
ec94fe899b chore: dockerfile und compose-beispiel 2026-05-04 22:46:36 +02:00
a91150c41f chore: 502 bei propfind-fail, min_length path, exact-call assertion 2026-05-04 22:45:23 +02:00
8c50ab008c feat: bulk-import endpoint mit propfind walk 2026-05-04 22:42:21 +02:00
fab5569955 chore: imports hoisten und stricter background-task assertion 2026-05-04 22:40:22 +02:00
4792f0277f feat: fastapi app mit lifespan, webhook handler und /health 2026-05-04 22:37:23 +02:00
61e00028e8 chore: vector/chunk count assertion und page_num rename in pipeline 2026-05-04 22:35:17 +02:00
02c8f5d338 feat: pipeline-orchestrator fuer single-file ingest 2026-05-04 22:32:29 +02:00
e68e77a821 test: parametrize event-types und tighten validation-error assertion 2026-05-04 22:30:03 +02:00
81f6201cfc feat: webhook event-model und shared-secret auth 2026-05-04 22:28:10 +02:00
a861f4ec2b chore: docstrings und tighter upsert-test fuer qdrant store 2026-05-04 22:27:03 +02:00
7ebb63501e feat: qdrant store mit ensure/upsert/delete-by-path 2026-05-04 22:24:44 +02:00
dabab742de chore: backoff als tuple, exception-chain via raise-from 2026-05-04 22:23:12 +02:00
afbd946e0a feat: ollama embedder mit exponential backoff retry 2026-05-04 22:20:52 +02:00
b5b46e41ad feat: webdav download via httpx mit basic-auth 2026-05-04 22:18:01 +02:00
ec55110ae4 feat: extractors fuer pdf/md/docx/xlsx mit dynamic fixtures 2026-05-04 22:14:59 +02:00
5e44495676 test: regression tests fuer overlap>=size und boundary ausserhalb lookback 2026-05-04 22:13:34 +02:00
2f2024f168 feat: word-based chunker mit sentence-boundary look-back 2026-05-04 22:11:14 +02:00
0224581587 refactor: klarere typ-extraktion, fullmatch, root-prefix-test 2026-05-04 22:09:41 +02:00
8d15f02187 feat: pfad-metadata-parser mit semester/fach/typ 2026-05-04 22:06:59 +02:00
e5032c7e59 feat: key=value logging formatter 2026-05-04 22:03:43 +02:00
a22b8e6fe7 refactor: lru_cache fuer get_settings, vollere field-coverage in tests 2026-05-04 22:02:50 +02:00
d2c2466abd chore: unbenutzten Field-import entfernen 2026-05-04 22:00:31 +02:00
ce630ff1c7 feat: pydantic-settings config mit allen env-vars 2026-05-04 21:58:52 +02:00
de6859da9c chore: uv.lock fuer reproduzierbare installs 2026-05-04 21:54:49 +02:00
db46a154c8 chore: project scaffolding mit uv und pyproject.toml 2026-05-04 21:54:17 +02:00
8746b187a7 docs: implementation plan mit 15 tasks
Bite-sized TDD-Tasks mit komplettem Code in jedem Step. Reihenfolge
bottom-up: pure-logic units zuerst (metadata, chunker), dann externe
Services (webdav, ollama, qdrant), dann Orchestrierung und API,
abschliessend Docker und README.

Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
2026-05-04 21:36:00 +02:00
5554f25738 docs: initial requirements und design spec
Initial commit fuer den RAG-Ingestor-Microservice. Enthaelt die
urspruengliche REQUIREMENTS.md und die ausgearbeitete Design-Spec
nach Brainstorming-Session.

Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
2026-05-04 21:29:13 +02:00