homelab-codex-ws

History

Oskar Kapala c255a021d1 fix(observer): quarantine malformed event files to prevent processing wedge Was: malformed event (bad JSON / truncated / corrupted bytes) wedged the node's checkpoint forever — every cycle re-tried, logged, never advanced past the bad file; all subsequent good events for that node lost. Now: first parse failure -> atomic os.replace to STATE_DIR/observer_failed_events/<node>/ with collision handling. Checkpoint advances, downstream events flow. Move failures themselves are logged but don't crash the loop. Complementary to yesterday's atomic_write_json fix (state files); this addresses the same race-pattern on event files instead. Regression test asserts: bad event quarantined to failed_events dir, removed from hot path, subsequent good event processed (node online), checkpoint moves to good event.		2026-06-12 11:22:56 +02:00
..
bootstrap	Implement VPS control-plane deployment profile	2026-05-12 20:19:05 +02:00
deploy	feat(deploy): Saturn-side dispatcher wrapper	2026-06-03 16:06:36 +02:00
dev	fix(dev): agent.sh worktree_count/paths grep exit-1 on empty set	2026-06-03 18:04:38 +02:00
lib	Implement filesystem-first runtime event system	2026-05-12 13:38:25 +02:00
monitor	feat(node-agent): implement health monitor and safe cleanup policy	2026-05-27 13:15:06 +02:00
observer	fix(observer): quarantine malformed event files to prevent processing wedge	2026-06-12 11:22:56 +02:00
onboard	feat(onboard): implement 40-register + 50-verify, remove dead scaffold	2026-06-09 20:36:00 +02:00
bootstrap.sh	Initial homelab workspace structure	2026-05-07 20:17:27 +02:00