Case Study · Apr–Mai 2026

lead-gen-agent — Multi-Agent-CLI
für B2B-Akquise.

Vier spezialisierte Google-ADK-Agenten durchsuchen die Top-100-Städte Deutschlands nach inhabergeführten EMS-Studios, extrahieren Kontaktdaten aus dem Impressum und schreiben qualifizierte Leads in ein selbst-gehostetes Twenty-CRM. Gebaut, produktiv im Einsatz, fail-soft konzipiert.

Stack: Python 3.11+ · asyncio · uv
Agent-Framework: Google ADK 1.16+ · Gemini Grounding
CRM: Twenty (self-hosted)
Infrastruktur: Hetzner CX22 · 3,99 €/Monat

4 Agents: Find · Filter · Enrich · Write
Top 100: Städte DE (seeded shuffle)
~1.3k LOC: Python 3.11+
27 Runs: produktive Pipeline-Läufe

01 · Ausgangslage

Klassische Lead-Listen waren zu grob, zu unsauber und zu teuer.

Für die heysuma-Akquise im EMS-Segment brauchten wir saubere, inhabergeführte Studios mit Inhaber-E-Mail aus dem Impressum — kein generisches "Fitnessstudios DACH"-Listenkauf-Material. Lead-Anbieter decken den Long-Tail nicht ab, und Listen aus 2024 sind 2026 zur Hälfte tot. Also haben wir die Recherche selbst gebaut, agentisch.

02 · Architektur

Vier Agenten, ein Session-State, strukturierte Hand-offs.

Statt einen monolithischen Prompt zu bauen, haben wir vier kleine, fokussierte ADK-Agenten verkettet — bewusste Entscheidung, weil ADKs google_search-Tool nicht mit anderen Tools in einer Agent-Instanz koexistieren darf. Hand-offs laufen über typisierte Pydantic-Modelle und einen gemeinsamen Session-State, nicht über freien Text. Jeder Übergang ist deterministisch testbar, jeder Fehler isolierbar.

03 · Ergebnis

27 produktive Läufe. Eigene CRM-Infrastruktur für 3,99 €/Monat.

Der Agent läuft seit April 2026 in regelmäßigen Batches, schreibt qualifizierte Leads ins Twenty-CRM, das wir selbst auf einer 3,99-€-Hetzner-VM betreiben — beliebige Nutzerzahl, volle Datenhoheit. Unterbrochene Läufe nehmen exakt dort weiter, wo sie stehen geblieben sind. Wir haben keine externe CRM-Lizenz abgeschlossen, kein Listen-Kauf-Budget gebraucht.

Agent-Topologie

Vier spezialisierte Agenten. Klar getrennte Aufgaben.

Gebaut mit dem Google Agent Development Kit. Jeder Agent hat ein eng definiertes Mandat, ein Pydantic-Output-Schema und kann unabhängig getestet, ersetzt oder erweitert werden.

StudioFinderAgent

Googled mit Gemini-Grounding nach EMS-Studios der jeweiligen Stadt. Liefert eine strukturierte Kandidatenliste — kein freier Text, sondern Pydantic-Modelle.

ChainFilterAgent

Entfernt Ketten und Franchise-Betriebe per Blocklist plus LLM-Reasoning. ICP-Filter (inhabergeführt) bleibt bestehen.

StudioEnrichmentAgent

Besucht je Studio das Impressum, extrahiert Inhaber, E-Mail, Telefon und vollständige Adresse. Robust gegen kaputte Seiten — fail-soft.

CRMWriterAgent

Lokales + Remote-Dedup, schreibt Company → Person → Opportunity ins Twenty-CRM. Tenacity-Retries, sauberes Logging bei Fehlern.

Engineering

Sechs Entscheidungen, die das Werkzeug verlässlich machen.

Self-Hosting statt CRM-Lizenz

Twenty CRM auf einer 3,99-€/Monat-VM ersetzt klassische CRM-SaaS-Lizenzen — bei beliebig vielen Nutzern und voller Datenhoheit (DSGVO, Hosting in DE).

Reentrant by design

Ein abgebrochener Lauf wird durch erneutes Starten exakt dort fortgesetzt, wo er stehen blieb. Persistenter State in state/progress.json, kein doppeltes Anlegen.

Trockenlauf-Modus

Mit --dry-run laufen Recherche und Mapping vollständig durch, ohne dass echte CRM-Datensätze entstehen. Payloads im Log nachvollziehbar.

Strukturierte Hand-offs

Agenten kommunizieren ausschließlich über Pydantic-Modelle (StudioCandidate, EnrichedStudio, CRMResult) und einen ADK-Session-State — jeder Hand-off ist deterministisch testbar.

Operative Robustheit

Twenty-API-Schemaänderungen, kaputte Impressen oder Search-Rate-Limits führen zu sauberem Logging und Skip, nicht zum Crash. Tenacity-Backoff plus Ratelimiter.

Deterministische Test-Samples

Seeded Shuffle über alle 100 Städte sorgt für repräsentative, reproduzierbare Stichproben — Trockenläufe sind vergleichbar.

Was das für euch bedeutet

Agenten als Werkzeug — nicht als Selbstzweck.

Der lead-gen-agent zeigt, dass moderne LLM-Agenten-Frameworks wie Google ADK kein Forschungsprojekt mehr sind, sondern produktive Werkzeuge — wenn man sie mit klassischer Engineering-Disziplin kombiniert: strukturierte Schnittstellen, idempotente Pipelines, sauberes Logging, kostenoptimierte Infrastruktur. Wir bauen solche Werkzeuge für euch — Akquise-Pipelines, Daten-Anreicherer, CRM-Integrationen, Workflow-Automatisierungen — in Wochen, nicht Monaten.

Projekt besprechen heysuma-Case ansehen

lead-gen-agent — Multi-Agent-CLI für B2B-Akquise.