Case Study · Apr–Mai 2026
lead-gen-agent — Multi-Agent-CLI
für B2B-Akquise.
Vier spezialisierte Google-ADK-Agenten durchsuchen die Top-100-Städte Deutschlands nach inhabergeführten EMS-Studios, extrahieren Kontaktdaten aus dem Impressum und schreiben qualifizierte Leads in ein selbst-gehostetes Twenty-CRM. Gebaut, produktiv im Einsatz, fail-soft konzipiert.
- Stack
- Python 3.11+ · asyncio · uv
- Agent-Framework
- Google ADK 1.16+ · Gemini Grounding
- CRM
- Twenty (self-hosted)
- Infrastruktur
- Hetzner CX22 · 3,99 €/Monat
- 4 Agents
- Find · Filter · Enrich · Write
- Top 100
- Städte DE (seeded shuffle)
- ~1.3k LOC
- Python 3.11+
- 27 Runs
- produktive Pipeline-Läufe
01 · Ausgangslage
Klassische Lead-Listen waren zu grob, zu unsauber und zu teuer.
Für die heysuma-Akquise im EMS-Segment brauchten wir saubere, inhabergeführte Studios mit Inhaber-E-Mail aus dem Impressum — kein generisches "Fitnessstudios DACH"-Listenkauf-Material. Lead-Anbieter decken den Long-Tail nicht ab, und Listen aus 2024 sind 2026 zur Hälfte tot. Also haben wir die Recherche selbst gebaut, agentisch.
02 · Architektur
Vier Agenten, ein Session-State, strukturierte Hand-offs.
Statt einen monolithischen Prompt zu bauen, haben wir vier kleine,
fokussierte ADK-Agenten verkettet — bewusste Entscheidung, weil ADKs
google_search-Tool nicht mit anderen Tools in einer
Agent-Instanz koexistieren darf. Hand-offs laufen über typisierte
Pydantic-Modelle und einen gemeinsamen Session-State, nicht über
freien Text. Jeder Übergang ist deterministisch testbar, jeder Fehler
isolierbar.
03 · Ergebnis
27 produktive Läufe. Eigene CRM-Infrastruktur für 3,99 €/Monat.
Der Agent läuft seit April 2026 in regelmäßigen Batches, schreibt qualifizierte Leads ins Twenty-CRM, das wir selbst auf einer 3,99-€-Hetzner-VM betreiben — beliebige Nutzerzahl, volle Datenhoheit. Unterbrochene Läufe nehmen exakt dort weiter, wo sie stehen geblieben sind. Wir haben keine externe CRM-Lizenz abgeschlossen, kein Listen-Kauf-Budget gebraucht.
Agent-Topologie
Vier spezialisierte Agenten. Klar getrennte Aufgaben.
Gebaut mit dem Google Agent Development Kit. Jeder Agent hat ein eng definiertes Mandat, ein Pydantic-Output-Schema und kann unabhängig getestet, ersetzt oder erweitert werden.
StudioFinderAgent
Googled mit Gemini-Grounding nach EMS-Studios der jeweiligen Stadt. Liefert eine strukturierte Kandidatenliste — kein freier Text, sondern Pydantic-Modelle.
ChainFilterAgent
Entfernt Ketten und Franchise-Betriebe per Blocklist plus LLM-Reasoning. ICP-Filter (inhabergeführt) bleibt bestehen.
StudioEnrichmentAgent
Besucht je Studio das Impressum, extrahiert Inhaber, E-Mail, Telefon und vollständige Adresse. Robust gegen kaputte Seiten — fail-soft.
CRMWriterAgent
Lokales + Remote-Dedup, schreibt Company → Person → Opportunity ins Twenty-CRM. Tenacity-Retries, sauberes Logging bei Fehlern.
Engineering
Sechs Entscheidungen, die das Werkzeug verlässlich machen.
Self-Hosting statt CRM-Lizenz
Twenty CRM auf einer 3,99-€/Monat-VM ersetzt klassische CRM-SaaS-Lizenzen — bei beliebig vielen Nutzern und voller Datenhoheit (DSGVO, Hosting in DE).
Reentrant by design
Ein abgebrochener Lauf wird durch erneutes Starten exakt dort fortgesetzt, wo er stehen blieb. Persistenter State in state/progress.json, kein doppeltes Anlegen.
Trockenlauf-Modus
Mit --dry-run laufen Recherche und Mapping vollständig durch, ohne dass echte CRM-Datensätze entstehen. Payloads im Log nachvollziehbar.
Strukturierte Hand-offs
Agenten kommunizieren ausschließlich über Pydantic-Modelle (StudioCandidate, EnrichedStudio, CRMResult) und einen ADK-Session-State — jeder Hand-off ist deterministisch testbar.
Operative Robustheit
Twenty-API-Schemaänderungen, kaputte Impressen oder Search-Rate-Limits führen zu sauberem Logging und Skip, nicht zum Crash. Tenacity-Backoff plus Ratelimiter.
Deterministische Test-Samples
Seeded Shuffle über alle 100 Städte sorgt für repräsentative, reproduzierbare Stichproben — Trockenläufe sind vergleichbar.
Was das für euch bedeutet
Agenten als Werkzeug — nicht als Selbstzweck.
Der lead-gen-agent zeigt, dass moderne LLM-Agenten-Frameworks wie Google ADK kein Forschungsprojekt mehr sind, sondern produktive Werkzeuge — wenn man sie mit klassischer Engineering-Disziplin kombiniert: strukturierte Schnittstellen, idempotente Pipelines, sauberes Logging, kostenoptimierte Infrastruktur. Wir bauen solche Werkzeuge für euch — Akquise-Pipelines, Daten-Anreicherer, CRM-Integrationen, Workflow-Automatisierungen — in Wochen, nicht Monaten.