04. Aug. 2025·6 Min. Lesezeit

PostgreSQL "Search Everywhere": Volltext-, Trigramm- und partielle Indizes

Q: Warum macht `ILIKE '%...%'` die Suche langsam?

`ILIKE '%term%'` hat ein führendes Wildcard, deshalb kann PostgreSQL in der Regel keinen normalen B‑Tree‑Index verwenden und muss viele Zeilen prüfen. Das fühlt sich bei kleinen Tabellen vielleicht in Ordnung an, verlangsamt aber stark, wenn die Daten wachsen. Wenn du Substring‑ oder fehlertolerante Übereinstimmungen brauchst, plane für Trigramm‑ oder Volltext‑Suche statt darauf zu hoffen, dass `ILIKE` skaliert.

Q: Was ist der schnellste Weg, um exakte Lookups wie IDs oder E‑Mails zu behandeln?

Verwende exakte Vergleiche wie `WHERE id = $1` oder `WHERE email = $1` und unterstütze sie mit einem B‑Tree (bei E‑Mails oder Codes oft unique). Exakte Lookups sind die günstigsten Suchanfragen und machen Ergebnisse außerdem vorhersehbar. Wenn Nutzer eine vollständige Ticketnummer oder E‑Mail einfügen, leite die Anfrage zuerst über diesen Pfad.

Q: Wie mache ich eine case‑insensitive Präfixsuche, ohne Indizes zu zerstören?

Bevorzuge ein Präfixmuster wie `name ILIKE 'ann%'` und indexiere dieselbe Ausdrucksform konsistent. Für zuverlässiges case‑insensitive Verhalten fragen viele Teams `lower(name)` ab und legen einen Index auf denselben Ausdruck an, damit der Planner ihn nutzen kann. Wenn das Muster nicht am Anfang verankert ist, reicht Präfixsuche nicht aus.

Q: Wie validiere ich Performance und rolle Suchänderungen sicher aus?

Lege den Index an und überprüfe dann die echte Abfrage mit `EXPLAIN (ANALYZE, BUFFERS)` auf realistischen Datenmengen, nicht nur im Dev‑Datensatz. Rolle Änderungen schrittweise aus und halte Rollbacks einfach; bei großen Tabellen `CREATE INDEX CONCURRENTLY` nutzen, um Schreibsperren zu vermeiden. Wenn du die Oberfläche in AppMaster (appmaster.io) baust, definiere die Suchregeln zusammen mit dem Datenmodell und der Business‑Logik, damit UI‑Verhalten und DB‑Entscheidungen nicht auseinanderlaufen.

Lerne, wie du eine schnelle „Search everywhere“ in PostgreSQL für interne Bildschirme entwirfst: wann Volltextsuche, Trigramm‑Indizes oder partielle Indizes sinnvoll sind und wie du Prioritäten setzt.

Was „Search everywhere“ für interne Tools wirklich bedeutet

Auf einem internen Bildschirm heißt „Search everywhere“ meist: „Hilf mir, genau den Datensatz zu finden, an den ich gerade denke — schnell, auch wenn ich mich nicht exakt erinnere.“ Nutzer browsen nicht; sie wollen direkt zu einem Kunden, Ticket, einer Rechnung oder einem Gerät springen.

Deshalb fühlt sich eine langsame Suche schlimmer an als eine langsame Seite. Eine Seitenladung passiert einmal. Suche passiert oft mehrfach hintereinander, meist während jemand in einem Anruf ist oder triagiert. Dauern Ergebnisse 2–3 Sekunden, ändert der Nutzer die Anfrage, löscht Zeichen, probiert ein anderes Stichwort und am Ende hast du mehr Last und mehr Frust.

Aus einem Suchfeld erwarten Nutzer mehrere Verhaltensweisen: Teiltreffer ("alex" findet "Alexander"), Toleranz für kleine Tippfehler ("microsfot" findet trotzdem "Microsoft"), eine sinnvolle Reihenfolge der besten Treffer (exakte IDs oder E‑Mails oben), etwas Neuigkeitsbias und Filter, die standardmäßig angewendet werden (offene Tickets, aktive Kunden).

Das Schwierige ist, dass ein Eingabefeld oft mehrere Intentionen verbirgt. Ein Agent könnte eine Ticketnummer einfügen, einen Namensfragment tippen, nach einer E‑Mail suchen oder eine Telefonnummer eingeben. Jede Absicht braucht oft eine andere Strategie, unterschiedliche Indizes und manchmal eine eigene Ranking‑Regel.

Also fang nicht mit Indizes an. Schreib zuerst die wenigen Suchintentionen auf, die deine Nutzer wirklich haben, und trenne Identitätsfelder (IDs, E‑Mails) von fuzzy Feldern (Namen, Betreffe) und langen Texten (Notizen).

Starte damit, die Daten und das Suchverhalten zu benennen

Bevor du einen Index wählst, notiere, was Leute tatsächlich eintippen. „PostgreSQL search everywhere“ klingt nach einer Funktion, ist aber meist eine Mischung sehr unterschiedlicher Suchen.

Interne Tools vermischen „harte“ Identifier (Bestell‑ID, Ticketnummer, Rechnungs‑Code) mit „weichem“ Text (Kundenname, E‑Mail, Notizen, Tags). Diese Gruppen verhalten sich in PostgreSQL unterschiedlich; sie gleich zu behandeln ist eine schnelle Abkürzung zu langsamen Abfragen.

Als nächstes trenne die Verhaltensweisen:

Exakte Suche: Jemand sucht TCK-104883 und erwartet ein präzises Ergebnis.
Fuzzy‑Suche: Jemand tippt john smth und will eine verzeihende Übereinstimmung über Namen (und vielleicht E‑Mails), die eine kurze Liste liefert.
Filtergetriebene Suche: Jemand wählt „Status = Open“ und „Zugewiesen = Mir“ — hier ist das Textfeld sekundär.

Entscheide früh, ob Ergebnisse gerankt werden müssen (beste Treffer zuerst) oder einfach nur gefiltert. Ranking ist wichtig für Notizen und längere Beschreibungen. Für IDs und E‑Mails wirkt Ranking oft zufällig und kostet zusätzlich.

Eine kurze Checkliste reicht meist aus:

Welche Felder werden täglich durchsucht?
Welche Eingaben sind exakt (IDs, Codes), fuzzy (Namen) oder langer Text (Notizen)?
Welche Filter gelten praktisch bei jeder Suche?
Brauchst du „best match“ Reihenfolge oder reicht jedes Match?
Wie schnell wächst die Tabelle: Tausende, Hunderttausende oder Millionen?

Wenn du diese Entscheidungen vorher triffst, fühlen sich Index‑Wahlen später nicht wie Raten an.

Die Basis: exakte Treffer und warum `ILIKE` oft schadet

Sichere die einfachen Gewinne zuerst. Für viele interne Bildschirme liefert ein normaler B‑Tree‑Index sofort Ergebnisse für exakte Treffer wie IDs, Bestellnummern, E‑Mails und externe Referenzen.

Wenn Leute einen exakten Wert einfügen, stelle sicher, dass deine Abfrage wirklich exakt ist. WHERE id = ... oder WHERE email = ... kann mit einem normalen Index extrem schnell sein. Ein Unique‑Index auf E‑Mail zahlt sich oft doppelt aus: Geschwindigkeit und bessere Datenqualität.

Probleme beginnen, wenn „search everywhere“ stillschweigend zu ILIKE wird. Eine Abfrage wie name ILIKE '%ann%' hat ein führendes Wildcard, sodass PostgreSQL keinen normalen B‑Tree‑Index verwenden kann. Es prüft viele Zeilen und wird mit wachsender Tabelle vorhersehbar langsamer.

Präfixsuche kann funktionieren, aber nur wenn das Muster am Anfang verankert ist: name ILIKE 'ann%'. Dabei spielen Details eine Rolle (Collation, Case‑Handling und ob du denselben Ausdruck indexiert hast, den du abfragst). Wenn deine UI case‑insensitive sein muss, ist ein üblicher Ansatz lower(name) in der Abfrage und ein passender Index auf lower(name).

Hilfreich ist außerdem, zu vereinbaren, was „reaktionsschnell“ bedeutet:

Etwa 200 ms oder weniger für die Datenbankarbeit bei warmem Cache
Unter 1 Sekunde Ende‑zu‑Ende inklusive Netzwerk und Rendering
Kein sichtbarer Ladezustand für häufige Suchen

Mit solchen Zielen fällt die Entscheidung leichter, ob man bei exakten und Präfix‑Treffern bleibt oder ob Volltextsuche oder Trigramm‑Indizes nötig sind.

Wann Volltextsuche das richtige Werkzeug ist

Volltextsuche passt am besten, wenn Leute natürlichsprachlich tippen und erwarten, dass das System die richtigen Einträge findet — nicht nur exakte Treffer. Denke an Ticket‑Nachrichten, interne Notizen, lange Beschreibungen, Knowledge‑Base‑Artikel und Anrufprotokolle.

Der große Vorteil ist Ranking. Statt eine lange Liste zu liefern, in der das beste Ergebnis vergraben ist, kann Volltextsuche nach Relevanz sortieren. In internen Tools zählt das: Jemand braucht eine Antwort in Sekunden, nicht nach dem Durchsehen von 50 Zeilen.

Auf hoher Ebene hat Volltextsuche drei Teile:

Ein tsvector (der durchsuchbare Text, gespeichert oder generiert)
Ein tsquery (was der Nutzer eingibt, umgewandelt in eine Abfrage)
Eine Sprachkonfiguration (wie Wörter normalisiert werden)

Die Sprachkonfiguration zeigt Verhalten. PostgreSQL entfernt häufige Stoppwörter (wie „der“ oder „und“) und wendet Stemming an, sodass z. B. „pay“, „paid“ und „payment“ übereinstimmen können. Das ist großartig für Notizen und Nachrichten, kann aber überraschen, wenn jemand nach einem kurzen, häufigen Wort sucht und nichts findet.

Synonyme sind ein weiterer Punkt. Sie helfen, wenn dein Unternehmen verschiedene Wörter für dasselbe verwendet (z. B. „refund“ vs. „chargeback“), brauchen aber Pflege. Halte Synonymlisten kurz und basiere sie auf dem, was Support oder Ops wirklich eintippen.

Ein praktisches Beispiel: „can’t login after reset“ sollte Tickets finden, in denen steht „cannot log in after password reset“, auch wenn die Wortwahl abweicht. Genau dieses „relevante Finden“ ist die Stärke der Volltextsuche und meist besser, als zu versuchen, ILIKE wie eine Suchmaschine wirken zu lassen.

Wann Trigramm‑Indizes gewinnen

Datenmodell richtig aufbauen

Unterscheide Identitätsfelder von unscharfen Feldern früh, damit deine App mit wachsenden Daten schnell bleibt.

Daten modellieren

Trigramm‑Indizes sind eine starke Wahl, wenn Nutzer Fragmente tippen, Tippfehler machen oder sich nur „irgendwie daran erinnern“. Sie glänzen auf kurzen Textfeldern, wo Volltextsuche zu strikt ist: Personennamen, Firmennamen, Ticket‑Betreffe, SKUs, Bestellnummern und Produktcodes.

Ein Trigramm ist ein 3‑Zeichen‑Block. PostgreSQL vergleicht zwei Strings danach, wie viele Trigramme sie teilen. Deshalb kann es "Jon Smth" mit "John Smith" abgleichen oder "ACM" mit "ACME" finden, und es findet Treffer, wenn die Abfrage die Mitte eines Wortes ist.

Das ist oft der schnellste Weg zu einer verzeihenden „PostgreSQL search everywhere“ Box, wenn die Aufgabe „finde die richtige Zeile“ ist und nicht „finde Dokumente zu einem Thema".

Wo es die Volltextsuche schlägt

Volltextsuche ist gut für längere Texte und semantisches Ranking, aber sie handhabt nicht natürlich Teilstrings und kleine Tippfehler auf kurzen Feldern. Trigramm‑Suche ist für diese Art von Fuzziness gemacht.

Schreibkosten gering halten

Trigramm‑Indizes sind größer und verursachen Schreib‑Overhead, also sei selektiv. Indexiere nur die Spalten, die Nutzer wirklich verwenden:

Name, E‑Mail, Firma, Benutzername
Kurze Identifier (SKU, Code, Referenz)
Ein knapper Titel (keine großen Notiz‑ oder Kommentarfelder)

Wenn du genau benennen kannst, welche Felder dein Team in die Suchbox tippt, hältst du Trigramm‑Indexierung meist klein und schnell.

Partielle Indizes für die Filter, die Nutzer wirklich nutzen

Dort deployen, wo du es brauchst

Stelle dein internes Tool auf AppMaster Cloud oder in deiner AWS-, Azure- oder Google-Cloud bereit.

Jetzt bereitstellen

Eine „Search everywhere“ Box hat meist versteckte Defaults. Leute suchen innerhalb eines Workspaces, auf aktiven Objekten und ohne gelöschte Einträge. Wenn diese Filter fast bei jeder Anfrage gelten, mache den häufigen Fall schnell, indem du nur die Zeilen indizierst, die dazu passen.

Ein partieller Index ist ein normaler Index mit einer WHERE‑Klausel. PostgreSQL hält ihn kleiner, weil er nur Einträge für die für dich wichtigen Zeilen speichert. Das bedeutet oft weniger Seiten zu lesen und bessere Cache‑Trefferquoten.

Typische Ziele für partielle Indizes sind aktive Zeilen (status = 'active'), Soft‑Deletes (deleted_at IS NULL), Tenant‑Scoping und „aktuelle“ Fenster (z. B. letzte 90 Tage).

Der Schlüssel ist, dein UI‑Verhalten abzubilden. Wenn der Screen gelöschte Zeilen immer ausblendet, sollten deine Abfragen deleted_at IS NULL immer enthalten und der partielle Index dieselbe Bedingung nutzen. Kleine Abweichungen, z. B. is_deleted = false an einer Stelle und deleted_at IS NULL an einer anderen, können verhindern, dass der Planner den Index nutzt.

Partielle Indizes funktionieren auch zusammen mit Volltext und Trigramm. Zum Beispiel behält ein Text‑Index, der nur nicht‑gelöschte Zeilen abdeckt, die Indexgröße unter Kontrolle.

Trade‑off: Partielle Indizes helfen weniger bei seltenen Abfragen. Wenn jemand gelegentlich über gelöschte Datensätze oder alle Workspaces sucht, kann PostgreSQL auf einen langsameren Plan zurückfallen. Löse das über einen separaten Admin‑Pfad oder füge einen zweiten Index nur hinzu, wenn die seltene Abfrage häufiger wird.

Ansätze mischen, ohne die Suche mysteriös zu machen

Die meisten Teams mischen Techniken, weil eine Suchbox mehrere Intentionen bedienen muss. Das Ziel ist, die Reihenfolge der Operationen klar zu machen, damit Ergebnisse vorhersehbar wirken.

Eine einfache Prioritätsreihenfolge hilft, egal ob du sie als separate Abfragen implementierst oder als eine Abfrage mit klarer CASE‑Logik.

Eine vorhersehbare Prioritätsleiter

Beginne strikt und werde nur unschärfer, wenn nötig:

Exakte Übereinstimmung zuerst (IDs, E‑Mail, Ticketnummer, SKU) mit B‑Tree‑Indizes
Präfixsuche als nächstes, wo sinnvoll
Trigramm danach für Tippfehler und Fragmente in Namen und Titeln
Volltextsuche zuletzt für längere Notizen, Beschreibungen und Freitext

Wenn du dieselbe Leiter einhältst, lernen Nutzer, was die Box „bedeutet“. Sie hören auf zu denken, das System sei kaputt, wenn „12345“ ein Ticket sofort findet, während „refund policy“ länger in längeren Texten sucht.

Filter zuerst, dann Fuzziness

Unscharfe Suche wird teuer, wenn sie die ganze Tabelle betrachten muss. Verenge die Kandidatenmenge mit den Filtern, die Nutzer oft nutzen (Status, zugewiesenes Team, Datumsbereich, Konto), und führe dann Trigramm oder Volltext auf dem Rest aus. Selbst ein schneller Trigramm‑Index fühlt sich langsam an, wenn er Millionen von Zeilen bewerten muss.

Es lohnt sich auch, eine einprägsame Regel in einem Satz für nicht‑technische Kollegen zu schreiben, z. B.: „Wir matchen zuerst Ticketnummer exakt, dann Kundennamen mit Tippfehler‑Toleranz, dann Notizen.“ Diese gemeinsame Definition verhindert später Diskussionen, warum ein Ergebnis auftauchte.

Schritt‑für‑Schritt: eine Methode wählen und sicher umsetzen

Ein echtes Admin-Panel ausliefern

Erstelle ein Support- oder Ops-Admin-Panel, das Tickets, Kunden und Notizen schnell findet.

Admin-App bauen

Eine schnelle „Search everywhere“ Box ist eine Reihe kleiner Entscheidungen. Schreib sie zuerst auf, dann wird die Datenbankarbeit einfacher.

Definiere die Eingaben. Ist es nur ein Feld, oder ein Feld plus Filter (Status, Besitzer, Datumsbereich)?
Wähle Match‑Typen pro Feld. IDs/Codes brauchen exakte Treffer. Namen/E‑Mails brauchen oft Präfix oder Fuzzy. Lange Notizen und Beschreibungen besser mit natürlicher Sprachsuche.
Füge die richtigen Indizes hinzu und verifiziere, dass sie genutzt werden. Lege den Index an und prüfe deine reale Abfrage mit EXPLAIN (ANALYZE, BUFFERS).
Füge Ranking oder Sortierung hinzu, die zur Intention passt. Wenn Nutzer „invoice 1042“ tippen, sollten exakte Treffer oben stehen. Bei falsch geschriebenen Namen sollte Ähnlichkeits‑Ranking entscheiden.
Teste mit echten Abfragen. Probiere Tippfehler, sehr kurze Begriffe (z. B. „al“), lange eingefügte Texte, leere Eingabe und „nur Filter“ Modus.

Zum sicheren Ausliefern ändere jeweils nur eine Sache und halte Rollbacks einfach. Bei neuen Indizes auf großen Tabellen CREATE INDEX CONCURRENTLY bevorzugen, damit du Schreibzugriffe nicht blockierst. Wenn möglich, hinter Feature‑Flags ausrollen und Latenz vor/nach vergleichen.

Ein praktisches Muster für „PostgreSQL search everywhere“ ist: erst exakte Treffer (schnell und präzise), dann Trigramm für menschliche Felder mit Tippfehlern, und Volltext für lange Texte, die von Ranking profitieren.

Ein realistisches Beispiel: eine Suchbox im Support‑Admin‑Panel

Stell dir ein Support‑Admin‑Panel vor, in dem das Team eine Suchbox hat, die Kunden, Tickets und sogar Notizen finden soll. Das ist das klassische „ein Input, viele Bedeutungen“ Problem.

Der erste Gewinn ist, die Intention sichtbar zu machen, ohne Friktion einzuführen. Wenn die Anfrage wie eine E‑Mail oder Telefonnummer aussieht, behandle sie als Kunden‑Lookup. Wenn sie wie eine Ticket‑ID aussieht (z. B. "TKT-10482"), leite sie direkt zu Tickets. Alles andere fällt zurück auf Textsuche über Ticket‑Betreff und Notizen.

Für Kundenlookup fühlen sich Trigramm‑Indizes meist am besten an. Namen und Firmennamen sind unordentlich, und Leute tippen Fragmente. Ein Trigramm‑Index macht Suchen wie „jon smi“ oder „acm“ schnell und verzeihend.

Für Ticket‑Notizen nutze Volltextsuche. Notizen sind Sätze, und man will meist relevante Treffer, nicht nur „enthält dieses Substring“. Ranking hilft, wenn Dutzende Tickets dasselbe Stichwort enthalten.

Filter sind wichtiger, als viele Teams erwarten. Wenn Agents in „offenen Tickets“ leben, füge einen partiellen Index hinzu, der nur offene Zeilen abdeckt. Dasselbe für „aktive Kunden“. So bleiben Indizes klein und der häufige Pfad schnell.

Sehr kurze Queries verdienen Regeln, sonst macht die DB teure Arbeit für Rauschen:

1–2 Zeichen: zeige kürzlich geöffnete Tickets und kürzlich aktualisierte Kunden
3+ Zeichen: führe Trigramm für Kundenfelder und Volltext für Ticket‑Text aus
Keine klare Intention: zeige eine gemischte Liste, aber limitiere jede Gruppe (z. B. 10 Kunden und 10 Tickets)

Häufige Fehler, die Suche langsam oder verwirrend machen

Suchregeln in UI umsetzen

Entwirf Tabellen im Data Designer und verknüpfe exakte, unscharfe und Text-Suchflüsse.

Mit dem Design beginnen

Die meisten „warum ist Suche langsam?“ Bugs sind selbstverschuldet. Ziel ist nicht, alles zu indexieren, sondern das zu indexieren, was Nutzer wirklich tun.

Eine Falle ist, viele Indizes „nur für den Fall“ hinzuzufügen. Lesezugriffe können besser werden, aber jeder Insert/Update hat jetzt Mehrarbeit. In internen Tools, wo Datensätze den ganzen Tag geändert werden (Tickets, Bestellungen, Nutzer), zählt Schreibgeschwindigkeit.

Ein anderer Fehler ist, Volltextsuche zu verwenden, wenn du eigentlich fehlertolerante Lookup‑Suche auf Namen oder E‑Mails brauchst. Volltext ist toll für Dokumente und Beschreibungen. Es ist kein Allheilmittel für „Jon“ vs. „John“ oder „gmail.con“ vs. „gmail.com“. Dafür ist meist Trigramm‑Suche besser.

Filter können stillschweigend deinen Plan zerstören. Wenn die meisten Suchen mit einem festen Filter passieren (z. B. status = 'open' oder org_id = 42), ist der beste Index oft ein partieller Index mit genau dieser Bedingung. Wenn du das vergisst, scannt PostgreSQL vielleicht viel mehr Zeilen als erwartet.

Einige Fehler treten immer wieder auf:

Viele Indizes hinzufügen ohne Schreibkosten zu messen
Volltext für fehlertolerante Autocomplete‑Fälle erwarten
Ignorieren, wie häufige Filter bestimmen, welcher Index benutzt werden kann
Tests auf kleinen, sauberen Daten statt mit realer Terminfrequenz
Nach einer Spalte sortieren, ohne passenden Index, was langsame Sorts erzwingt

Beispiel: Ein Support‑Screen sucht Tickets nach Betreff, Kundenname und Ticketnummer und sortiert dann nach letzter Aktivität. Wenn latest_activity_at nicht für die gefilterte Menge indexiert ist (z. B. nur offene Tickets), kann dieser Sort die Geschwindigkeit zunichtemachen, die du durch den Suchindex gewonnen hast.

Kurze Checks vor dem Ausliefern

Deinen Stack besitzen

Behalte die volle Kontrolle mit Quellcode-Export für Self-Hosting und tiefere Anpassung.

Quellcode exportieren

Bevor du eine „search everywhere“ Funktion für fertig erklärst, werde konkret bei dem Verhalten, das du versprichst.

Suchen Leute nach einem exakten Identifier (Ticketnummer, E‑Mail)?
Erwarten sie fehlertolerante Übereinstimmungen bei Tippfehlern?
Wollen sie gerankte Ergebnisse aus längeren Notizen und Beschreibungen?

Wenn du Modi mischst, entscheide, welcher gewinnt, wenn sie kollidieren.

Identifiziere dann die 2–3 Felder, die die meisten Suchen treiben. Wenn 80% der Suchen per E‑Mail, Name und Ticket‑ID passieren, optimiere zuerst diese Felder und behandle den Rest als sekundär.

Eine kurze Pre‑Ship‑Checkliste:

Bestätige den Haupt‑Match‑Modus pro Feld (exakter Lookup, fuzzy Match oder gerankter Text)
Liste die Filter, die Nutzer täglich anwenden, und stelle sicher, dass Indizes diese Kombinationen abdecken
Entscheide, wie mit sehr kurzen und leeren Eingaben umgegangen wird (z. B. 2–3 Zeichen für fuzzy verlangen; „recent“ für leere Eingaben zeigen)
Mach die Sortierung erklärbar: zuletzt, bester Textmatch oder eine einfache kombinierte Regel

Teste schließlich mit realistischer Datengröße und Timing, nicht nur auf Korrektheit. Eine Abfrage, die bei 1.000 Zeilen sofort wirkt, kann bei 1.000.000 stark nachlassen.

Nächste Schritte: den Plan in ein schnelles internes Suchfeld verwandeln

Eine Suchbox bleibt schnell, wenn das Team sich auf ihr Verhalten einigt. Schreib die Regeln in klarer Sprache: was „match“ bedeutet (exakt, Präfix, fehlertolerant), welche Felder durchsucht werden und wie Filter das Ergebnis beeinflussen.

Behalte eine kleine Testmenge realer Suchanfragen und behandle sie wie eine Regressions‑Suite. Zehn bis zwanzig Abfragen genügen meist: ein paar gängige Namen, einige partielle E‑Mails, ein Tippfehler, ein langer Notizauszug und ein „kein Ergebnis“ Fall. Führe sie vor und nach Änderungen aus, damit Performance‑Arbeit Relevanz nicht heimlich bricht.

Wenn du interne Tools mit AppMaster (appmaster.io) baust, hilft es, diese Suchregeln zusammen mit dem Datenmodell und der Business‑Logik zu definieren, damit UI‑Verhalten und Datenbank‑Entscheidungen nicht auseinanderlaufen, wenn Anforderungen sich ändern.

FAQ

Behandle es als „finde schnell den genauen Datensatz, den ich meine“, nicht als Browsen. Schreib zuerst die wenigen echten Suchintentionen der Nutzer auf (ID-Lookup, Name/E‑Mail-Lookup mit Tippfehlern, Suche in langen Notizen) und welche Standardfilter fast immer angewendet werden. Diese Entscheidungen sagen dir, welche Abfragen du ausführen solltest und welche Indizes sich lohnen.

ILIKE '%term%' hat ein führendes Wildcard, deshalb kann PostgreSQL in der Regel keinen normalen B‑Tree‑Index verwenden und muss viele Zeilen prüfen. Das fühlt sich bei kleinen Tabellen vielleicht in Ordnung an, verlangsamt aber stark, wenn die Daten wachsen. Wenn du Substring‑ oder fehlertolerante Übereinstimmungen brauchst, plane für Trigramm‑ oder Volltext‑Suche statt darauf zu hoffen, dass ILIKE skaliert.

Verwende exakte Vergleiche wie WHERE id = $1 oder WHERE email = $1 und unterstütze sie mit einem B‑Tree (bei E‑Mails oder Codes oft unique). Exakte Lookups sind die günstigsten Suchanfragen und machen Ergebnisse außerdem vorhersehbar. Wenn Nutzer eine vollständige Ticketnummer oder E‑Mail einfügen, leite die Anfrage zuerst über diesen Pfad.

Bevorzuge ein Präfixmuster wie name ILIKE 'ann%' und indexiere dieselbe Ausdrucksform konsistent. Für zuverlässiges case‑insensitive Verhalten fragen viele Teams lower(name) ab und legen einen Index auf denselben Ausdruck an, damit der Planner ihn nutzen kann. Wenn das Muster nicht am Anfang verankert ist, reicht Präfixsuche nicht aus.

Nutze Trigramm‑Indizes, wenn Nutzer Fragmente tippen, kleine Tippfehler machen oder sich nur an „etwas Ähnliches“ erinnern — besonders auf kurzen Feldern wie Namen, Betreff, SKU oder Benutzernamen. Trigramme vergleichen 3‑Zeichen‑Chunks und sind gut geeignet, um Mittelteile eines Strings zu finden oder nahe Übereinstimmungen bei Rechtschreibfehlern zu erkennen. Sei selektiv: Trigramm‑Indizes sind größer und erhöhen die Schreibkosten.

Verwende Volltextsuche, wenn Leute ganze Sätze oder Schlüsselwörter in längeren Inhalten wie Notizen, Nachrichten, Beschreibungen oder Knowledge‑Base‑Texten suchen. Der große Vorteil ist Relevanz‑Ranking: die besten Treffer steigen an die Spitze, statt dass Nutzer lange Listen durchsuchen müssen. Achte auf sprachspezifisches Verhalten wie Stemming und Stop‑Words — gut für Prosa, aber bei sehr kurzen, häufigen Wörtern überraschend.

Füge partielle Indizes hinzu, wenn die meisten Suchanfragen dieselben Filter enthalten, z. B. deleted_at IS NULL, status = 'open' oder eine Mandanten/Workspace‑Einschränkung. Da der Index nur die relevanten Zeilen enthält, bleibt er kleiner und in realen Workloads oft schneller. Achte darauf, dass deine Abfrage exakt dieselbe Bedingung nutzt wie der partielle Index, sonst ignoriert PostgreSQL ihn.

Nutze eine konsistente Prioritätsleiter, damit Ergebnisse stabil wirken: exakte Übereinstimmung zuerst (IDs/E‑Mails), dann Präfix wo passend, danach Trigramm für verzeihliche Name/Title‑Treffer und zuletzt Volltext für lange Notizen/Beschreibungen. Wende Standardfilter früh an, um die Kandidatenmenge zu reduzieren, bevor du teure unscharfe Suchen startest. So bleiben Performance und Relevanz auch bei wachsendem Datenvolumen stabil.

Setze einfache Regeln wie: erfordere 3+ Zeichen bevor unscharfe Suche läuft, und zeige bei sehr kurzen Eingaben stattdessen kürzlich bearbeitete oder offene Datensätze. Sehr kurze Eingaben erzeugen viel Lärm und können teure Arbeit für geringen Nutzen auslösen. Entscheide außerdem, wie leere Eingaben behandelt werden, damit die UI die Datenbank nicht mit „match alles“ Abfragen bombardiert.

Lege den Index an und überprüfe dann die echte Abfrage mit EXPLAIN (ANALYZE, BUFFERS) auf realistischen Datenmengen, nicht nur im Dev‑Datensatz. Rolle Änderungen schrittweise aus und halte Rollbacks einfach; bei großen Tabellen CREATE INDEX CONCURRENTLY nutzen, um Schreibsperren zu vermeiden. Wenn du die Oberfläche in AppMaster (appmaster.io) baust, definiere die Suchregeln zusammen mit dem Datenmodell und der Business‑Logik, damit UI‑Verhalten und DB‑Entscheidungen nicht auseinanderlaufen.