19 मई 2025·8 मिनट पढ़ने में

pgvector बनाम प्रबंधित वेक्टर डेटाबेस: सार्थक खोज के लिए क्या चुनें?

pgvector बनाम Managed वेक्टर डेटाबेस — सेटअप मेहनत, स्केलिंग, फ़िल्टरिंग समर्थन और सामान्य ऐप स्टैक में फिट होने की तुलना।

pgvector बनाम प्रबंधित वेक्टर डेटाबेस: सार्थक खोज के लिए क्या चुनें?

व्यवसायिक ऐप में सार्थक खोज किस समस्या को हल करती है

सार्थक खोज सही उत्तर खोजने में मदद करती है भले ही उपयोगकर्ता सही कीवर्ड का इस्तेमाल न कर रहा हो। यह सटीक शब्दों से मेल खाने के बजाय अर्थ से मेल खाती है। कोई उपयोगकर्ता "reset my login" टाइप करे तो उसे वह आर्टिकल दिखाई देना चाहिए जिसका शीर्षक "Change your password and sign in again" है, क्योंकि इरादा वही है।

व्यवसायिक ऐप्स में कीवर्ड खोज टूट जाती है क्योंकि असली उपयोगकर्ता असंगत होते हैं। वे शॉर्टहैंड इस्तेमाल करते हैं, टाइपो करते हैं, उत्पाद नाम मिलाते हैं, और लक्षणों का वर्णन करते हैं बजाय आधिकारिक शब्दों के। FAQs, सपोर्ट टिकट, पॉलिसी डॉक्स, और ऑनबोर्डिंग गाइड में वही मुद्दा अलग-अलग तरीके से दिखता है। एक कीवर्ड इंजन अक्सर कुछ उपयोगी नहीं लौटाता, या लंबी सूची देता है जो लोगों को क्लिक-करने पर मजबूर करती है।

एम्बेडिंग्स आमतौर पर बुनियादी ईकाई होती हैं। आपका ऐप हर दस्तावेज़ (एक आर्टिकल, टिकट, प्रोडक्ट नोट) को एक वेक्टर में बदलता है — नंबरों की लंबी सूची जो अर्थ को दर्शाती है। जब उपयोगकर्ता कोई प्रश्न पूछता है, तो आप प्रश्न को भी एम्बेड करते हैं और निकटतम वेक्टर ढूँढते हैं। "वेक्टर डेटाबेस" बस वह जगह है जहाँ आप वेक्टर स्टोर करते हैं और जल्दी से सर्च कैसे करते हैं।

एक सामान्य व्यवसाय स्टैक में, सार्थक खोज चार हिस्सों को छूती है: कंटेंट स्टोर (नॉलेज बेस, डॉक्स, टिकट सिस्टम), एम्बेडिंग पाइपलाइन (इम्पोर्ट्स और कंटेंट बदलने पर अपडेट), क्वेरी एक्सपीरियंस (सर्च बॉक्स, सुझाए गए उत्तर, एजेंट असिस्ट), और गार्डरेल्स (permissions और मेटाडेटा जैसे टीम, कस्टमर, प्लान, और रीजन)।

ज़्यादातर टीमों के लिए "पर्याप्त अच्छा" परफेक्ट से बेहतर होता है। व्यावहारिक लक्ष्य पहली कोशिश पर प्रासंगिकता, एक सेकंड से कम में उत्तर, और कंटेंट बढ़ने पर लागत का भविष्यवाणी योग्य रहना है। यह लक्ष्य औजारों पर बहस करने से ज़्यादा मायने रखता है।

दो सामान्य विकल्प: pgvector और प्रबंधित वेक्टर डेटाबेस

अधिकांश टीमें सार्थक खोज के लिए दो पैटर्न में से चुनती हैं: सब कुछ PostgreSQL के अंदर रखना pgvector के साथ, या अपने मुख्य डेटाबेस के बगल में एक अलग managed vector database जोड़ना। सही चुनाव इस बात पर निर्भर करता है कि आप जटिलता कहाँ रखना चाहते हैं।

pgvector एक PostgreSQL एक्सटेंशन है जो एक वेक्टर डेटा प्रकार और इंडेक्स जोड़ता है ताकि आप embeddings को सामान्य टेबल में स्टोर कर सकें और SQL से similarity search चला सकें। प्रैक्टिस में, आपकी documents टेबल में टेक्स्ट, मेटाडेटा (customer_id, status, visibility), और एक embedding कॉलम हो सकता है। सर्च बन जाता है "प्रश्न को एम्बेड करो, फिर उन पंक्तियों को लौटाओ जिनके embeddings सबसे नज़दीक हैं।"

एक managed vector database मुख्यतः embeddings के लिए बना होस्टेड सर्विस है। यह आमतौर पर वेक्टर डालने और similarity से क्वेरी करने के लिए API देता है, साथ में ऑपरेशनल फ़ीचर जो आप खुद बनाते।

दोनों विकल्प उसी मूल काम को करते हैं: embeddings को ID और मेटाडेटा के साथ स्टोर करना, किसी प्रश्न के लिए नज़दीकी पड़ोसी ढूँढना, और टॉप मैच लौटाना ताकि आपका ऐप प्रासंगिक आइटम दिखा सके।

मुख्य अंतर system of record है। भले ही आप managed vector database का उपयोग करें, आप लगभग हमेशा PostgreSQL को बिजनेस डेटा के लिए रखते हैं: अकाउंट्स, permissions, बिलिंग, वर्कफ़्लो स्टेट, और ऑडिट लॉग। वेक्टर स्टोर retrieval लेयर बन जाता है, वह जगह नहीं जहाँ आप पूरा ऐप चलाते हैं।

एक सामान्य आर्किटेक्चर ऐसा दिखता है: authoritative record Postgres में रखें, embeddings को या तो Postgres (pgvector) में स्टोर करें या vector सर्विस में रखें, similarity search चलाकर मिलते IDs लें, फिर Postgres से फुल रोज़ फ़ेच करें।

अगर आप AppMaster जैसी प्लेटफ़ॉर्म पर ऐप बनाते हैं, PostgreSQL पहले से ही संरचित डेटा और permissions के लिए एक प्राकृतिक घर है। सवाल यह बनता है कि एम्बेडिंग सर्च वहीं रहे या एक विशेषज्ञ सर्विस में बैठकर Postgres को स्रोत-ऑफ-ट्रूथ बने रहने दें।

सेटअप मेहनत: असल में आपको क्या करना होगा

टीमें अक्सर फीचर्स के आधार पर चुनती हैं और फिर रोज़मर्रा के काम से हैरान हो जाती हैं। असली निर्णय यह है कि आप जटिलता कहाँ रखना चाहते हैं: अपने मौजूदा Postgres सेटअप के अंदर, या एक अलग सर्विस में।

pgvector के साथ, आप उसी डेटाबेस में वेक्टर सर्च जोड़ रहे हैं जिसे आप पहले से चला रहे हैं। सेटअप सामान्यतः सीधा होता है, लेकिन यह फिर भी डेटाबेस वर्क है, सिर्फ़ एप्लिकेशन कोड नहीं।

एक सामान्य pgvector सेटअप में एक्सटेंशन सक्षम करना, एक embedding कॉलम जोड़ना, अपनी क्वेरी पैटर्न से मेल खाने वाला इंडेक्स बनाना (और बाद में ट्यून करना), तय करना कि कंटेंट बदलने पर embeddings कैसे अपडेट होंगे, और similarity क्वेरीज लिखना शामिल होता है जो आपके सामान्य फ़िल्टर भी लागू करें।

एक managed vector database के साथ, आप अपने मुख्य डेटाबेस के बगल में एक नई सिस्टम बनाते हैं। इसका मतलब कम SQL हो सकता है, पर अधिक integration glue।

एक सामान्य managed सेटअप में एक इंडेक्स बनाना (डायमेंशन्स और distance metric), API कीज़ को सीक्रेट्स में जोड़ना, एक ingestion जॉब बनाना जो embeddings और मेटाडेटा पुश करे, ऐप रिकॉर्ड्स और वेक्टर रिकॉर्ड्स के बीच एक स्थिर ID मैपिंग रखना, और नेटवर्क एक्सेस लॉक करना ताकि सिर्फ़ आपका बैकएंड ही क्वेरी कर सके।

CI/CD और माइग्रेशन भी अलग होते हैं। pgvector आपके मौजूदा माइग्रेशन और रिव्यू प्रोसेस में सहजता से फिट होता है। Managed services परिवर्तन को कोड प्लस एडमिन सेटिंग्स में शिफ्ट कर देते हैं, इसलिए आपको configuration परिवर्तन और reindexing के लिए स्पष्ट प्रक्रिया चाहिए।

Ownership भी आम तौर पर चयन के अनुसार होती है। pgvector एप डेवलप और जो कोई PostgreSQL का मालिक है (कभी-कभी DBA) पर निर्भर करता है। एक managed सर्विस अक्सर प्लेटफ़ॉर्म टीम के अधीन होती है, जबकि एप डेवलपर्स ingestion और क्वेरी लॉजिक संभालते हैं। इसलिए यह निर्णय तकनीक जितना टीम संरचना के बारे में है।

फ़िल्टरिंग और permissions: निर्णायक विवरण

सार्थक खोज तभी मदद कर पाती है जब यह सम्मान करे कि उपयोगकर्ता क्या देख सकता है। असली बिज़नेस ऐप में हर रिकॉर्ड के पास embedding के किनारे मेटाडेटा होता है: org_id, user_id, role, status (open, closed), और visibility (public, internal, private)। अगर आपका सर्च लेयर उस मेटाडेटा पर साफ़-सुथरा फ़िल्टर नहीं लगा सकता, तो आपको भ्रमित परिणाम मिलेंगे या, उससे खराब, डेटा लीक होगा।

सबसे बड़ा व्यावहारिक अंतर वेक्टर सर्च से पहले बनाम बाद में फ़िल्टरिंग है। बाद में फ़िल्टर करना सरल लगता है (सब कुछ सर्च करो, फिर मनाही पंक्तियाँ हटा दो), लेकिन यह दो सामान्य तरीकों से फेल करता है। पहले, सबसे अच्छे मैच हट सकते हैं जिससे खराब परिणाम बचते हैं। दूसरे, अगर पाइपलाइन का कोई हिस्सा अनफ़िल्टर्ड परिणाम लॉग, कैश, या एक्सपोज़ करता है तो यह सुरक्षा जोखिम बढ़ाता है।

pgvector के साथ वेक्टर PostgreSQL में मेटाडेटा के साथ रहते हैं, इसलिए आप वही SQL क्वेरी में permissions लागू कर सकते हैं और PostgreSQL को उन्हें लागू करने दे सकते हैं।

PostgreSQL: permissions और joins स्थानीय हैं

अगर आपका ऐप पहले से Postgres इस्तेमाल करता है, तो pgvector अक्सर सादगी में जीतता है: सर्च "बस एक और क्वेरी" हो सकती है। आप tickets, customers, और memberships पर जॉइन कर सकते हैं, और Row Level Security का उपयोग कर सकते हैं ताकि डेटाबेस ही अनधिकृत पंक्तियों को ब्लॉक करे।

एक सामान्य पैटर्न है कि उम्मीदवार सेट को org और status फ़िल्टर से संकुचित करें, फिर उसी पर वेक्टर similarity चलाएँ, और वैकल्पिक रूप से exact identifiers के लिए keyword matching मिलाएँ।

Managed vector DB: फ़िल्टरों का तरीका अलग हो सकता है, permissions ज्यादातर आपकी ज़िम्मेदारी

अधिकांश managed vector databases मेटाडेटा फ़िल्टर का समर्थन करते हैं, पर फ़िल्टर भाषा सीमित हो सकती है, और joins नहीं होते। आमतौर पर आप मेटाडेटा को हर वेक्टर रिकॉर्ड में डेनॉर्मलाइज़ करते हैं और permission जाँच एप्लिकेशन में फिर से लागू करते हैं।

व्यवसायिक ऐप्स में हाइब्रिड सर्च के लिए आप अक्सर इन्हें एक साथ काम करना चाहते हैं: हार्ड फ़िल्टर (org, role, status, visibility), keyword मैच (इन्क्रेडिबल आइडेंटिफ़ायर जैसे invoice नंबर), वेक्टर similarity (अर्थ), और रैंकिंग नियम (हालिया या खुले आइटम को बूस्ट करना)।

उदाहरण: AppMaster पर बना एक सपोर्ट पोर्टल टिकट्स और permissions PostgreSQL में रख सकता है, जिससे "एजेंट केवल अपनी org के टिकट देखे" लागू करना सरल होता है और फिर भी टिकट सारांश और रिप्लाई पर सार्थक मैच मिलते हैं।

सर्च क्वालिटी और प्रदर्शन के बुनियादी सिद्धांत

Choose your deployment
Deploy to AppMaster Cloud, AWS, Azure, Google Cloud, or export for self-hosting.
Deploy Now

सर्च क्वालिटी relevance (क्या परिणाम वास्तव में उपयोगी हैं?) और speed (क्या यह तात्कालिक लगता है?) का मिश्रण है। दोनों pgvector और managed vector डेटाबेस में, आप आमतौर पर approximate search के जरिए थोड़ी relevance की सियाहत करते हैं ताकि latency कम रहे। यह व्यापारिक ऐप्स के लिए अक्सर स्वीकार्य होता है, बशर्ते आप इसे असली क्वेरीज से मापें।

ऊपर से देखने पर, आप तीन चीज़ें ट्यून करते हैं: embedding मॉडल ("अर्थ" कैसा दिखता है), इंडेक्स सेटिंग्स (इंजन कितनी मेहनत से सर्च करता है), और रैंकिंग लेयर (जब आप फ़िल्टर, ताज़गी, या लोकप्रियता जोड़ते हैं तो परिणाम कैसे ऑर्डर होते हैं)।

PostgreSQL में pgvector के साथ, आप आमतौर पर IVFFlat या HNSW जैसे इंडेक्स चुनते हैं। IVFFlat तेज़ और हल्का बनता है, लेकिन आपको कितने "लिस्ट" उपयोग कर रहे हैं यह ट्यून करना होगा और आमतौर पर पर्याप्त डेटा चाहिए ताकि यह चमके। HNSW अक्सर कम latency पर बेहतर recall देता है, पर यह अधिक मेमोरी उपयोग कर सकता है और बनाने में समय ले सकता है। Managed सिस्टम्स समान विकल्प एक्सपोज़ करते हैं, बस अलग नाम और डिफ़ॉल्ट्स के साथ।

कुछ रणनीतियाँ अपेक्षा से ज़्यादा मायने रखती हैं: लोकप्रिय क्वेरीज को cache करें, जहाँ हो बैचिंग करें (उदाहरण के लिए अगला पेज प्रीफ़ेच करें), और एक दो-स्टेज फ़्लो पर विचार करें जहां आप तेज़ वेक्टर सर्च कर के टॉप 20-100 को बिजनेस सिग्नलों (जैसे ताज़गी या कस्टमर टियर) से फिर से रैंक करें। नेटवर्क हॉप्स पर भी नज़र रखें। अगर सर्च अलग सर्विस में है तो हर क्वेरी एक और राउंड ट्रिप होती है।

क्वालिटी को मापने के लिए छोटे और ठोस से शुरू करें। 20 से 50 असली उपयोगकर्ता प्रश्न इकट्ठा करें, परिभाषित करें कि "अच्छा" उत्तर क्या है, और ट्रैक करें टॉप 3 और टॉप 10 हिट रेट, मीडियन और p95 लेटेंसी, कितने प्रश्नों का कोई अच्छा परिणाम नहीं आया, और फ़िल्टर लागू होने पर क्वालिटी कितनी गिरती है।

यहीं पर चुनाव सैद्धांतिक से वास्तविक बन जाता है। सबसे अच्छा विकल्प वही है जो आपके relevance लक्ष्य को उस latency पर पूरा करे जिसे उपयोगकर्ता सहन करते हैं, और जिसे आप रख-रखाव कर सकें।

स्केलिंग चिंताएँ और चल रही ऑपरेशंस

कई टीमें pgvector से शुरू करती हैं क्योंकि यह सब कुछ एक जगह रखता है: ऐप डेटा और embeddings। कई व्यवसायिक ऐप्स के लिए एकल PostgreSQL नोड ही काफी होता है, खासकर अगर आपके पास दसियों से कुछ लाख तक वेक्टर हों और सर्च प्रमुख ट्रैफ़िक ड्राइवर न हो।

सीमाएँ तब आती हैं जब सार्थक खोज एक मुख्य उपयोगकर्ता क्रिया बन जाती है (अधिकतर पन्नों पर, हर टिकट में, चैट में), या जब आप मिलियन में वेक्टर स्टोर करते हैं और पीक घंटों में कड़े प्रतिक्रिया समय चाहिए होते हैं।

एकल Postgres सेटअप पर दबाव के सामान्य संकेतों में शामिल हैं: सामान्य लेखन गतिविधि के दौरान p95 सर्च लेटेंसी का कूदना, तेज़ इंडेक्स और स्वीकार्य write speed के बीच चुनाव करना, मेंटेनेंस कार्यों का "रात में शेड्यूल" बन जाना, और खोज के लिए अलग स्केलिंग की ज़रूरत होना।

pgvector के साथ, स्केलिंग अक्सर क्वेरी लोड के लिए read replicas जोड़ने, टेबल पार्टिशनिंग, इंडेक्स ट्यूनिंग, और इंडेक्स बिल्ड्स व स्टोरेज ग्रोथ के आसपास योजना बनाने का मतलब होता है। यह किया जा सकता है, पर यह लगातार काम बन जाता है। आपको डिज़ाइन चुनावों का भी सामना करना पड़ता है जैसे embeddings को बिजनेस डेटा वाली ही टेबल में रखना बनाम अलग करना ताकि bloat और lock contention कम हो।

Managed vector databases इस काम का बड़ा हिस्सा वेंडर को शिफ्ट कर देते हैं। वे अक्सर compute और storage का स्वतंत्र स्केलिंग, बिल्ट-इन शार्डिंग, और सरल हाई अवेलेबिलिटी ऑफर करते हैं। व्यापार यह है कि आपको दो सिस्टम्स (Postgres + vector स्टोर) चलाने और मेटाडेटा व permissions को सिंक में रखने होंगे।

लागत टीमों को प्रदर्शन से ज़्यादा चौंकाती है। बड़े ड्राइवर हैं स्टोरेज (वेक्टर और इंडेक्स तेज़ी से बढ़ते हैं), पीक क्वेरी वॉल्यूम (अकसर बिल सेट करता है), अपडेट फ़्रीक्वेंसी (re-embedding और upserts), और डेटा मूवमेंट (जब आपका ऐप भारी फ़िल्टरिंग कर के अतिरिक्त कॉल करता है)।

अगर आप pgvector और managed सेवा के बीच निर्णय कर रहे हैं, तो तय करें कि आप किस दर्द को पसंद करेंगे: गहरी Postgres ट्यूनिंग और क्षमता योजना, या अधिक भुगतान करके आसान स्केलिंग पर दूसरा निर्भरता संभालना।

सुरक्षा, अनुपालन, और विश्वसनीयता के प्रश्न

Build the search API
Create secure backend endpoints and a search UI without starting from scratch.
Start Building

सुरक्षा विवरण अक्सर स्पीड बेंचमार्क से तेज़ निर्णय लेते हैं। जल्दी पूछें कि डेटा कहाँ रहेगा, कौन उसे देख सकता है, और outage के दौरान क्या होगा।

शुरुआत डेटा रेजिडेंसी और एक्सेस से करें। एम्बेडिंग्स भी अर्थ लीक कर सकती हैं, और कई टीमें हाइलाइटिंग के लिए कच्चे स्निपेट भी स्टोर करती हैं। स्पष्ट करें कि कौन सा सिस्टम कच्चा टेक्स्ट रखेगा (टिकट्स, नोट्स, दस्तावेज़) बनाम केवल embeddings। यह भी तय करें कि किसे कंपनी के अंदर सीधे स्टोर क्वेरी करने की अनुमति है और क्या आपको प्रोडक्शन और एनालिटिक्स एक्सेस के बीच कड़ी अलगाव चाहिए।

बिल्ड करने से पहले पुष्टि करने के लिए कंट्रोल्स

नीचे प्रश्न दोनों विकल्पों के लिए पूछें:

  • डेटा आराम पर और ट्रांज़िट में कैसे एन्क्रिप्ट होता है, और क्या आप अपनी चाबियाँ मैनेज कर सकते हैं?
  • बैकअप प्लान क्या है, कितनी बार restores टेस्ट होते हैं, और आपका recovery time टारगेट क्या होना चाहिए?
  • क्या आपको reads और writes के लिए audit logs मिलते हैं, और क्या आप असामान्य क्वेरी वॉल्यूम पर अलर्ट कर सकते हैं?
  • आप multi-tenant अलगाव कैसे लागू करते हैं: अलग डाटाबेस, अलग स्कीमा, या row-level नियम?
  • हटाए गए कंटेंट के लिए retention policy क्या है, जिसमें embeddings और कैश शामिल हैं?

मल्टी-टेनेंट अलगाव वह बात है जो लोगों को फँसाती है। अगर किसी एक ग्राहक का प्रभाव दूसरे पर बिलकुल नहीं होना चाहिए, तो आपको हर क्वेरी में मजबूत tenant scoping चाहिए। PostgreSQL के साथ यह Row Level Security और सावधान क्वेरी पैटर्न से लागू किया जा सकता है। Managed vector database में आप सामान्यतः namespaces या collections और एप्लिकेशन लॉजिक पर निर्भर करते हैं।

विश्वसनीयता और फेलियर मोड

सर्च डाउनटाइम की योजना बनाएं। अगर वेक्टर स्टोर डाउन है तो उपयोगकर्ताओं को क्या दिखाई देगा? सुरक्षित डिफ़ॉल्ट यह है कि keyword search पर fallback करें, या सिर्फ हालिया आइटम दिखाएँ, बजाय पेज को ब्रेक होने के।

उदाहरण: AppMaster में बने एक सपोर्ट पोर्टल में आप टिकट्स PostgreSQL में रख सकते हैं और सार्थक खोज को एक वैकल्पिक फीचर मान सकते हैं। अगर embeddings लोड नहीं होते, तो पोर्टल अभी भी टिकट सूची दिखा सकता है और जब प्रश्न बहुत specific हो तो exact keyword search की अनुमति दे सकता है जब तक आप vector सर्विस recover कर लें।

चरण-दर-चरण: कम-जोखिम पायलट के साथ चुनने का तरीका

Ship web and mobile
Build backend, web UI, and native mobile apps around your search feature.
Create App

सबसे सुरक्षित तरीका एक छोटा पायलट चलाना है जो आपकी असली ऐप जैसा दिखे, ना कि कोई डेमो नोटबुक।

सबसे पहले लिखें कि आप क्या सर्च कर रहे हैं और किन चीज़ों को फ़िल्टर करना अनिवार्य है। "हमारी डॉक्स खोजें" वाग़्फ़ है। "हेल्प आर्टिकल्स, टिकट रिप्लाई, और PDF मैन्युअल खोजें, पर केवल वही आइटम दिखाएँ जो उपयोगकर्ता देख सकता है" असली आवश्यकता है। Permissions, tenant ID, भाषा, प्रोडक्ट एरिया, और "केवल प्रकाशित सामग्री" फ़िल्टर अक्सर विजेता तय करते हैं।

फिर एक एम्बेडिंग मॉडल और refresh प्लान चुनें। तय करें क्या एम्बेड होगा (पूरा दस्तावेज़, chunks, या दोनों) और कितनी बार अपडेट होगा (हर एडिट पर, रात में, या पब्लिश पर)। अगर कंटेंट अक्सर बदलता है तो re-embedding कितना परेशान करेगा इसे मापें, सिर्फ़ क्वेरी कितनी तेज़ है यह नहीं।

फिर अपने बैकएंड में एक पतला search API बनाएं। इसे साधारण रखें: एक endpoint जो क्वेरी और फ़िल्टर फील्ड लेता है, टॉप परिणाम लौटाता है, और जो हुआ उसे लॉग करता है। AppMaster पर बिल्ड कर रहे हैं तो आप ingestion और update फ्लो को एक बैकएंड सर्विस और Business Process के रूप में लागू कर सकते हैं जो आपके embedding provider को कॉल करे, वेक्टर्स और मेटाडेटा लिखे, और access rules लागू करे।

दो हफ्ते का पायलट असली उपयोगकर्ताओं और असली टास्क के साथ चलाएँ। कुछ सामान्य प्रश्नों का उपयोग करें, "मिला जवाब" दर और पहला उपयोगी परिणाम मिलने का समय ट्रैक करें, हर सप्ताह खराब परिणाम की समीक्षा करें, re-embedding व क्वेरी लोड पर नज़र रखें, और ऐसे failure मोड टेस्ट करें जैसे गायब मेटाडेटा या स्टेल वेक्टर।

अंत में साक्ष्य के आधार पर फैसला करें। अगर pgvector गुणवत्ता और फ़िल्टरिंग जरूरतें स्वीकार्य ऑप्स काम के साथ पूरा करता है तो रखें। अगर स्केलिंग और विश्वसनीयता प्रमुख हैं तो managed पर जाएँ। या एक हाइब्रिड सेटअप चलाएँ (PostgreSQL मेटाडेटा और permissions के लिए, vector स्टोर retrieval के लिए) अगर वह आपके स्टैक में फिट बैठता है।

सामान्य गलतियाँ जिनमें टीमें फँसती हैं

अधिकांश गलतियाँ पहले डेमो काम करने के बाद सामने आती हैं। एक जल्दी proof of concept शानदार दिख सकता है, फिर असली उपयोगकर्ताओं, असली डेटा, और असली नियमों के साथ यह ढीला पड़ सकता है।

सबसे आम कारण निम्न हैं:

  • यह धारण करना कि वेक्टर access control संभाल लेंगे। Similarity search नहीं जानता कि किसे क्या देखने की अनुमति है। अगर आपके ऐप में roles, teams, tenants, या private notes हैं, तो आपको अभी भी सख्त permission फ़िल्टर और टेस्ट चाहिए ताकि खोज कभी restricted कंटेंट न लीक करे।
  • "फील्स गुड" डेमो पर भरोसा करना। कुछ चुने हुए क्वेरीज़ मूल्यांकन नहीं हैं। बिना छोटे लेबल वाले प्रश्नों और अपेक्षित परिणामों के सेट के, जब आप chunking, embeddings, या इंडेक्स बदलते हैं तो regressions पकड़ना मुश्किल होगा।
  • पूरा दस्तावेज़ एक ही वेक्टर में एम्बेड करना। बड़े पन्ने, टिकट्स, और PDFs आमतौर पर chunking चाहते हैं। बिना chunks के परिणाम अस्पष्ट होते हैं। बिना वर्जनिंग के आप यह भी नहीं बता पाएँगे कि कौन सा एम्बेडिंग किस revision से मेल खाता है।
  • अपडेट्स और डिलीट्स की अनदेखी। असली ऐप्स कंटेंट एडिट और हटा देते हैं। अगर आप अपडेट पर re-embed नहीं करते और delete पर क्लीनअप नहीं करते, तो आप स्टेल मैच सर्व करेंगे जो गायब या आउटडेटेड टेक्स्ट की ओर इशारा करते हैं।
  • UX न पक्की कर के प्रदर्शन पर ओवर-ट्यून करना। टीमें अक्सर इंडेक्स सेटिंग्स पर दिन बिताती हैं जबकि बुनियादी बातें छोड़ देती हैं जैसे मेटाडेटा फ़िल्टर, अच्छे स्निपेट, और जब क्वेरी बहुत specific हो तो keyword fallback।

एक सरल "day-2" टेस्ट इन्हें जल्दी पकड़ लेता है: एक नया permission नियम जोड़ें, 20 आइटम अपडेट करें, 5 हटाएँ, फिर वही 10 मूल्यांकन प्रश्न दोहराएँ। अगर आप AppMaster जैसे प्लेटफ़ॉर्म पर बना रहे हैं, तो इन चेक्स को अपने बिजनेस लॉजिक और डेटाबेस मॉडल के साथ योजना बनाएं, बैकबर्न करने के लिए नहीं।

उदाहरण परिदृश्य: सपोर्ट पोर्टल में सार्थक खोज

Turn docs into answers
Set up an embedding pipeline using AppMaster business processes and AI integrations.
Get Started

एक मिड-साइज़ SaaS कंपनी के पास एक सपोर्ट पोर्टल है जिसमें दो मुख्य कंटेंट प्रकार हैं: ग्राहक टिकट और हेल्प सेंटर आर्टिकल्स। वे चाहते हैं कि सर्च बॉक्स अर्थ समझे, ताकि "can’t log in after changing phone" टाइप करने पर सही आर्टिकल और समान पिछले टिकट्स दिखाई दें।

नॉन-नेगोशिएबल्स व्यावहारिक हैं: हर ग्राहक केवल अपने टिकट ही देखे, एजेंट्स को status (open, pending, solved) से फ़िल्टर करने की ज़रूरत, और परिणाम तात्कालिक लगें क्योंकि सुझाव टाइप करते समय दिखते हैं।

विकल्प A: वही PostgreSQL में pgvector

अगर पोर्टल पहले से tickets और articles PostgreSQL में स्टोर करता है (सामान्य जब आप AppMaster जैसे स्टैक पर बनाते हैं), तो pgvector जोड़ना एक क्लीन पहला कदम हो सकता है। आप embeddings, मेटाडेटा, और permissions एक ही जगह रखते हैं, इसलिए "केवल customer_123 के टिकट" बस एक सामान्य WHERE क्लॉज़ है।

यह तब अच्छा काम करता है जब आपका dataset मध्यम है (दसियों या सैकड़ों हज़ार आइटम), आपकी टीम Postgres इंडेक्स और क्वेरी प्लान ट्यून करने में सहज है, और आप कम मूविंग पार्ट्स और सरल एक्सेस कंट्रोल चाहते हैं।

ट्रेडऑफ यह है कि वेक्टर सर्च transactional वर्कलोड के साथ प्रतिस्पर्धा कर सकती है। उपयोग बढ़ने पर आपको अतिरिक्त क्षमता, सावधानीपूर्वक इंडेक्सिंग, या यहां तक कि टिकट्स लिखने और SLA को सुरक्षित करने के लिए अलग Postgres इंस्टेंस की ज़रूरत पड़ सकती है।

विकल्प B: embeddings के लिए managed vector DB, मेटाडेटा के लिए PostgreSQL

Managed vector database के साथ आप आमतौर पर embeddings और एक ID वहाँ स्टोर करते हैं, और "सच" (ticket status, customer_id, permissions) PostgreSQL में रखते हैं। व्यवहार में, टीमें या तो पहले Postgres में फ़िल्टर कर योग्य IDs लेती हैं और फिर वेक्टर खोज करती हैं, या पहले सर्च करती हैं और परिणाम दिखाने से पहले permissions फिर से जाँचती हैं।

यह विकल्प तब जीतता है जब विकास अनिश्चित है या टीम प्रदर्शन की देखभाल नहीं करना चाहती। पर permission flow पर असली ध्यान चाहिए, वरना आप ग्राहकों के बीच परिणाम लीक करने का जोखिम उठाते हैं।

एक व्यावहारिक निर्णय यह है कि अभी tight filtering और सरल ऑप्स चाहिए तो pgvector से शुरू करें, और अगर आप तेज़ वृद्धि, भारी क्वेरी वॉल्यूम की उम्मीद करते हैं या नहीं चाहते कि सर्च आपके मुख्य डेटाबेस को धीमा करे तो managed में जाएँ।

त्वरित चेकलिस्ट और अगले कदम

अगर आप अटक गए हैं, तो बहस बंद करें और लिखें कि आपका ऐप पहले दिन क्या करना चाहिए। असली आवश्यकताएँ अक्सर एक छोटे पायलट के दौरान दिखाई देती हैं।

ये प्रश्न अक्सर विजेता तय कर देते हैं बेंचमार्क से ज़्यादा:

  • कौन से फ़िल्टर अनिवार्य हैं (tenant, role, region, status, time range)?
  • 6 से 12 महीने में इंडेक्स कितना बड़ा होगा (आइटम और embeddings)?
  • पीक पर क्या लेटेंसी तात्कालिक लगती है?
  • बजट और ऑन-काल ज़िम्मेदारी कौन संभालेगा?
  • स्रोत-ऑफ-ट्रूथ कहाँ होना चाहिए: PostgreSQL टेबल या बाहरी इंडेक्स?

बदलाव के लिए भी योजना बनाएं। embeddings "सेट और भूलो" नहीं होते। टेक्स्ट बदलता है, मॉडल बदलते हैं, और प्रासंगिकता तब तक drift होती रहती है जब तक कोई शिकायत न करे। पहले से तय करें कि आप अपडेट कैसे संभालेंगे, drift कैसे पाएँगे, और क्या मॉनिटर करेंगे (क्वेरी लेटेंसी, error rate, छोटे टेस्ट सेट पर recall, और "कोई परिणाम नहीं" सर्च)।

यदि आप सर्च के चारों ओर पूरा व्यावसायिक ऐप जल्दी बनाना चाहते हैं, तो AppMaster (appmaster.io) एक व्यावहारिक फिट हो सकता है: यह आपको PostgreSQL डेटा मॉडलिंग, बैकएंड लॉजिक, और वेब या मोबाइल UI एक no-code वर्कफ़्लो में देता है, और आप कोर ऐप और permissions के बनने के बाद सार्थक खोज जोड़ सकते हैं।

सामान्य प्रश्न

What does semantic search actually solve compared to keyword search?

सार्थक खोज तब भी उपयोगी परिणाम लौटाती है जब उपयोगकर्ता के शब्द दस्तावेज़ के सही शब्दों से मेल नहीं खाते। यह तब खासकर काम आता है जब लोग टाइपो करते हैं, शॉर्टहैंड इस्तेमाल करते हैं, या लक्षणों का वर्णन करते हैं बजाय आधिकारिक शब्दों के — जो कि सपोर्ट पोर्टल, आंतरिक टूल और नॉलेज बेस में सामान्य है।

When is pgvector the better choice?

जब आप कम घटकों के साथ रखना चाहते हैं, SQL-आधारित फ़िल्टरिंग चाहिए, और आपका डेटा/ट्रैफ़िक अभी मध्यम स्तर पर है, तो pgvector बेहतर विकल्प होता है। यह अक्सर सबसे तेज़ रास्ता होता है अगर आप एक सुरक्षित, permission-aware खोज चाहते हैं क्योंकि वेक्टर और मेटाडेटा एक ही PostgreSQL क्वेरी में रहते हैं।

When should I consider a managed vector database instead?

Managed vector database तब उपयुक्त है जब आप वेक्टर या क्वेरी वॉल्यूम में तेजी से वृद्धि की उम्मीद करते हैं, या आप चाहते हैं कि स्केलिंग और उपलब्धता आपके मुख्य डेटाबेस के बाहर मैनेज हो। आप सरल संचालन के बदले अतिरिक्त इंटीग्रेशन काम और सावधानीपूर्वक permission हैंडलिंग का व्यापार कर रहे होते हैं।

What are embeddings and why do I need a vector store?

एम्बेडिंग वह प्रक्रिया है जिसमें टेक्स्ट को एक संख्यात्मक वेक्टर में बदला जाता है जो अर्थ को दर्शाता है। एक वेक्टर डेटाबेस (या PostgreSQL में pgvector) उन वेक्टरों को स्टोर करता है और उपयोगकर्ता के एम्बेड किए गए प्रश्न के निकटतम वेक्टर तेज़ी से ढूँढ सकता है — इसी से “इंटेंट के आधार पर समान” परिणाम मिलते हैं।

Why is “filtering after search” a bad idea in multi-tenant apps?

सर्च के बाद फ़िल्टर करने से अक्सर सर्वश्रेष्ठ मेल हट जाते हैं और उपयोगकर्ताओं को खराब परिणाम या खाली पृष्ठ मिल सकता है। यह लॉग, कैश या डिबगिंग में अनफ़िल्टर्ड परिणाम के एक्सपोज़र का जोखिम भी बढ़ाता है। इसलिए मल्टी-टेनेंट ऐप्स में tenant और role फ़िल्टर जितना संभव हो जल्दी लागू करना सुरक्षित होता है।

How does pgvector handle permissions and access control?

pgvector के साथ आप उसी SQL क्वेरी में permissions, joins और Row Level Security लागू कर सकते हैं जो similarity search करती है। इससे “कभी भी प्रतिबंधित पंक्तियाँ न दिखाने” की गारंटी आसान हो जाती है क्योंकि PostgreSQL वहीं उस नियम को लागू करता है जहाँ डाटा रहता है।

How do permissions work with a managed vector database?

अधिकांश managed vector databases मेटाडेटा फ़िल्टर का समर्थन करते हैं, लेकिन वे आमतौर पर joins सपोर्ट नहीं करते और फ़िल्टर भाषा सीमित हो सकती है। अक्सर आप permission-संबंधित मेटाडेटा को हर वेक्टर रिकॉर्ड में डेनॉर्मलाइज़ करते हैं और अंतिम authorization जाँच एप्लिकेशन में करते हैं।

Do I need to chunk documents, or can I embed whole pages?

Chunking का मतलब बड़े दस्तावेज़ों को छोटे हिस्सों में बांटना है पहले एम्बेड करने से। यह सामान्यतः सटीकता बढ़ाता है क्योंकि हर वेक्टर एक केन्द्रित विचार का प्रतिनिधित्व करता है। छोटे आइटमों के लिए पूरा-दस्तावेज़ एम्बेडिंग काम कर सकता है, लेकिन लंबी टिकट, नीतियाँ और PDF बिना chunking के अस्पष्ट परिणाम देते हैं।

How do I handle updates and deletes without serving stale results?

दिन एक से ही अपडेट की योजना बनाएं: अक्सर बदलने वाली सामग्री के लिए पब्लिश या एडिट पर पुनः एम्बेड करें, और स्रोत रिकॉर्ड हटाने पर वेक्टर हटाएँ। अगर आप इसे छोड़ देते हैं तो आप स्टेल परिणाम सर्व करेंगे जो पुरानी या गायब सामग्री की ओर इशारा करते हैं।

What’s the safest way to choose between pgvector and a managed service?

सबसे सुरक्षित तरीका एक व्यावहारिक पायलट है जो वास्तविक क्वेरी और सख्त फ़िल्टर उपयोग करे, प्रासंगिकता और लेटेंसी मापे, और गलत मामलों (जैसे गायब मेटाडेटा या स्टेल वेक्टर) का परीक्षण करे। उस विकल्प को चुनें जो permission नियमों के तहत विश्वसनीय रूप से अच्छे शीर्ष परिणाम लौटाए और जिसकी लागत व ऑपरेशनल ज़िम्मेदारी आपकी टीम संभाल सके।

शुरू करना आसान
कुछ बनाएं अद्भुत

फ्री प्लान के साथ ऐपमास्टर के साथ प्रयोग करें।
जब आप तैयार होंगे तब आप उचित सदस्यता चुन सकते हैं।

शुरू हो जाओ