दो टेक्स्ट स्ट्रिंग्स पास करें और उनके बीच समानता प्रतिशत प्राप्त करें
प्लेगरिज्म पहचान: शैक्षणिक संस्थान और सामग्री प्रकाशक API का उपयोग छात्र सबमिशन या प्रकाशित लेखों की तुलना करने के लिए कर सकते हैं मौजूदा दस्तावेजों के साथ उच्च समानता स्कोर का पता लगाकर यह संभावित प्लेगरिज्म या डुप्लिकेट सामग्री के मामलों की पहचान कर सकता है
सामग्री अनुशंसा: ई-कॉमर्स प्लेटफार्मों स्ट्रीमिंग सेवाओं और समाचार वेबसाइटों को समान उत्पादों फिल्में या लेखों की अनुशंसा करके उपयोगकर्ता अनुभव को बढ़ा सकते हैं API उपयोगकर्ता प्राथमिकताओं का विश्लेषण कर सकता है और उनके पिछले चुनावों के लिए उच्च समानता स्कोर वाले आइटम सुझा सकता है
ग्राहक सेवा चैटबॉट: ग्राहक सहायता प्रणालियाँ API का उपयोग चैटबॉट प्रतिक्रिया में सुधार के लिए कर सकती हैं ग्राहक प्रश्नों और अक्सर पूछे जाने वाले प्रश्न या पिछले इंटरैक्शन के डेटाबेस के बीच समानता का विश्लेषण करके चैटबॉट अधिक सटीक और प्रासंगिक उत्तर प्रदान कर सकता है
दस्तावेज़ क्लस्टरिंग और संगठन: बड़ी मात्रा में दस्तावेजों से निपटने वाले संगठनों जैसे कानूनी फर्म या अनुसंधान संस्थान API का उपयोग सामग्री समानता के आधार पर दस्तावेजों को क्लस्टर और श्रेणीबद्ध करने के लिए कर सकते हैं यह कुशल दस्तावेज प्रबंधन और वसूली में सहायता करता है
सर्च इंजन संवर्धन: सर्च इंजन API का लाभ उठाकर खोज परिणामों में सुधार कर सकते हैं उपयोगकर्ता प्रश्नों और अनुक्रमित पृष्ठों के बीच समानता की तुलना करके API सबसे प्रासंगिक परिणामों को रैंक और प्रदर्शित कर सकता है जिससे उपयोगकर्ताओं के लिए समग्र खोज अनुभव में सुधार होता है
API कॉल की संख्या के अलावा कोई अन्य सीमा नहीं है
{"similarity": 0.8126154541969299}
curl --location --request POST 'https://zylalabs.com/api/4499/content+similarity+analysis+api/5520/check+similarity' --header 'Authorization: Bearer YOUR_API_KEY'
--data-raw '{"text_1": "This is an example sentence.",
"text_2": "This is just another example sentence."}'
| हेडर | विवरण |
|---|---|
Authorization
|
[आवश्यक] होना चाहिए Bearer access_key. जब आप सब्सक्राइब हों तो ऊपर "Your API Access Key" देखें। |
कोई लंबी अवधि की प्रतिबद्धता नहीं। कभी भी अपग्रेड, डाउनग्रेड या कैंसल करें। फ्री ट्रायल में 50 रिक्वेस्ट तक शामिल हैं।
एपीआई यूटीएफ-8 प्रारूप में साधारण पाठ इनपुट स्वीकार करता है छोटे वाक्यांशों और लंबे पैराग्राफ दोनों को संसाधित किया जा सकता है जिससे विभिन्न अनुप्रयोगों में लचीले उपयोग की अनुमति मिलती है
यह एपीआई उन्नत एनएलपी मॉडल का उपयोग करके पाठ को 768-आयामी वेक्टर में एम्बेड करता है और फिर इन वेक्टरों के बीच कोसाइन समानता की गणना करता है ताकि एक समानता स्कोर उत्पन्न हो सके जो -1 से 1 के बीच होता है जहां 1 समान पाठ को इंगीत करता है
एपीआई अत्याधुनिक ट्रांसफार्मर-आधारित मॉडलों का उपयोग करता है जैसे कि बीईआरटी या इसके प्रकार पाठों को एम्बेड करने के लिए ये मॉडल बड़े निगमों पर पूर्व-प्रशिक्षित होते हैं और अर्थ की सटीकता को पकड़ने के लिए उच्च सटीकता के लिए फाइन-ट्यून किए जाते हैं
एपीआई को कम विलंबता के लिए ऑप्टिमाइज़ किया गया है आमतौर पर मानक अनुरोधों के लिए कुछ सौ मिलीसेकंड के भीतर प्रतिक्रिया करता है प्रदर्शन इनपुट पाठों की लंबाई और जटिलता के आधार पर भिन्न हो सकता है
हाँ, एपीआई कई भाषाओं का समर्थन करता है, बशर्ते कि अंतर्निहित एम्बेडिंग मॉडल का प्रशिक्षण बहुभाषीय डेटा पर किया गया हो। इससे विभिन्न भाषाओं के बीच सटीक समानता गणनाओं की अनुमति मिलती है
जांच समानता एंडपॉइंट एक JSON ऑब्जेक्ट लौटाता है जिसमें एकल कुंजी "समानता" होती है जो दो इनपुट लेखों के बीच समानता स्कोर का प्रतिनिधित्व करती है स्कोर 0 से 1 के बीच होता है जहां 1 समान सामग्री को इंगित करता है और 0 कोई समानता नहीं इंगित करता है
प्रतिक्रिया डेटा में "समानता" क्षेत्र शामिल है जो एक फ्लोटिंग-पॉइंट संख्या है यह मान प्रदान किए गए दो पाठ इनपुट के बीच समानता के स्तर को मापता है
उपयोगकर्ता अपने अनुरोधों को दो पाठ पैरामीटर `text_1` और `text_2` प्रदान करके अनुकूलित कर सकते हैं जिनकी अधिकतम लंबाई 5000 अक्षर है यह विशेष सामग्री विश्लेषण की आवश्यकताओं के आधार पर लचीला इनपुट प्रदान करता है
प्रतिक्रिया डेटा JSON प्रारूप में संरचित है जिसमें एक एकल कुंजी-मूल्य जोड़ी है कुंजी "सादृश्यता" है और मूल्य एक संख्यात्मक स्कोर है जो दो पाठों के बीच की सादृश्यता को दर्शाता है
सामान्य उपयोग मामले में शैक्षिक सेटिंग में साहित्यिक चोरी का पता लगाना ई-कॉमर्स में सामग्री अनुशंसा करना ग्राहक सेवा में चैटबॉट प्रतिक्रियाओं को बढ़ाना और शोध या कानूनी संदर्भों में कुशल संगठन के लिए दस्तावेज़ों को समूहित करना शामिल हैं
डेटा की सटीकता को व्यापक डेटा सेट्स पर पूर्व-प्रशिक्षित उन्नत एनएलपी मॉडल के उपयोग के माध्यम से बनाए रखा जाता है निरंतर अपडेट और ठीक करना यह सुनिश्चित करता है कि मॉडल अर्थात्मक महत्व को पकड़ने और विश्वसनीय समानता स्कोर प्रदान करने में प्रभावी बने रहें
यदि एक या दोनों टेक्स्ट इनपुट खाली हैं तो API आमतौर पर 0 की समानता स्कोर लौटाएगा जो कोई समानता नहीं दर्शाता है उपयोगकर्ताओं को सुनिश्चित करना चाहिए कि दोनों इनपुट में मान्य पाठ हो ताकि सार्थक परिणाम मिल सकें
उपयोगकर्ता समानता स्कोर की अपेक्षा कर सकते हैं जो सामग्री के आधार पर भिन्न होते हैं स्कोर जो 1 के करीब होते हैं वे उच्च समानता को दर्शाते हैं जबकि स्कोर जो 0 के करीब होते हैं वे महत्वपूर्ण भिन्नताओं का सुझाव देते हैं तुलना की जा रही सामग्री के प्रकार के आधार पर पैटर्न उभर सकते हैं जैसे शैक्षणिक पत्र बनाम आकस्मिक लेखन
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
448ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,202ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
372ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
606ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
28ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
172ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
312ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,216ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
368ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
434ms