Books - an abstract illustration. Image credit: Tom Hermans via StockSnap, CC0 Public Domain

UnCommonSense: दैनिक जीवन के बारे में उपयोगी नकारात्मक ज्ञान

सामान्य ज्ञान का आधार (CSKB) AI अनुप्रयोगों के लिए महत्वपूर्ण है जैसे: प्रश्न उत्तर और चैटबॉटहालांकि, यह लगभग विशेष रूप से सकारात्मक बयानों पर केंद्रित है जैसे “गोरिल्ला स्तनधारी हैं” और “गोरिल्ला मांसाहारी नहीं हैं” जैसे नकारात्मक बयानों को शायद ही पकड़ लेते हैं।

पुस्तक - सार चित्रण।इमेज क्रेडिट: टॉम हरमन्स स्टॉक स्नैप के माध्यम से, CC0 पब्लिक डोमेन

पुस्तक – सार चित्रण।छवि क्रेडिट: टॉम हरमन्स के माध्यम से स्टॉक स्नैपCC0 पब्लिक डोमेन

arXiv.org पर हाल ही में एक पेपर CSKB अवधारणा के बारे में सूचनात्मक निषेधों की पहचान करने के लिए एक UnCommonSense विधि प्रस्तुत करता है।

गोरिल्ला जैसी लक्ष्य अवधारणा के लिए, शोधकर्ता पहले तुलनीय अवधारणाओं (जैसे शेर) के एक सेट की गणना करता है, एक स्थानीय बंद-विश्व धारणा मानता है, और सकारात्मक बयानों पर विचार करता है जो नकारात्मक उम्मीदवारों के रूप में लक्ष्य अवधारणा में फिट नहीं होते हैं। करने के लिए।

इस पद्धति को मानव-पठनीय वाक्यांशों के माध्यम से व्याख्यात्मक निषेध उत्पन्न करने के लिए दिखाया गया है। पिछली अत्याधुनिक तकनीक की तुलना में 18% अधिक जानकारी और 17% अधिक रिकॉल।

रोजमर्रा की अवधारणाओं का सामान्य ज्ञान एआई अनुप्रयोगों जैसे प्रश्न उत्तर और चैटबॉट के लिए एक महत्वपूर्ण संपत्ति है। हाल ही में, एक संरचित सामान्य ज्ञान ज्ञान आधार (CSKB) के निर्माण में रुचि बढ़ी है। मानव सामान्य ज्ञान का एक महत्वपूर्ण हिस्सा उन संपत्तियों के बारे में है जो अवधारणाओं के अनुकूल नहीं हैं, लेकिन मौजूदा CSKB केवल सकारात्मक बयानों को संग्रहीत करता है। इसके अलावा, चूंकि CSKB एक खुली दुनिया की धारणा के तहत काम करता है, इसलिए अनुपस्थित बयानों को अमान्य नहीं बल्कि संदिग्ध माना जाता है। यह पत्र उपयोगी नकारात्मक सामान्य ज्ञान कथनों को मूर्त रूप देने के लिए एक UNCOMMONSENSE रूपरेखा प्रस्तुत करता है। एक लक्ष्य अवधारणा को देखते हुए, CSKB में एक समान अवधारणा की पहचान की जाती है और एक स्थानीय बंद-विश्व धारणा मान ली जाती है। इस प्रकार, तुलनीय अवधारणाओं के बारे में सकारात्मक कथन जो लक्ष्य अवधारणा में मौजूद नहीं हैं, उम्मीदवार के नकारात्मक बयानों के बीज बन जाते हैं। सूचना सामग्री के आधार पर बड़ी संख्या में उम्मीदवारों की जांच की जाती है, छंटनी की जाती है और उन्हें रैंक किया जाता है। अंतर्जात और बाहरी मूल्यांकन से पता चलता है कि हमारी पद्धति अत्याधुनिक विधियों से काफी बेहतर प्रदर्शन करती है। सूचनात्मक खंडन का एक बड़ा डेटासेट भविष्य के अनुसंधान के लिए एक संसाधन के रूप में प्रकाशित किया गया है।

शोध पत्र: अर्नौट, एच., रज़नीवस्की, एस., वीकुम, जी., और पैन, जेजेड, “अनकॉमनसेंस: यूज़फुल नेगेटिव नॉलेज ऑफ़ एवरीडे कॉन्सेप्ट्स,” 2022। संपर्क: https://arxiv.org/abs/2208.09292


Similar Posts

Leave a Reply

Your email address will not be published. Required fields are marked *