मोशनडिफ्यूज: डिफ्यूज मॉडल का उपयोग करके टेक्स्ट-ड्रिवेन ह्यूमन मोशन जेनरेशन
मानव आंदोलन मॉडलिंग एनिमेटेड वर्चुअल कैरेक्टर बनाने में महत्वपूर्ण। हालांकि, मौजूदा तरीकों में परिष्कृत उपकरण और डोमेन विशेषज्ञों की आवश्यकता होती है। ArXiv.org पर हाल ही में एक पेपर MotionDiffuse का प्रस्ताव करता है। मोशनडिफ्यूज एक बहुमुखी और नियंत्रणीय गति पीढ़ी ढांचा है जो व्यापक पाठ का उपयोग करके विविध गति उत्पन्न कर सकता है।
पाठ-समायोजित छवि निर्माण से प्रेरणा लेते हुए, शोधकर्ताओं ने गति पीढ़ी में एक डीनोइज़िंग प्रसार स्टोकेस्टिक मॉडल को शामिल करने का प्रस्ताव रखा है। गति अवधि के अनुसार मनमानी-लंबाई गति संश्लेषण प्राप्त करने के लिए एक क्रॉस-मोडलिटी रैखिक ट्रांसफार्मर प्रस्तावित है। इसके अतिरिक्त, MotionDiffuse बारीक-बारीक पाठ विवरणों को संभालता है जो पूरे समय-भिन्न संकेत को जुटाते हैं।
मूल्यांकन से पता चलता है कि प्रस्तावित दृष्टिकोण दो सशर्त गति निर्माण कार्यों में अत्याधुनिक प्राप्त करता है।
मानव गति मॉडलिंग कई आधुनिक ग्राफिक्स अनुप्रयोगों के लिए महत्वपूर्ण है, जिन्हें आमतौर पर विशेष कौशल की आवश्यकता होती है। शौकीनों के कौशल की बाधा को दूर करने के लिए, हाल ही में गति निर्माण के तरीके प्राकृतिक भाषा पर सशर्त मानवीय गतियों को सीधे उत्पन्न कर सकते हैं। हालांकि, विभिन्न टेक्स्ट इनपुट के साथ विविध और बारीक गति पीढ़ी को प्राप्त करना अभी भी मुश्किल है। इस समस्या का समाधान करने के लिए, हम MotionDiffuse का प्रस्ताव करते हैं, जो पहला प्रसार मॉडल-आधारित टेक्स्ट-संचालित मोशन जनरेशन फ्रेमवर्क है। यह कई गुणों को प्रदर्शित करता है जो इसे मौजूदा तरीकों पर वांछनीय बनाते हैं। 1) संभाव्य मानचित्रण। नियतात्मक भाषाई गति मानचित्रण के बजाय, MotionDiffuse निरूपण चरणों की एक श्रृंखला के माध्यम से गति उत्पन्न करता है जिसमें विविधताएँ डाली जाती हैं। 2) यथार्थवादी रचना। MotionDiffuse जटिल डेटा वितरण मॉडलिंग और ज्वलंत गति अनुक्रम उत्पन्न करने में उत्कृष्टता प्राप्त करता है। 3) बहु-स्तरीय संचालन। मोशनडिफ्यूज शरीर के अंगों के बारीक निर्देशों और समय-भिन्न पाठ संकेतों के साथ मनमानी लंबाई के गति संश्लेषण का जवाब देता है। हमारे प्रयोगों से पता चलता है कि मोशनडिफ्यूज टेक्स्ट-संचालित मोशन जनरेशन और एक्शन-कंडीशनल मोशन जनरेशन के लिए ठोस मार्जिन के साथ मौजूदा सोटा विधियों से बेहतर प्रदर्शन करता है। गुणात्मक विश्लेषण आगे व्यापक गति निर्माण के लिए MotionDiffuse की नियंत्रणीयता को प्रदर्शित करता है। होम पेज: यह https URL
शोध पत्र: झांग, एम।, “मोशनडिफ्यूज: टेक्स्ट-ड्रिवेन ह्यूमन मोशन जेनरेशन यूजिंग ए डिफ्यूजन मॉडल,” 2022। संपर्क: https://arxiv.org/abs/2208.15001