Example images and the corresponding foreground masks. Both are simultaneously generated by the newly proposed model. Image credit: arXiv:2208.10422 [cs.CV]

FurryGAN: उच्च गुणवत्ता वाली अग्रभूमि पहचान छवि संश्लेषण

जैसा जनरेटिव एडवरसैरियल नेटवर्क (GAN) में सुधार किया गया है और छवि संश्लेषण के नए तरीके विकसित किए जा रहे हैं। कार्यों में से एक अग्रभूमि और पृष्ठभूमि छवियों के एक संयोजन के रूप में एक छवि मॉडलिंग करके अग्रभूमि-जागरूक छवि संश्लेषण है। मास्क के अनुसार.

एक नमूना छवि और संबंधित अग्रभूमि मुखौटा। दोनों नए प्रस्तावित मॉडल द्वारा एक साथ उत्पन्न होते हैं। छवि क्रेडिट: arXiv:2208.10422 [cs.CV]

एक नमूना छवि और संबंधित अग्रभूमि मुखौटा।दोनों
एक साथ नए प्रस्तावित मॉडल द्वारा उत्पन्न। छवि क्रेडिट: arXiv:2208.10422 [cs.CV]

arXiv.org पर हाल ही में एक पेपर में FurryGAN का प्रस्ताव दिया गया है। FurryGAN केवल छवियों के संग्रह के बाद अग्रभूमि को स्पष्ट रूप से समझना और छवियों को संश्लेषित करना सीखता है।

सबसे पहले, यह अनुशंसा की जाती है कि अग्रभूमि और सिंथेटिक छवियां प्रशिक्षण वितरण के समान हों। यह मोटे और महीन मुखौटे भी पेश करता है। अंत में, शोधकर्ताओं ने उत्पन्न छवि से मास्क की भविष्यवाणी करने के लिए एक विभेदक सहायक कार्य का प्रस्ताव दिया, ताकि जनरेटर एक अग्रभूमि छवि तैयार करे जो मुखौटा फिट हो।

प्रयोग पिछले तरीकों की तुलना में प्रस्तावित ढांचे की श्रेष्ठता प्रदर्शित करते हैं।

अग्रभूमि जागरूक छवि संश्लेषण का उद्देश्य एक छवि और उसके अग्रभूमि मुखौटा उत्पन्न करना है। अग्रभूमि और पृष्ठभूमि छवियों के एक नकाबपोश मिश्रण के रूप में छवि तैयार करना एक सामान्य तरीका है। हम तुच्छ समाधानों पर पहुंचते हैं जहां एक छवि दूसरे पर हावी हो जाती है, यानी मुखौटा पूरी तरह से भरा या खाली होता है, बिना अर्थ के अग्रभूमि और पृष्ठभूमि को अलग करता है। तो यह एक कठिन समस्या है। हम FurryGAN के लिए तीन प्रमुख घटक प्रस्तुत करते हैं। 1) अग्रभूमि और सिंथेटिक दोनों छवियों को यथार्थवादी बनाना, 2) मास्क को मोटे और महीन मास्क के संयोजन के रूप में डिजाइन करना, और 3) एक सहायक मुखौटा भविष्यवक्ता द्वारा जनरेटर का मार्गदर्शन करना। भेदभाव करने वाला। हमारी विधि अत्यधिक विस्तृत अल्फा मास्क का उपयोग करके यथार्थवादी छवियां बनाती है जो पूरी तरह से असुरक्षित तरीके से बालों, फर और व्हिस्कर को ढकती हैं।

शोध पत्र: Bae, J., Kwon, M., और Uh, Y., “FurryGAN: High-Quality Foreground Recognition Image Synthesis,” 2022। संपर्क: https://arxiv.org/abs/2208.10422


Similar Posts

Leave a Reply

Your email address will not be published. Required fields are marked *