FurryGAN: उच्च गुणवत्ता वाली अग्रभूमि पहचान छवि संश्लेषण
जैसा जनरेटिव एडवरसैरियल नेटवर्क (GAN) में सुधार किया गया है और छवि संश्लेषण के नए तरीके विकसित किए जा रहे हैं। कार्यों में से एक अग्रभूमि और पृष्ठभूमि छवियों के एक संयोजन के रूप में एक छवि मॉडलिंग करके अग्रभूमि-जागरूक छवि संश्लेषण है। मास्क के अनुसार.
![एक नमूना छवि और संबंधित अग्रभूमि मुखौटा। दोनों नए प्रस्तावित मॉडल द्वारा एक साथ उत्पन्न होते हैं। छवि क्रेडिट: arXiv:2208.10422 [cs.CV]](https://amankishor.in/wp-content/uploads/2022/08/FurryGAN-उच्च-गुणवत्ता-वाली-अग्रभूमि-पहचान-छवि-संश्लेषण.png)
एक नमूना छवि और संबंधित अग्रभूमि मुखौटा।दोनों
एक साथ नए प्रस्तावित मॉडल द्वारा उत्पन्न। छवि क्रेडिट: arXiv:2208.10422 [cs.CV]
arXiv.org पर हाल ही में एक पेपर में FurryGAN का प्रस्ताव दिया गया है। FurryGAN केवल छवियों के संग्रह के बाद अग्रभूमि को स्पष्ट रूप से समझना और छवियों को संश्लेषित करना सीखता है।
सबसे पहले, यह अनुशंसा की जाती है कि अग्रभूमि और सिंथेटिक छवियां प्रशिक्षण वितरण के समान हों। यह मोटे और महीन मुखौटे भी पेश करता है। अंत में, शोधकर्ताओं ने उत्पन्न छवि से मास्क की भविष्यवाणी करने के लिए एक विभेदक सहायक कार्य का प्रस्ताव दिया, ताकि जनरेटर एक अग्रभूमि छवि तैयार करे जो मुखौटा फिट हो।
प्रयोग पिछले तरीकों की तुलना में प्रस्तावित ढांचे की श्रेष्ठता प्रदर्शित करते हैं।
अग्रभूमि जागरूक छवि संश्लेषण का उद्देश्य एक छवि और उसके अग्रभूमि मुखौटा उत्पन्न करना है। अग्रभूमि और पृष्ठभूमि छवियों के एक नकाबपोश मिश्रण के रूप में छवि तैयार करना एक सामान्य तरीका है। हम तुच्छ समाधानों पर पहुंचते हैं जहां एक छवि दूसरे पर हावी हो जाती है, यानी मुखौटा पूरी तरह से भरा या खाली होता है, बिना अर्थ के अग्रभूमि और पृष्ठभूमि को अलग करता है। तो यह एक कठिन समस्या है। हम FurryGAN के लिए तीन प्रमुख घटक प्रस्तुत करते हैं। 1) अग्रभूमि और सिंथेटिक दोनों छवियों को यथार्थवादी बनाना, 2) मास्क को मोटे और महीन मास्क के संयोजन के रूप में डिजाइन करना, और 3) एक सहायक मुखौटा भविष्यवक्ता द्वारा जनरेटर का मार्गदर्शन करना। भेदभाव करने वाला। हमारी विधि अत्यधिक विस्तृत अल्फा मास्क का उपयोग करके यथार्थवादी छवियां बनाती है जो पूरी तरह से असुरक्षित तरीके से बालों, फर और व्हिस्कर को ढकती हैं।
शोध पत्र: Bae, J., Kwon, M., और Uh, Y., “FurryGAN: High-Quality Foreground Recognition Image Synthesis,” 2022। संपर्क: https://arxiv.org/abs/2208.10422