VASA 1 : సాధారణ ఫొటోలు.. వీడియోలుగా మారిపోతే.. మనకు ఇష్టం వచ్చిన విధంగా వాటికి ఎమోషన్స్, ఎక్స్ప్రెషన్స్ను కూడా జతకలిపే అవకాశముంటే.. భలేగా ఉంటుంది కదూ!! అటువంటిదే ఓ కొత్త ఆర్టిఫీషియల్ ఇంటెలీజెన్స్ (ఏఐ) మోడల్ను మైక్రోసాఫ్ట్ తీసుకొచ్చింది. దానిపేరే.. ‘వాసా-1’!! వాసా-1 అంటే.. ‘విజువల్ ఎఫెక్టివ్ స్కిల్స్ ఆడియో-1’.
Super easy to generate the videos.
Would you like to try VASA-1? pic.twitter.com/ogFjjKvOjt
— Eduardo Borges (@duborges) April 18, 2024
We’re now on WhatsApp. Click to Join
మైక్రోసాఫ్ట్ అధికారిక వెబ్సైట్లో వాసా-1 (VASA 1)తో చేసిన కొన్ని శాంపిల్ వీడియోలను షేర్ చేశారు. వాటిని చూసి నెటిజన్స్ అవాక్కవుతున్నారు. ఈ ఏఐ టూల్లోకి మనం తొలుత కొన్ని ఫొటోలను అప్లోడ్ చేసుకోవాలి. అనంతరం ఆడియో క్లిప్ను కూడా అప్లోడ్ చేసుకోవాలి. తదుపరిగా వాటన్నింటిని సింక్ చేసే ఒక ఆప్షన్ను క్లిక్ చేయాలి. ఆ వెంటనే ఫొటోలన్నీ కలిసిపోయి కొత్త వీడియో తయారవుతుంది. మనం అప్లోడ్ చేసిన ఆడియోను.. చక్కటి ఎమోషన్, ఎక్స్ప్రెషన్తో ఆ ఫొటోలు మాట్లాడటం మొదలుపెడతాయి. ముఖ కండరాలు, పెదవులు, ముక్కు, తల కదలికలన్నీ చాలా పర్ఫెక్టుగా ఉండటం ఈ వీడియో జనరేటర్ సాఫ్ట్వేర్ ప్రత్యేకత. వాసా-1 ప్రస్తుతం 40 ఎఫ్పీఎస్ వద్ద గరిష్టంగా 512×512 పిక్సెల్ రిజల్యూషన్తో మాత్రమే వీడియోను రూపొందించగలదు. ఇంగ్లిష్తో పాటు ఇతర ప్రపంచభాషల ఆడియో క్లిప్లను కూడా ఇది సపోర్ట్ చేస్తుంది.
ఫేక్ వీడియోలను తయారు చేసే వాళ్ల చేతిలో ఇలాంటి సాఫ్ట్వేర్ పడితే అంతే సంగతి. దుర్వినియోగం చేసే అవకాశం ఉంటుంది. ఈ సమస్యపై మైక్రోసాఫ్ట్ స్పందించింది. ఈ వీడియో జనరేటర్ సాఫ్ట్వేర్ డెమోను కూడా ప్రజల కోసం విడుదల చేసే ప్రసక్తే లేదని తేల్చి చెప్పింది. ఈ సాఫ్ట్వేర్తో ఫేక్ వీడియోలను క్రియేట్ చేసి దుర్వినియోగానికి పాల్పడే ప్రమాదం ఉందని ఆందోళన వ్యక్తం చేసింది. అచ్చం నిజమైనవిగా కనిపించే వర్చువల్ క్యారెక్టర్ల తయారీకి ఈ సాఫ్ట్వేర్ను పరిమితం చేస్తామని మైక్రోసాఫ్ట్ స్పష్టం చేసింది. ఇప్పట్లో ఇలాంటి సున్నితమైన టెక్నాలజీని ప్రజలకు విడుదల చేసే ఆలోచనే లేదని వెల్లడించింది.
Introducing: VASA-1 by Microsoft Research.
TL;DR: single portrait photo + speech audio = hyper-realistic talking face video with precise lip-audio sync, lifelike facial behavior, and naturalistic head movements, generated in real time.
Tap to see all the videos. pic.twitter.com/pPC6qZOBW2
— Eduardo Borges (@duborges) April 18, 2024