WebTech Rodos: Το νέο πειραματικό εργαλείο τεχνητής νοημοσύνης της Microsoft Research Asia μπορεί να δημιουργήσει μερικά πολύ πειστικά deepfakes.
Το VASA-1 μπορεί να λάβει μια ακίνητη εικόνα ή ένα σχέδιο ενός ατόμου, να τη συνδυάσει με ένα αρχείο ήχου και να δημιουργήσει ένα ζωντανό ομιλούν πρόσωπο του ατόμου σχεδόν αμέσως.
Το εργαλείο δημιουργεί πράγματα που φαίνονται αρκετά ρεαλιστικά και μπορεί να μιμηθεί πράγματα όπως τις εκφράσεις του προσώπου και τις κινήσεις του κεφαλιού ενός ατόμου από τη φωτογραφία και να μετακινήσει τα χείλη του με τρόπο που να φαίνεται σαν να είναι όντως αυτός που μιλάει ή τραγουδάει. Η ομάδα έκανε μια επίδειξη των δυνατοτήτων του VASA-1 σε διάφορα βίντεο.
Από κοντά, ένα εκπαιδευμένο μάτι μπορεί ενδεχομένως να καταλάβει ότι οι κινήσεις του κεφαλιού είναι λίγο ρομποτικές, αλλά τα αποτελέσματα είναι αρκετά πειστικά. Αυτός είναι και ένας λόγος που οι ερευνητές δεν απελευθερώνουν ένα online demo, API ή προϊόν που χρησιμοποιεί το VASA-1 μέχρι να είναι σίγουροι ότι “θα χρησιμοποιηθεί υπεύθυνα και σύμφωνα με τους κατάλληλους κανονισμούς”.
“Είμαστε αντίθετοι σε οποιαδήποτε συμπεριφορά για τη δημιουργία παραπλανητικού ή επιβλαβούς περιεχομένου πραγματικών προσώπων και ενδιαφερόμαστε να εφαρμόσουμε την τεχνική μας για την προώθηση της ανίχνευσης πλαστογραφίας”, δήλωσε η ομάδα, προσθέτοντας ότι τα βίντεο που δημιουργούνται επί του παρόντος με το εργαλείο δεν έχουν αναγνωρίσιμα artifacts.
Οι ερευνητές βλέπουν το εργαλείο ως κάτι που θα μπορούσε να χρησιμοποιηθεί για την παροχή συντροφιάς και θεραπευτικής υποστήριξης σε ανθρώπους που το χρειάζονται ή για την παροχή ενός “προσώπου” με το οποίο θα μπορούσε κάποιος να μιλήσει σε καταστάσεις όπου χρησιμοποιείται η τεχνητή νοημοσύνη.
Νωρίτερα αυτή την εβδομάδα, η Microsoft έθεσε εκτός λειτουργίας το μοντέλο τεχνητής νοημοσύνης WizardLM-2 μέσα σε μία ημέρα από την κυκλοφορία του, επειδή οι προγραμματιστές δεν ολοκλήρωσαν τις δοκιμές τοξικότητας πριν από την κυκλοφορία του.
πηγή: pcmag.com