ടിക്ക് ടോക്ക്-ൻ്റെ മാതൃ കമ്പനിയായ ബൈറ്റ്ഡാൻസ്, ഒരൊറ്റ ഫോട്ടോയിൽ നിന്ന് ആളുകളുടെ വീഡിയോകൾ സൃഷ്ടിക്കാൻ കഴിയുന്ന ഒരു തകർപ്പൻ എഐ മോഡലായ ഓംനി ഹ്യൂമൻ-1 അവതരിപ്പിച്ചു. ഓമ്നി ഹ്യൂമൻ-1 നിലവിലുള്ള സാങ്കേതികവിദ്യകളെക്കാൾ മികച്ച പ്രകടനം കാഴ്ചവെക്കുന്നുവെന്ന് കമ്പനി അവകാശപ്പെടുന്നു, പ്രത്യേകിച്ചും ഓഡിയോ ക്ലിപ്പുകൾ പോലുള്ള കുറഞ്ഞ ഇൻപുട്ടിൽ നിന്ന് മനുഷ്യരുടെ വീഡിയോകൾ സൃഷ്ടിക്കുന്നതിൽ.
ഓംനി ഹ്യൂമൻ–1-ന് വ്യക്തികൾ സംസാരിക്കുന്നതും ആംഗ്യങ്ങൾ കാണിക്കുന്നതും പാടുന്നതും സംഗീതോപകരണങ്ങൾ വായിക്കുന്നതും പോലുള്ള വളരെ വിശദമായ വീഡിയോകൾ സൃഷ്ടിക്കാൻ കഴിയും. മനുഷ്യൻ്റെ സംസാരം, ചലനം, ആംഗ്യങ്ങൾ എന്നിവ കൃത്യമായി പകർത്തുന്നു, സൃഷ്ടിച്ച വീഡിയോകളെ യഥാർത്ഥ ഫൂട്ടേജിൽ നിന്ന് വേർതിരിച്ചറിയാൻ കഴിയില്ല.
റിയലിസ്റ്റിക് വീഡിയോ ആനിമേഷനുകൾ സൃഷ്ടിക്കുന്നതിന് ഇമേജുകൾ, ഓഡിയോ, ടെക്സ്റ്റ് എന്നിവ പോലുള്ള വ്യത്യസ്ത ഇൻപുട്ടുകളെ ഓമ്നി ഹ്യൂമൻ-1 സംയോജിപ്പിക്കുന്നു. മനുഷ്യരുടെ സ്വാഭാവിക ചലനങ്ങൾ സൃഷ്ടിക്കുന്നതിന് ഇത് ഈ ഇൻപുട്ടുകളെ പ്രോസസ്സ് ചെയ്യുന്നു, ഇത് പ്രധാനമായും മുഖത്തിന്റെ ആനിമേഷനുകളിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്ന പരമ്പരാഗത ഡീപ്ഫേക്ക് സാങ്കേതികവിദ്യകളിൽ നിന്ന് വേറിട്ടുനിൽക്കുന്നു.
ഓമ്നി ഹ്യൂമൻ-1 ൻ്റെ ഏറ്റവും ശ്രദ്ധേയമായ പ്രകടനങ്ങളിലൊന്നിൽ ആൽബർട്ട് ഐൻസ്റ്റൈൻ പ്രസംഗിക്കാൻ പ്രത്യക്ഷപ്പെടുന്നതിൻ്റെ 23 സെക്കൻഡ് വീഡിയോ ഉൾപ്പെടുന്നു. റിയലിസ്റ്റിക് ചലനങ്ങളിലൂടെയും സംസാരത്തിലൂടെയും ചരിത്രപ്രധാനമുള്ള വ്യക്തികളെ ജീവസുറ്റതാക്കാനുള്ള മോഡലിൻ്റെ കഴിവ് ഇത് കാണിക്കുന്നു.
ഓപ്പൺഎഐയുടെ വീഡിയോ ജനറേറ്റിംഗ് മോഡലായ സോറയുടെ എതിരാളിയായി ബൈറ്റ്ഡാൻസ് ഓമ്നി ഹ്യൂമൻ-1-നെ അവതരിപ്പിക്കുന്നു. ഫേഷ്യൽ ആനിമേഷനിൽ മാത്രം ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്ന നിലവിലുള്ള പല എഐ ടൂളുകളിൽ നിന്നും വ്യത്യസ്തമായി, ഓമ്നി ഹ്യൂമൻ-1 ന് ഫുൾ-ബോഡി ആനിമേഷനുകൾ സൃഷ്ടിക്കാൻ കഴിയും, ഇത് എഐ- നയിക്കുന്ന വീഡിയോ ജനറേഷനിൽ ഒരു സുപ്രധാന കുതിച്ചുചാട്ടം ഉണ്ടാക്കുന്നു.
നിലവിൽ, ഓമ്നി ഹ്യൂമൻ-1 ഗവേഷണ ഘട്ടത്തിൽ തുടരുന്നു, ഇത് ഇതുവരെ പൊതുജനങ്ങൾക്ക് ലഭ്യമായി തുടങ്ങിയിട്ടില്ല. എന്നിരുന്നാലും, ഗവേഷകർ സാമ്പിൾ വീഡിയോകൾ പങ്കിടുകയും ഭാവിയിൽ സാധ്യമായ കോഡ് റിലീസിനെക്കുറിച്ച് സൂചന നൽകുകയും ചെയ്തു.