正在加载文章...

    HuMo,专注于人物的视频生成框架,从多模态输入(包括文本、图像和音频)生成高质量、细粒度且可控的人类视频