性爱-日本父女乱伦 王亦洲课题组 TPAMI 2023 入选论文解读:东说念主体动作生成综述:法度、资源与挑战

lisa ai换脸 /

你的位置:性爱 > lisa ai换脸 > 日本父女乱伦 王亦洲课题组 TPAMI 2023 入选论文解读:东说念主体动作生成综述:法度、资源与挑战
日本父女乱伦 王亦洲课题组 TPAMI 2023 入选论文解读:东说念主体动作生成综述:法度、资源与挑战
发布日期:2024-10-08 04:32    点击次数:80

日本父女乱伦 王亦洲课题组 TPAMI 2023 入选论文解读:东说念主体动作生成综述:法度、资源与挑战

  本文是对发表于筹办机视觉领域顶级期刊 TPAMI 2023 的综述论文 Human Motion Generation: A Survey 的解读。该论文由北京大学博雅特聘教悔王亦洲课题组与北京大学艺术学院岑岭助理教悔、华为云首席科学家田奇博士相助完成日本父女乱伦。

 

  这篇综述初度全面总结了东说念主体动作生成领域的研究研究职责。作家当先先容东说念主体动作和生成模子的基础常识,然后对三个主要子任务(基于文本、音频和场景运转的东说念主体动作生成)的代表性法度进行了详细。此外,作家还梳理了常见数据集和评估目的,并盘问了通达问题和潜在的改日研究看法。作家但愿本综述约略为这个快速发展的领域提供一个全面的概览,并启发处分现存挑战的新念念路。

 

  论文说合:https://arxiv.org/pdf/2307.10894.pdf

  Early Access: https://ieeexplore.ieee.org/document/10313063

  

图1. 代表性的东说念主体动作生成任务和法度概览。

  

01 布景先容

 

  东说念主类证据自身意图和环境信息来策画和践诺躯壳动作。算作东说念主工智能的一项遑急看法,生成东说念主体的动作时势引起了各个研究领域的越来越多的存眷,包括筹办机视觉、筹办机图形学、多媒体、机器东说念主学和东说念主机交互。东说念主体动作生成的看法是生成当然、传神且各种化的东说念主体动作,在电影制作、视频游戏、增强试验/诬捏试验、东说念主机交互和诬捏数字东说念主等领域具有平淡应用。

 

  跟着深度学习的兴起,频年来各种生成法度赢得了快速发展,如自总结模子、变分自编码器(VAE)、归一化流、生成抗争相聚(GAN)和去噪扩散概率模子(DDPM)。这些法度在文本、图像、视频和 3D 物体等不同领域赢得了宽广到手。另一方面,东说念主体建模的权贵表现使得从视频中索取东说念主体动作和构建大规模东说念主体动作数据集变得愈加容易。因此,频年来数据运转的东说念主体动作生成引起了研究界越来越多的酷爱酷爱。

 

  但是,东说念主体动作生成靠近的挑战不单是是将深度生成模子应用于东说念主体动作数据集:

  1. 东说念主体动作高度复杂和非线性,受物理和生物力学敛迹;而东说念主类大脑具有感知生物通顺的特意神经机制,对稍不当然的动作时势齐很明锐。因此,生成的动作在质方位面有很高的要求,需要兼具当然性、畅达性和合感性。

  2. 东说念主体动作生成的需求频频包括一个要求信号,如文本形色、布景音频或周围环境,如图1所示。因此生成的动作不仅自己应该合理,还应与要求信号妥洽一致。

  3. 东说念主体动作算作一种遑急的非说话交流弁言,背后响应了多个潜在身分,如行径看法、个东说念主立场、社会法度和文化抒发。联想情况下,动作生成模子应该学习捕捉动作变化和与要求信号间机要的语义关联。

 

  基于这一领域的快速发展和显露的挑战,咱们提供了这篇全面的综述,以匡助研究界追踪其表现。图2总结了频年来东说念主体动作生成法度的发展。

 

日本父女乱伦

图2. 东说念主体动作生成法度的近期表现(不同要求信号运转)。

  

02 动作生成法度

 

  本篇综述论文主要存眷基于要求信号的东说念主体动作生成任务,包括文本运转、音频运转和场景运转,并区别总结了这些法度的代表性服从,如表1所示。

 

表1. 东说念主体动作生成代表性法度总结。

 

  文本运转

  文本运转东说念主体动作生成任务旨在证据当然说话形色生成东说念主体动作序列。这类法度不错分为两类:动作标签运转和当然说话运转。动作标签运转运用有限的预界说标签生成动作,而当然说话运转则不错基于各种化的文本形色生成更丰富的动作。

 

  音频运转

  音频运转东说念主体动作生成任务旨在证据音频信号(如音乐或语音)生成相应的东说念主体动作。这类任务主要不错分为音乐到跳舞和语音到手势两个子任务。音乐到跳舞任务生成与音乐节律和立场相匹配的跳摆动作,而语音到手势任务则生成与语音内容相妥洽的上半身动作。

 

  场景运转

  场景运转东说念主体动作生成任务旨在证据场景环境生成合理的东说念主体动作。这类法度频频取舍多阶段管线,当先预测看法位置或看法交互锚点,然后策画旅途或轨迹,终末沿轨迹生成动作。

  

03 数据集

 

  咱们区别总结了与文本、音频和场景要求研究的东说念主体动作数据集。这些数据集涵盖了各种动作类别、音频类型和场景类型,为东说念主体动作生成研究提供了丰富的数据资源,如表2所示。

 

表2. 东说念主体动作生成主要数据集总结。

 

04 评价目的

 

  咱们总结了从不同角度评价生成动作的常用目的,包括信得过性、各种性、要求一致性、主不雅评测等等,如表3所示。这些目的不错匡助研究者比拟不同法度的性能,鼓舞领域的发展。此外,咱们也计议了现存评价目的的局限性。

 

表3. 东说念主体动作生成主要评价目的总结。绿色、蓝色、橙色区别代表文本运转、音频运转和场景运转的研究职责。

  

大陆自拍在线直

05 改日预测

 

  尽管这个领域赢得了连忙的表现,但仍存在一些要害挑战需要改日的探索。有鉴于此,咱们从不同角度预测了几个宽裕远景的改日研究看法,以期能引发东说念主体动作生成研究的新冲破。改日的职责不错从数据、语义、评价、可控性和互动性等方面进行长远研究,以完满更当然、信得过、各种化的东说念主体动作生成。

 

  数据:相聚高质地的东说念主体动作数据具有挑战性,改日研究不错计议使用异构数据源,通过弱监督学习法度或多模态基础模子整合数据上风。

 

  语义:东说念主体动作不单是是躯壳部位的通顺,还具有丰富的非言语同样功能。改日研究不错长远计议从数据、法度和评价等方面捕捉东说念主体动作与要求信号之间的高层语义相关。

 

  评价:合适的动作评价目的至关遑急,但具有挑战性。改日职责不错存眷遐想更合适东说念主类感知且具有可阐明性的客不雅评价目的。

 

  可控性:生成内容的可控性在本色应用中十分遑急。改日研究不错进一步探索可控性,以创造更用户友好的体验,举例交互式和细粒度裁剪。

 

  互动性:东说念主体动作的互动性尚未得到充分计议。改日研究不错存眷东说念主体动作生成在东说念主际互动和东说念主与环境互动布景下的应用日本父女乱伦,举例外交群体中的互动动作和动态可操作场景中的动作生成。