嘘~ 正在从服务器偷取页面 . . .

元宇宙/虚拟人


⚠️ 以下所有内容总结都来自于 Google的大语言模型Gemini-Pro的能力,如有错误,仅供参考,谨慎使用
🔴 请注意:千万不要用于严肃的学术场景,只能用于论文阅读前的初筛!
💗 如果您觉得我们的项目对您有帮助 ChatPaperFree ,还请您给我们一些鼓励!⭐️ HuggingFace免费体验

2024-11-17 更新

A multidimensional measurement of photorealistic avatar quality of experience

Authors:Ross Cutler, Babak Naderi, Vishak Gopal, Dharmendar Palle

Photorealistic avatars are human avatars that look, move, and talk like real people. The performance of photorealistic avatars has significantly improved recently based on objective metrics such as PSNR, SSIM, LPIPS, FID, and FVD. However, recent photorealistic avatar publications do not provide subjective tests of the avatars to measure human usability factors. We provide an open source test framework to subjectively measure photorealistic avatar performance in ten dimensions: realism, trust, comfortableness using, comfortableness interacting with, appropriateness for work, creepiness, formality, affinity, resemblance to the person, and emotion accuracy. We show that the correlation of nine of these subjective metrics with PSNR, SSIM, LPIPS, FID, and FVD is weak, and moderate for emotion accuracy. The crowdsourced subjective test framework is highly reproducible and accurate when compared to a panel of experts. We analyze a wide range of avatars from photorealistic to cartoon-like and show that some photorealistic avatars are approaching real video performance based on these dimensions. We also find that for avatars above a certain level of realism, eight of these measured dimensions are strongly correlated. In particular, for photorealistic avatars there is a linear relationship between avatar affinity and realism; in other words, there is no uncanny valley effect for photorealistic avatars in the telecommunication scenario. We provide several extensions of this test framework for future work and discuss design implications for telecommunication systems. The test framework is available at https://github.com/microsoft/P.910.

PDF arXiv admin note: text overlap with arXiv:2204.06784

Summary
提出开源测试框架,评估并分析虚拟人性能,揭示其与真实视频的相似性及主观因素。

Key Takeaways

  • 虚拟人性能在客观指标上有显著提升。
  • 缺乏对虚拟人主观可用性的测试。
  • 开源测试框架评估虚拟人在十个维度上的表现。
  • 主观指标与客观指标的相关性较弱,情感准确性适中。
  • 主观测试框架具有高可重复性和准确性。
  • 高真实度虚拟人与真实视频相似。
  • 高真实度虚拟人维度间相关性强。
  • 虚拟人亲和度与真实度呈线性关系。
  • 提供测试框架的扩展和设计启示。
  • 测试框架可在GitHub获取。

ChatPaperFree

  1. Title: 多维度测量逼真虚拟角色质量研究

  2. Authors: Ross Cutler,Babak Naderi,Vishak Gopal,Dharmendar Palle

  3. Affiliation: 未知

  4. Keywords: photorealistic avatar,主观测试,多维度测量,通信应用,健康护理,教育应用

  5. Urls: 论文链接(需根据实际链接填写);Github代码链接:None

  6. Summary:

    • (1)研究背景:随着通信技术的发展,逼真虚拟角色(如虚拟形象、数字人等)在各个领域得到广泛应用。本文的研究背景是评估这些逼真虚拟角色的质量,以更好地满足用户需求并提升用户体验。

    • (2)过去的方法及问题:目前评估逼真虚拟角色的质量主要基于客观指标,如PSNR、SSIM等。然而,这些客观指标并不能完全反映用户对虚拟角色的主观感受。因此,缺乏一种主观测试方法来全面评估虚拟角色的质量。

    • (3)研究方法:针对上述问题,本文提出了一种主观测试框架,用于多维度测量逼真虚拟角色的质量。该框架包括十个维度:逼真度、信任度、使用舒适度、交互舒适度、工作适宜性、怪异感、正式程度、亲和力、与真人相似度以及情绪准确性。通过这一框架,可以全面评估虚拟角色的性能,并找出需要改进的方向。

    • (4)任务与性能:本文在多种虚拟角色上进行了实验,包括逼真的虚拟角色和卡通般的角色。实验结果表明,一些高逼真度的虚拟角色已经接近真实视频的性能。此外,对于高逼真度的虚拟角色,八个测量维度之间存在强相关性。本文提出的测试框架在评估虚拟角色性能方面取得了显著成果,为未来的研究提供了有益的参考。

希望以上回答对您有所帮助!
7. 方法论:

(1)研究背景与目的:针对当前逼真虚拟角色(如虚拟形象、数字人等)在各个领域得到广泛应用,本文旨在评估这些逼真虚拟角色的质量,以更好地满足用户需求并提升用户体验。

(2)研究方法概述:

①提出一种主观测试框架,用于多维度测量逼真虚拟角色的质量。这些维度包括逼真度、信任度、使用舒适度、交互舒适度等。该框架能全面评估虚拟角色的性能并发现需要改进的方向。

②实验设计与实施:本研究在多种虚拟角色上进行实验,包括逼真的虚拟角色和卡通般的角色。同时采用了各种主观和客观的质量评估方法,对虚拟角色的性能进行了全面的测试和评估。实验结果表明高逼真度的虚拟角色性能接近真实视频,验证了本文提出的测试框架的有效性。

(3)技术细节与创新点:文章引用了多个关于虚拟角色质量评估的技术细节和创新点,包括图像质量评估方法、感知质量评估方法等。这些技术细节和创新点的引入为本文提出的测试框架提供了技术支持和理论支撑。同时,文章还介绍了多维测量方法的实现过程以及如何处理多维数据的技术手段。

(4)数据分析与结论:通过对实验数据的分析和处理,本文验证了提出的测试框架在评估虚拟角色性能方面取得了显著成果。此外,还探讨了未来研究方向和潜在应用前景。本研究为虚拟角色的质量评估提供了有益的参考,有助于推动相关领域的发展。
8. Conclusion:

(1)这篇工作的意义是什么?
答:该研究对于评估逼真虚拟角色(如虚拟形象、数字人等)的质量具有重要意义,旨在更好地满足用户需求并提升用户体验。该研究填补了现有评估方法的不足,提供了一种主观测试框架来多维度测量逼真虚拟角色的质量,为相关领域的发展提供了有益的参考。

(2)从创新性、性能、工作量三个维度总结本文的优缺点是什么?
答:创新性:该研究提出了一种新的主观测试框架,用于多维度测量逼真虚拟角色的质量,这是对该领域的一个创新贡献。
性能:通过实验验证,该测试框架在评估虚拟角色性能方面取得了显著成果,表明其具有较高的有效性和可靠性。
工作量:文章对于方法的实现过程和技术细节进行了详细的描述,但对于实验部分的具体实施和数据处理方法描述相对较少,可能无法完全展现整个研究的工作量。

总之,该文章提出的多维度测量逼真虚拟角色质量的研究具有重要实际意义,并且具有一定的创新性和有效性。

点此查看论文截图

⚠️ 以下所有内容总结都来自于 Google的大语言模型Gemini-Pro的能力,如有错误,仅供参考,谨慎使用
🔴 请注意:千万不要用于严肃的学术场景,只能用于论文阅读前的初筛!
💗 如果您觉得我们的项目对您有帮助 ChatPaperFree ,还请您给我们一些鼓励!⭐️ HuggingFace免费体验

2024-11-17 更新

A multidimensional measurement of photorealistic avatar quality of experience

Authors:Ross Cutler, Babak Naderi, Vishak Gopal, Dharmendar Palle

Photorealistic avatars are human avatars that look, move, and talk like real people. The performance of photorealistic avatars has significantly improved recently based on objective metrics such as PSNR, SSIM, LPIPS, FID, and FVD. However, recent photorealistic avatar publications do not provide subjective tests of the avatars to measure human usability factors. We provide an open source test framework to subjectively measure photorealistic avatar performance in ten dimensions: realism, trust, comfortableness using, comfortableness interacting with, appropriateness for work, creepiness, formality, affinity, resemblance to the person, and emotion accuracy. We show that the correlation of nine of these subjective metrics with PSNR, SSIM, LPIPS, FID, and FVD is weak, and moderate for emotion accuracy. The crowdsourced subjective test framework is highly reproducible and accurate when compared to a panel of experts. We analyze a wide range of avatars from photorealistic to cartoon-like and show that some photorealistic avatars are approaching real video performance based on these dimensions. We also find that for avatars above a certain level of realism, eight of these measured dimensions are strongly correlated. In particular, for photorealistic avatars there is a linear relationship between avatar affinity and realism; in other words, there is no uncanny valley effect for photorealistic avatars in the telecommunication scenario. We provide several extensions of this test framework for future work and discuss design implications for telecommunication systems. The test framework is available at https://github.com/microsoft/P.910.

PDF arXiv admin note: text overlap with arXiv:2204.06784

Summary
提出开源测试框架,评估并分析虚拟人性能,揭示其与真实视频的相似性及主观因素。

Key Takeaways

  • 虚拟人性能在客观指标上有显著提升。
  • 缺乏对虚拟人主观可用性的测试。
  • 开源测试框架评估虚拟人在十个维度上的表现。
  • 主观指标与客观指标的相关性较弱,情感准确性适中。
  • 主观测试框架具有高可重复性和准确性。
  • 高真实度虚拟人与真实视频相似。
  • 高真实度虚拟人维度间相关性强。
  • 虚拟人亲和度与真实度呈线性关系。
  • 提供测试框架的扩展和设计启示。
  • 测试框架可在GitHub获取。

ChatPaperFree

  1. Title: 多维度测量逼真虚拟角色质量研究

  2. Authors: Ross Cutler,Babak Naderi,Vishak Gopal,Dharmendar Palle

  3. Affiliation: 未知

  4. Keywords: photorealistic avatar,主观测试,多维度测量,通信应用,健康护理,教育应用

  5. Urls: 论文链接(需根据实际链接填写);Github代码链接:None

  6. Summary:

    • (1)研究背景:随着通信技术的发展,逼真虚拟角色(如虚拟形象、数字人等)在各个领域得到广泛应用。本文的研究背景是评估这些逼真虚拟角色的质量,以更好地满足用户需求并提升用户体验。

    • (2)过去的方法及问题:目前评估逼真虚拟角色的质量主要基于客观指标,如PSNR、SSIM等。然而,这些客观指标并不能完全反映用户对虚拟角色的主观感受。因此,缺乏一种主观测试方法来全面评估虚拟角色的质量。

    • (3)研究方法:针对上述问题,本文提出了一种主观测试框架,用于多维度测量逼真虚拟角色的质量。该框架包括十个维度:逼真度、信任度、使用舒适度、交互舒适度、工作适宜性、怪异感、正式程度、亲和力、与真人相似度以及情绪准确性。通过这一框架,可以全面评估虚拟角色的性能,并找出需要改进的方向。

    • (4)任务与性能:本文在多种虚拟角色上进行了实验,包括逼真的虚拟角色和卡通般的角色。实验结果表明,一些高逼真度的虚拟角色已经接近真实视频的性能。此外,对于高逼真度的虚拟角色,八个测量维度之间存在强相关性。本文提出的测试框架在评估虚拟角色性能方面取得了显著成果,为未来的研究提供了有益的参考。

希望以上回答对您有所帮助!
7. 方法论:

(1)研究背景与目的:针对当前逼真虚拟角色(如虚拟形象、数字人等)在各个领域得到广泛应用,本文旨在评估这些逼真虚拟角色的质量,以更好地满足用户需求并提升用户体验。

(2)研究方法概述:

①提出一种主观测试框架,用于多维度测量逼真虚拟角色的质量。这些维度包括逼真度、信任度、使用舒适度、交互舒适度等。该框架能全面评估虚拟角色的性能并发现需要改进的方向。

②实验设计与实施:本研究在多种虚拟角色上进行实验,包括逼真的虚拟角色和卡通般的角色。同时采用了各种主观和客观的质量评估方法,对虚拟角色的性能进行了全面的测试和评估。实验结果表明高逼真度的虚拟角色性能接近真实视频,验证了本文提出的测试框架的有效性。

(3)技术细节与创新点:文章引用了多个关于虚拟角色质量评估的技术细节和创新点,包括图像质量评估方法、感知质量评估方法等。这些技术细节和创新点的引入为本文提出的测试框架提供了技术支持和理论支撑。同时,文章还介绍了多维测量方法的实现过程以及如何处理多维数据的技术手段。

(4)数据分析与结论:通过对实验数据的分析和处理,本文验证了提出的测试框架在评估虚拟角色性能方面取得了显著成果。此外,还探讨了未来研究方向和潜在应用前景。本研究为虚拟角色的质量评估提供了有益的参考,有助于推动相关领域的发展。
8. Conclusion:

(1)这篇工作的意义是什么?
答:该研究对于评估逼真虚拟角色(如虚拟形象、数字人等)的质量具有重要意义,旨在更好地满足用户需求并提升用户体验。该研究填补了现有评估方法的不足,提供了一种主观测试框架来多维度测量逼真虚拟角色的质量,为相关领域的发展提供了有益的参考。

(2)从创新性、性能、工作量三个维度总结本文的优缺点是什么?
答:创新性:该研究提出了一种新的主观测试框架,用于多维度测量逼真虚拟角色的质量,这是对该领域的一个创新贡献。
性能:通过实验验证,该测试框架在评估虚拟角色性能方面取得了显著成果,表明其具有较高的有效性和可靠性。
工作量:文章对于方法的实现过程和技术细节进行了详细的描述,但对于实验部分的具体实施和数据处理方法描述相对较少,可能无法完全展现整个研究的工作量。

总之,该文章提出的多维度测量逼真虚拟角色质量的研究具有重要实际意义,并且具有一定的创新性和有效性。

点此查看论文截图

文章作者: Kedreamix
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 Kedreamix !
 上一篇
Talking Head Generation Talking Head Generation
Talking Head Generation 方向最新论文已更新,请持续关注 Update in 2024-11-17 LES-Talker Fine-Grained Emotion Editing for Talking Head Generation in Linear Emotion Space
下一篇 
Diffusion Models Diffusion Models
Diffusion Models 方向最新论文已更新,请持续关注 Update in 2024-11-14 4D Gaussian Splatting in the Wild with Uncertainty-Aware Regularization
  目录