PaperX:基于学者DAG的多模态学术演示生成统一框架

发布时间:2026-02-12 05:00 arXiv·cs.AI

将科学论文转化为多模态演示内容对于研究成果传播至关重要,但这一过程通常费时费力。现有的自动化解决方案往往将每种输出格式视为独立的下游任务,这导致了冗余的处理流程和潜在的语义不一致问题。

为此,研究团队提出了PaperX,一个将学术演示生成建模为结构化转换与渲染过程的统一框架。该框架的核心是“学者DAG”,这是一种中间表示方法,它将论文的逻辑结构与最终演示的呈现语法进行了解耦。通过应用自适应的图遍历策略,PaperX能够从单一源文件生成多样化且高质量的演示输出。

综合评估表明,该框架在内容保真度和美学质量方面达到了当前领先水平。与专门处理单一任务的智能体相比,PaperX在显著提升成本效率的同时,保持了卓越的性能。该研究为自动化、高质量的学术内容传播提供了一种高效且统一的解决方案。

客服微信
客服微信