产品评测 3天前 56 阅读 0 评论

4款AI PPT大横评:扣子空间脱颖而出,用户指令决定最终表现

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

让AI做好PPT的关键,在于用户。


最近,小雷的朋友被 PPT 任务 “缠身”,在群里讨论起当下 AI 模型生成 PPT 的质量问题。小雷本以为这项技术已相当成熟,没想到仍存在不少漏洞,这也恰好提供了一个好素材 ——AI 生成 PPT 到底靠不靠谱?


为解答这个疑问,雷科技筛选了目前国产领域支持生成 PPT 的 4 个 AI 助手,分别是百度文库、Kimi、夸克 AI、扣子空间,它们搭载的大模型各不相同,但均支持 “一句话生成 PPT” 与 “根据文档内容生成 PPT” 功能,也就是说,都具备自主生成 PPT 内容的能力。


图源:雷科技


本次实测便围绕上述两个核心功能展开,向 4 款 AI 输入相同的文字信息与文档信息,目的是测试它们自主生成 PPT 内容的能力,以及依据用户提供内容生成 PPT 的能力。小雷选择了职场常用的 “年终述职报告” 作为测试场景,为检验 AI 生成是否存在偏差,还在输入信息中加入了相关产品数据。


为避免争议,先说明相关PPT的数据均为虚构,与实际情况无关。


PPT 与文章不同,需配合用户口述呈现,因此要求内容简洁明了,每张幻灯片的信息需清晰易懂,重点内容必须突出,不能与普通内容混杂;同时,PPT 的美观度也至关重要,涉及文字排版、图片排版等细节,图文是否匹配更是关键评价维度。为此,小雷还邀请了十位打工人,让她们对 4 款 AI 生成的 PPT 进行“盲评”。


AI PPT颜值PK:扣子空间赢麻了


测试正式开始,以下这段包含大量销量数据(涵盖手机、平板销量及产品份额等)的文字,将作为统一输入文本,录入各 AI PPT 助手的对话框中,以此增加测试难度:


“我是手机业务部门的产品经理,本年度手机总销量达 500 万台,同比增长 15%,其中高端旗舰系列贡献 40% 销量,共计 200 万台;平板销量突破 50 万台,全年销量预计达 250 万台。手机产品市场份额提升 2 个百分点,增至 18%;平板产品在海外市场份额增长 5%,其中东南亚市场销量增长 30%。请根据这些数据,帮我制作一份 15-20 页的年终述职报告 PPT,需支撑至少 8 分钟的述职时长。”


所有 AI 生成 PPT 时,均直接选择其推荐的第一个模板。美观度评价将围绕 6 个标准展开:文字美观度、图片美观度、图文匹配度、图标元素美观度、易读易懂性,每个维度满分 10 分,总分 60 分。


4款AI PPT大横评:扣子空间脱颖而出,用户指令决定最终表现

图源:雷科技


需说明的是,本次测试仅邀请 10 人参与评价,美观度等维度存在主观倾向,大家可当作参考,文中也附上了 PPT 原图供对比。


夸克、扣子空间、百度文库、Kimi


先看结论再谈体验:问卷调查结果(表格中为 10 人评分平均值)显示,在文字美观度、图片美观度及图标元素美观度这三个维度,四款 AI 生成的 PPT 差距不大。


图源:雷科技


可见,这类基础排版与图片搭配,大多可通过 “套模板” 的方式完成 PPT 整体构建。因此,在基础文字组织与图片搭配上,借助模板格式就能实现较好的观感。可以看出在「颜值」方面,四款 AI 并未拉开明显差距。


差距出在 “图文匹配度” 上:Kimi 与夸克 AI 的表现相当一般。Kimi 生成的 PPT 中仅包含一张图片,尽管图片边框、色调等细节经过处理,更贴合整体风格,但在呈现手机、平板市场份额的页面中,搭配的却是笔记本电脑图片,匹配度较差;夸克 AI 也存在类似问题 —— 图片细节符合模板风格,但图片选择与内容脱节,因此二者在该维度评分明显偏低。


图源:雷科技


而扣子空间在 “数据呈现” 与 “易读易懂性” 两个维度的评分,呈现出近乎碾压的优势。从低分表现看到高分表现,才能真正明白差距所在。前文提到,输入 AI 的文字信息中包含大量数据,而 PPT 的核心需求是将数据置于显眼位置突出呈现 —— 可通过放大高亮、排版分点等方式,用图表展示则更为简洁直观。


但实际测试中,多数 AI 未能做到这一点:大量数据与文字混杂,既无放大高亮,也无图表辅助,观感极差,无法让人直观获取手机销量、产品份额等关键信息。其中,Kimi 的问题最为突出:它只是将深度加工后的文案分点插入 PPT 模板,导致页面文字信息量过大,且口语化现象严重,完全未区分需重点突出的数据,仅按模板格式机械代入内容。


图源:雷科技


夸克 AI 也存在类似问题,但表现形式不同:它将数据分点后套入模板,却未补充任何辅助信息,页面仅散落着少量图标与文字;幸好模板本身区分了字体大小,否则整体观感会进一步下滑。


百度文库的表现稍好:它将核心数据归纳在页面正上方,以标题形式突出,正文部分则加入了深度加工的内容。但问题在于,百度文库出现了明显的 “AI 幻觉”—— 生成了原文中未提及的数据,如 “线下门店数量”“市场渗透率” 等,且未标注数据来源,这一问题对 PPT 实用性影响较大。


图源:雷科技


再看评分最高的扣子空间:4 款 AI 中,仅有「扣子空间」自主生成了图表,且经过深度思考,额外加入了手机全球销量分析、未来展望等内容,完全符合年终述职报告的需求。更值得一提的是,扣子空间在补充数据时,会明确标注来源网址,用户可直接点击验证数据可靠性,有效避免了虚假数据问题。


图源:扣子空间


其生成的图表不仅包含用户提供的数据,还加入了与华为、OPPO、vivo 等品牌的对比数据;图表比例无错误,格式选择也十分合理 —— 销量数据用柱状图对比,市场份额用饼状图呈现。


图源:雷科技


此外,其他 3 款 AI 均是按输入文字的顺序(先数据、后延展内容)机械生成 PPT,逻辑连贯性较差;而扣子空间则展现出 “自主思考” 能力:它将数据拆解重组,构建了完整的逻辑框架 —— 从全球电子市场态势切入,分析本公司手机销量与市场竞争关系,最后呈现年终销量分析。


图源:雷科技


整个过程纳入了友商数据进行对比,结尾还给出了分析结果,观感极佳。不过,扣子空间存在一处小问题:部分图表出现出框现象,推测是生成尺寸与模板不匹配导致,整体影响不大。由此可见,在数据呈现与易读易懂性上,扣子空间的表现远超其他 AI,这是它的核心优势。


用户上传文档生成PPT:百度文库进步明显


第二部分测试为 “上传文档生成 PPT”:小雷准备了一篇 2000 字的述职报告(可视为上文文字信息的延伸),内容分为 “年度目标”“全年成绩”“挑战困境”“未来规划”“结语” 五个板块,其中包含与前文相同的数据分析。


本次测试旨在观察:在限制 AI 自由发挥的前提下,4 款 AI 生成 PPT 的表现如何?


在文档逻辑的约束下,4 款 AI 生成的 PPT 均未出现明显逻辑问题,均按演讲稿顺序构建框架,但前文提及的问题不仅依然存在,还因文档内容更丰富而暴露得更明显。Kimi AI 与夸克 AI “套模板” 的问题依旧突出:Kimi 甚至完全放弃自主生成图片,所有图片均沿用模板格式,且与文档内容无关;图标元素与文字排版混乱,完全按模板格式硬套演讲稿内容,“无重点” 的劣势被进一步放大,使用体验较差。


图源:雷科技


夸克 AI 的表现与之类似 —— 对比两款 AI 生成的 PPT,能发现相同的模板格式,仅做了轻微调整。夸克擅长简约风格,但在降低制作复杂度的同时,也牺牲了内容质量:页面依旧平淡无奇,既未突出重点,甚至还对普通内容进行了高亮标记,本质上就是 “模板提供格式、文档提供内容” 的简单拼接,无法满足优质 PPT 的需求。


图源:雷科技


百度文库在输入详细文档后,表现有明显进步:省去了自主补充内容的环节,整体逻辑更清晰,完全按演讲稿顺序执行;同时,它将重点内容拆分呈现,例如将手机端销量与平板端销量单独放在一页幻灯片中,突出核心信息。可惜的是,百度文库未通过高亮标记或其他方式突出数据,仅做了统一展示;不过,得益于简洁的风格,数据信息未被掩盖,基本能独立完成 PPT 内容的展示需求。


图源:雷科技


扣子空间的表现依旧亮眼:它未自主构建逻辑,与百度文库类似,通过提取关键数据单独制作页面,但整体呈现效果更优 —— 数据采用 “放大 + 高亮” 标注,图片排版也不会抢占文字主体地位(通过渐变暗色虚化图片背景),让文字信息更突出。同时,扣子空间图表制作的优势依然明显,且图表与图标搭配形成了舒适的视觉效果,无杂乱感;深色底色与同色系字体相得益彰,真正呈现出了优质 PPT 应有的质感。


图源:雷科技


结论:让AI做好PPT,关键在于用户指令


在使用 4 款 AI 生成 PPT 后,小雷认为:让 AI 明确需求是关键,指令必须精准 —— 包括排版顺序、文字格式、图片风格等,能细化的需求尽量细化。当前的 AI 模型无法自主预判用户需求,必须根据用户的分步指令生成内容,才能达到预期效果。


例如,百度文库 PPT 助手的 “单页生成” 功能就很实用:用户可通过指定主题内容生成单页 PPT,既能避免逻辑混乱问题(完全按用户逻辑构建),最后串联成完整 PPT 即可;同时,单页生成也让数据检查更便捷。


而 “数据检查” 这一步至关重要:使用 AI 生成内容时,必须对照正确数据反复核验。当前 AI 难以分辨信息真伪,仅通过算法推测生成内容,因此扣子空间标注数据来源的设计十分实用 —— 用户可直接验证信息准确性,有效规避 AI 幻觉。


综合本次测试来看,扣子空间与百度文库均具备独立生成 PPT 的能力,其中百度文库需进行少量后期修改(如突出数据重点);而夸克 AI 与 Kimi AI 在 PPT 内容构建上仍存在明显短板,期待后续更新能带来改进。


最后,让我们以未参与本次测试的豆包 AI 对这些 PPT 的评分,为本次实测画上句号。



在豆包AI的评价中,扣子空间几乎完胜,也不知道是不是同出一门的原因,看来这AI的情商确实是高啊。


文章来自于“雷科技”,作者“雷科技”。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!