极速模型

秘塔AI搜索​全新 “极速” 模型上线,实现400 tokens /秒极速响应

秘塔 AI 搜索推出了全新的 “极速” 模型,标志着其在人工智能搜索技术上的重大突破。通过创新的技术手段,秘塔 AI 搜索的响应速度达到了令人惊叹的400tokens / 秒,确保大部分问题在2秒内就能得到答案。这一进步不仅提升了用户体验,也显著提高了信息获取的效率。此次 “极速” 模型的实现得益于多项先进技术的应用。秘塔 AI 团队在 GPU 上进行了 kernel fusion 的优化,同时在

秘塔AI搜索推出全新“极速”模型:最高400 tokens/秒响应速度

近日,秘塔AI搜索正式推出全新“极速”模型,为用户带来更高效、精准的搜索体验。秘塔AI搜索团队通过在GPU上进行kernel fusion技术,以及在CPU上实施动态编译优化策略,成功在单张H800GPU上实现了最高400tokens/秒的响应速度,大部分问题能在2秒内给出答案。为了让用户更真切地感受新模型的速度,秘塔AI搜索还特别搭建了一个测速站点(kuai.metaso.cn),用户可随时输入