8 月 22 日 -23 日,首届AICon 全球人工智能开发与应用大会深圳站即将拉开帷幕。本次大会将聚焦 Agent、多模态、AI 产品设计等热门方向,围绕企业如何通过大模型降低成本、提升经营效率的实际应用案例,邀请来自阿里、腾讯、字节跳动、微软、华为等头部企业以及商汤、Plaud、Rokid 等 AI 明星公司的专家,分享 AI 落地实战经验。一起探索 AI 应用的更多可能,发掘 AI 驱动业务增长的新路径!
火山引擎 AI 数据湖服务架构师琚克俭已确认出席并发表题为《LAS Daft 多模态数据引擎的架构与应用》的主题分享。在 AI 应用加速演进的背景下,如何高效处理和调度海量、多模态数据,已成为构建高质量 AI 系统的关键挑战之一。本演讲将介绍火山引擎面向 AI 任务推出的数据处理引擎——LAS Daft。该系统基于云原生湖仓一体架构,结合开源分布式执行引擎 Daft,支持图文、音视频、点云等多模态数据的统一处理,覆盖数据清洗、格式转换、零拷贝对接训练框架等关键环节。
演讲将重点解析 Daft 在分布式 Python 计算、多模算子处理、流式调度等方面的核心设计,以及在智能驾驶大规模数据处理、LLM 离线推理等实际应用场景中的落地经验,探讨如何在保证成本可控的前提下,实现 AI 数据处理能力的可扩展性与工程化落地。
琚克俭是火山引擎 AI 数据湖服务架构师,拥有 10 年 + 大数据领域实战经验,深耕数据架构设计、AI Infra 的构建。曾先后就职于字节跳动(EMR/LAS 核心团队)、阿里巴巴数据库、蚂蚁等团队,参与多项基础设施的平台构建,在大吞吐、低延迟的离线和实时数据引擎开发等领域具备丰富经验。他在本次会议的详细演讲内容如下:
演讲提纲:
1、Daft 背景及定位
2、Daft 核心场景介绍
Python 计算分布式
流式异构调度
多模算子处理
图文混排
AI 数据湖的 Python 生态圈
3、Daft 技术原理介绍
执行框架介绍
4、Daft 大规模数据处理实践案例
智驾(大规模离线处理数据)
LLM 离线推理
5、未来展望
听众收益:
了解 AI 时代下多模态数据高效处理的技术需求
了解 LAS 结合 Daft 在数据预处理、训练加载上的实践
除此之外,本次大会还策划了AI Infra、AI 产品研发与商业落地探索、Agent 应用新范式与 MCP 生态实践、AI 驱动业务重塑与提效、智能硬件与具身智能创新实践、AI 原生时代的卓越架构治理、、多模态与空间智能技术创新、Agent + Data 落地探索、AI 赋能研发体系变革、Agent 核心技术与系统架构创新、大模型在金融领域的创新实践等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 70+资深专家在 AICon 深圳站现场带来前沿技术洞察和一线实践经验。
目前,所有大会演讲嘉宾已结集完毕,了解更多报名和详情可扫码或联系票务经理 13269078023 咨询。
