开源项目 5月前 • 203 阅读 • 0 评论

开源AI操作系统NeuralOS：成功模拟Windows，并预测屏幕图像！

作者头像

AI中国

AI技术专栏作家 | 发布了 246 篇文章

HuggingFace

HuggingFace

0秒前

当卡帕西在今年 5 月预言 “未来的图形用户界面（GUI）将是为每个用户量身打造的流动、魔幻、可交互的 2D 画布” 时，或许没人想到，这一构想会如此迅速地照进现实！

由滑铁卢大学和加拿大国家研究委员会的 5 位研究人员（其中 4 位为华人）联合开发的 NeuralOS，

通过神经网络直接模拟操作系统界面，实现了 “根据用户操作预测下一帧屏幕图像” 的核心能力，为下一代人机交互系统开辟了全新路径！

突破传统：用神经网络画”出操作系统

传统操作系统的界面由固定代码逻辑驱动，按钮位置、窗口样式都是预设的；而 NeuralOS 彻底颠覆了这一模式 :它不依赖硬编码的界面规则，而是通过 AI 学习操作系统的运行逻辑，直接生成动态变化的屏幕画面。

其核心由两个模块协同工作：

循环神经网络（RNN）：像 “系统记忆” 一样，实时跟踪计算机的状态变化，包括当前打开的软件、鼠标位置、光标状态等，确保对用户操作的响应连贯不脱节。
基于扩散的神经渲染器（Renderer）：根据 RNN 记录的状态和用户操作（如点击 “浏览器” 图标、拖动窗口），生成对应的屏幕图像，包括窗口弹出、菜单展开、图标变色等视觉细节。

简单来说，当你移动鼠标时，RNN 会 “记住” 光标位置，渲染器则立刻生成光标移动后的画面；点击 “关机” 按钮时，RNN 捕捉到这一操作，渲染器便生成关机确认窗口 —— 整个过程如同 AI 在 “实时手绘” 操作系统界面。

实测表现：逼真度拉满，但仍有短板

目前，NeuralOS 的实测效果已展现出惊人潜力：

画面逼真：连续操作时，界面从桌面到打开文件夹、再到关闭窗口的变化，与真实系统几乎无异。
鼠标响应精准：移动鼠标时，光标位置与操作完全同步；点击图标（如 “关机” 按钮）能触发正确的反馈窗口。

状态转换可靠：启动应用、切换窗口等系统状态变化逻辑清晰，不会出现 “点计算器却弹出浏览器” 的混乱情况。

不过，它仍有明显局限：对键盘精细操作的处理能力较弱，尤其是快速打字时，可能出现字母顺序错乱或显示延迟。这也意味着，NeuralOS 目前更擅长处理视觉交互，对文本输入的实时性支持还需优化。

NeuralOS 的意义，远不止于 “模拟一个操作系统”。它证明了AI 可以动态生成符合用户习惯的交互界面，打破了传统操作系统 “界面固定、逻辑硬编码” 的桎梏。

未来，这种 “生成式神经接口” 或许能实现：

根据用户使用习惯自动调整界面布局（如频繁使用的软件图标自动前置）；
为残障用户生成适配其操作方式的特殊界面；
甚至让 “操作系统” 摆脱屏幕限制，在 AR/VR 环境中生成三维交互空间。

目前，团队已推出在线体验版，用户可在蓝色框内通过鼠标点击、键盘输入与系统交互，并支持切换 “RNN 模式”“自动帧生成” 等功能。

在线Demo：https://neural-os.com/

开源地址：
https://huggingface.co/papers/2507.08800

#AI开源项目推荐##github##AI技术##AI浏览器未来#

作者头像

AI前线

专注人工智能前沿技术报道，深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了！视频分析功能将极大扩展AI的应用场景，特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度？我们正在开发一个实时视频分析应用，非常关注性能表现。

作者头像

AI前线作者

12小时前

我们测试的平均响应时间在300ms左右，比上一代快了很多，适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平，这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用！

文章章节

1. GPT-4简介与注册指南

1.1 账号注册步骤

推荐文章

速抢（2核2G）77元/年香港免备案服务器

速抢（2核2G）77元/年香港免备案服务器

0秒前 • 开源项目

超大参数量具身VLM开源：首创DPPO训练范式，模型性价比天花板

超大参数量具身VLM开源：首创DPPO训练范式，模型性价比天花板

1月前 • 开源项目

用了Rust，谷歌实测：Android上内存漏洞率比C/C++低1000倍！

用了Rust，谷歌实测：Android上内存漏洞率比C/C++低1000倍！

1月前 • 开源项目

全球最大开源具身大模型！中国机器人跑完马拉松后开始学思考

全球最大开源具身大模型！中国机器人跑完马拉松后开始学思考

1月前 • 开源项目

刚刚，华为AI推理大招开源，时延降90%，吞吐提22倍，上下文10倍级扩展

刚刚，华为AI推理大招开源，时延降90%，吞吐提22倍，上下文10倍级扩展

1月前 • 开源项目

AI的开源战略

AI的开源战略

1月前 • 开源项目

开源即爆火！英伟达重磅推出OmniVinci全模态大模型

开源即爆火！英伟达重磅推出OmniVinci全模态大模型

1月前 • 开源项目

国际刑事法院也“踢掉”了微软Office！因邮箱一度“被封”，决定改为开源替代品openDesk

国际刑事法院也“踢掉”了微软Office！因邮箱一度“被封”，决定改为开源替代品openDesk

1月前 • 开源项目

热门标签

PikaTwists Eywa 曹德龙车辆舒适度 AI Agents 免费转录工具 AskPhotos 外卖业务 AI编程模型 Flowith

热门作者

作者头像

AI前沿

2.4k 粉丝

作者头像

机器学习实验室

1.8k 粉丝

作者头像

AI创业圈

3.1k 粉丝