Stable Vicuna

训练模型 ,AI训练模型 ,Stability AI AI视频

Stable Vicuna

作者头像

1年前 225 阅读

4.8 (1280评分)

15,328人已学习

StableVicuna，这是第一个通过人类反馈强化学习（RHLF）训练的大规模开源聊天机器人。StableVicuna是Vicuna v0 13b的进一步指令微调和RLHF训练版本，它是一个指令微调的LLaMA 13b模型。

同样，这里有一些基准，显示了与其他类似规模的开源聊天机器人相比，StableVicuna的整体性能。

为了实现StableVicuna的强大性能，我们利用Vicuna作为基础模型，并遵循Steinnon等人和Ouyang等人概述的典型的三阶段RLHF管道。使用三个数据集，通过监督微调（SFT）进一步训练基础Vicuna模型：

教程评分

4.8 (1280 人评分)

学习讨论 (42)

用户头像

初学者

2天前

非常棒的教程！

作者头像

AI导师李明作者

1天前

多谢

文章章节

1. GPT-4简介与注册指南

1.1 账号注册步骤

推荐文章

OmniVinci – NVIDIA推出的全模态大语言模型

OmniVinci – NVIDIA推出的全模态大语言模型

7月前 • AI视频

SAIL-Embedding – 抖音联合港中文推出的全模态嵌入模型

SAIL-Embedding – 抖音联合港中文推出的全模态嵌入模型

7月前 • AI视频

FG-CLIP 2 – 360开源的双语细粒度视觉语言对齐模型

FG-CLIP 2 – 360开源的双语细粒度视觉语言对齐模型

7月前 • AI视频

速抢（2核2G）77元/年香港免备案服务器

速抢（2核2G）77元/年香港免备案服务器

0秒前 • AI视频

Handy – 开源的语音转文字桌面应用，完全离线

Handy – 开源的语音转文字桌面应用，完全离线

7月前 • AI视频

UniWorld V2 – 兔展智能联合北大推出的图像编辑模型

UniWorld V2 – 兔展智能联合北大推出的图像编辑模型

7月前 • AI视频

讯飞星火X1.5 – 科大讯飞推出的深度推理大模型

讯飞星火X1.5 – 科大讯飞推出的深度推理大模型

7月前 • AI视频

UNO-Bench – 美团LongCat推出的全模态大模型评测基准

UNO-Bench – 美团LongCat推出的全模态大模型评测基准

7月前 • AI视频

热门标签

模型API接入自媒体运营技巧分享 VEED 专精特新 3D数字人智慧 6GB显存 AI推理逻辑可乐

热门作者

作者头像

AI前沿

2.4k 粉丝

作者头像

机器学习实验室

1.8k 粉丝

作者头像

AI创业圈

3.1k 粉丝