阿里巴巴通义千问7B大模型开源

通义千问-7B(Qwen-7B) 是阿里云研发的通义千问大模型系列的70亿参数规模的模型。Qwen-7B是基于Transformer的大语言模型, 在超大规模的预训练数据上进行训练得到。预训练数据类型多样,覆盖广泛,包括大量网络文本、专业书籍、代码等。同时,在Qwen-7B的基础上,我们使用对齐机制打造了基于大语言模型的AI助手Qwen-7B-Chat。本仓库为Qwen-7B-Chat的仓库。

如果您想了解更多关于通义千问-7B开源模型的细节,我们建议您参阅Github代码库。https://github.com/modelscope/modelscope
[原文链接]

上一篇:

下一篇:

发表回复

登录后才能评论