Gemma 是 Google 推出的一系列轻量级、最先进的开放模型,采用与创建 Gemini 模型相同的研究和技术构建。它们是文本到文本、仅限解码器的大型语言模型,提供英语版本,具有开放权重、预训练变体和指令调整变体。了解详情>>
Gemma 模型非常适合各种文本生成任务,包括问答、摘要和推理。它们的尺寸相对较小,因此可以将它们部署在资源有限的环境中,例如笔记本电脑、台式机或您自己的云基础设施,从而实现对最先进人工智能模型的民主化访问,并帮助促进每个人的创新。
这些模型在包含各种来源、总计 6 万亿个tokens的文本数据集上进行训练。以下是关键组件:
这些不同数据源的组合对于训练可以处理各种不同任务和文本格式的强大语言模型至关重要。
以下是应用于训练数据的关键数据清理和过滤方法:
Gemma-2B模型来源于第三方,百度智能云千帆大模型平台不保证其合规性,请您在使用前慎重考虑,确保合法合规使用并遵守第三方的要求。 具体请查看基础模型的开源协议 Gemma使用条款及模型开源页面展示信息等。 如您发现模型/数据集/文件等有任何问题,请及时联系我们处理。 由于机器学习特性,就相同的输入可能产生不同的输出结果,请您注意甄别。