一、基本信息
- 全称:BigScience Large Open-science Open-access Mul-tilingual Language Model(大科学大型开放科学开放访问多语言语言模型)
- 缩写:BLOOM
- 定位:旨在为学术界、非营利组织和小型公司的研究实验室提供更好的研究和使用大型语言模型(LLM)的机会。
二、技术细节
- 模型类型:
- BLOOM是一个开源的、仅解码器的转换器模型。
- 它在Megatron-LM GPT2的基础上进行了修改训练。
- 参数规模:
- BLOOM拥有176B参数,与GPT-3具有相同的规模。
- 训练数据:
- 训练集包含了46种自然语言和13种编程语言,总共1.5TB的预处理文本转化为350B的唯一token。
- 使用了一个名为ROOTS的语料库,该语料库是59种语言的数百个来源的数据集。
- 训练过程:
- 训练过程在法国巴黎的Jean Zay超级计算机上进行,耗时117天(从2022年3月11日至7月6日)。
- 训练成本超过300万欧元,由CNRS和GENCI提供算力支持。
- 性能表现:
- BLOOM在各种基准测试中均取得了显著的性能,并在多任务提示微调后获得了更好的结果。
三、参与人员与组织
- 参与者:来自60多个国家和250多个机构的1000多名研究人员参与了BLOOM的项目。
- 发起组织:BLOOM是由HuggingFace、GENCI和IDRIS发起的开放式协作组织发布。
四、意义与影响
- 民主化访问:BLOOM的出现标志着语言模型技术民主化的重大进步,使得更多机构和个人能够访问和使用到高质量的大型语言模型。
- 国际合作:BLOOM不仅是技术上的奇迹,也是国际合作和集体科学追求力量的象征。
五、版本更新
- 初始版本:于2022年5月19日发布。
- 最新版本:截至当前时间(2024年6月),最新版本为2022年7月6日发布的1.3版本。
六、应用前景
- 多领域应用:BLOOM可以应用于各种领域,如社交网络分析、推荐系统、自然语言处理等。
- 持续优化:随着技术的不断进步和研究的深入,BLOOM的性能和应用范围将会得到进一步的提升和拓展。
数据统计
数据评估
关于BLOOM特别声明
本站智趣AI甄选提供的BLOOM都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由智趣AI甄选实际控制,在2024 年 6 月 2 日 下午2:34收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,智趣AI甄选不承担任何责任。
相关导航
暂无评论...