Firefly(流萤)_中文对话式大语言模型

Web前端开发网

fly63.com

首页资源工具文章教程栏目

Firefly(流萤)

分享

GitHub:https://github.com/yangjianxin1/Firefly

描述信息:中文对话式大语言模型

GitHub

Firefly(流萤): 中文对话式大语言模型(全量微调+QLoRA)，支持微调Mixtral-8x7B、Zephyr、Mistral、Aquila2、Baichuan2、CodeLlama、Llma2、Llama、Qwen、Baichuan、ChatGLM2、InternLM、Ziya、Bloom等大模型。

项目简介

Firefly(流萤) 是一个开源的中文大语言模型项目，支持QLoRA和全量参数微调Baichuan2、CodeLLaMA、LLaMA2、LLaMA、Qwen、Baichuan、ChatGLM2、InternLM、Ziya、Bloom、XVERSE等开源模型。正如我们的项目名称一样，希望本项目能够像流萤一般发出淡淡微光，为中文大语言模型社区尽绵薄之力，促进中文大语言模型社区的发展。

如果你的训练资源有限，我们极力推荐使用QLoRA的指令微调方式，因为我们在Open LLM Leaderboard上验证了该方法的有效性，详情见模型评测章节。

流萤（萤火虫的别称）是中华传统文化的一个符号，虽说腐草为萤，带有悲悯意味，但萤火虽小，也能凭借其淡淡荧光，照亮夜空。本项目的名称取自杜牧的《秋夕》：银烛秋光冷画屏，轻罗小扇扑流萤。

项目内容

项目主要内容如下：

支持全量参数指令微调、QLoRA低成本高效指令微调、其中QLoRA是我们主推的一种高效的训练方式。

支持绝大部分主流的开源大模型，如Baichuan2、CodeLLaMA、LLaMA2、LLaMA、Qwen、Baichuan、ChatGLM2、InternLM、Ziya、Bloom、XVERSE等。

支持lora与base model进行权重合并，推理更便捷。

模型裁剪：通过LLMPruner：大语言模型裁剪工具，开源裁剪后的Bloom模型权重。在保留预训练中文知识的前提下，有效减少模型参数量，降低训练成本，提高训练效率。

整理并开源指令微调数据集：firefly-train-1.1M 、moss-003-sft-data、ultrachat、 WizardLM_evol_instruct_V2_143k、school_math_0.25M。

开源Firefly系列指令微调模型权重。

在Open LLM Leaderboard上验证了QLoRA训练流程的有效性。

安装环境

在requirements.txt下固定了几个主要的python包的版本，执行如下脚本即可。

注意：Baichuan2需要安装pytorch 2.0。除Baichuan2以外，其他模型的训练，我们均在torch==1.13上进行训练。

pip install requirements.txt

仅供个人学习参考/导航指引使用，具体请以第三方网站说明为准，本站不提供任何专业建议。如果地址失效或描述有误，请联系站长反馈～感谢您的理解与支持！

链接: https://fly63.com/nav/4041

热门资源

字节跳动旗下 AI 智能助手

官网

职场AI，就用扣子

官网

幻方量化公司旗下的开源大模型平台

官网

GitHub

码上飞(CodeFlying)

用一句话自动生成小程序、APP、H5网页应用

官网

AI内容创作智能体，选题+创作+排版+多平台分发

官网

全智能AI一键生成 PPT

官网

零门槛，多风格AI绘画免费生成，电商海报设计神器

官网

字节跳动推出的 AI原生编程工具

官网

美图设计室

AI智能一键生成海报，免费平面设计

官网

一款可本地部署的AI智能体，帮你操作电脑、手机、服务器设备

官网

一键去重、降AIGC率、数据可视化、论文写作

官网

字节跳动新一代AI视频生成模型全面解析

官网

类似于Firefly(流萤)的资源

Google 推出的一款对话式 AI 工具

官网

一个基于Elementor的人工智能驱动的网站建设工具

官网

集成多款顶级大模型

官网

大模型时代的即时通信机器人平台

官网

GitHub

Context Engineering

告别智能体健忘症,管理AI模型上下文

GitHub

GoogleAI文字到图像生成模型

官网

一个开源的「第二大脑」工具

官网

GitHub

美图公司推出的专注影像生产力场景的 AI 视觉设计智能体

官网