Web前端开发网

fly63.com

首页 资源 工具 文章 教程 栏目
  • 在线搜索
  • 文章标签
  • 广告合作
  • 赞助一下
  • 关于我们
资源推荐
豆包AI
字节跳动旗下 AI 智能助手
沁言学术
AI智能学术研究平台,覆盖科研全流程服务
爱派AiPy
一款可本地部署的AI智能体,帮你操作电脑、手机、服务器设备
扣子Coze
职场AI,就用扣子
星月写作
人工智能写作助手
fly63工具箱
简单、易用、便捷的在线工具
周易国学网
基于周易、八字、紫微斗数等传统国学文化
免费资源下载中心
一站式解决工作学习需求的宝藏网站
Trae
字节跳动推出的 AI原生编程工具
奇绘馆AI视频
新一代AI视频创作平台

资源分类

AI智能 酷站推荐 招聘/兼职 框架/库 模块/管理 移动端UI框架 Web-UI框架 Js插件 Jquery插件 CSS相关 IDE环境 在线工具 图形动效 游戏框架 node相关 调试/测试 在线学习 社区/论坛 博客/团队 前端素材 图标/图库 建站资源 设计/灵感 IT资讯
网站收录 / 问题反馈

Firefly(流萤)

分享
复制链接
新浪微博
QQ 好友

扫一扫分享

GitHub:https://github.com/yangjianxin1/Firefly
描述信息:中文对话式大语言模型
GitHub

Firefly(流萤): 中文对话式大语言模型(全量微调+QLoRA),支持微调Mixtral-8x7B、Zephyr、Mistral、Aquila2、Baichuan2、CodeLlama、Llma2、Llama、Qwen、Baichuan、ChatGLM2、InternLM、Ziya、Bloom等大模型。


项目简介

Firefly(流萤) 是一个开源的中文大语言模型项目,支持QLoRA和全量参数微调Baichuan2、CodeLLaMA、LLaMA2、LLaMA、Qwen、Baichuan、ChatGLM2、InternLM、Ziya、Bloom、XVERSE等开源模型。 正如我们的项目名称一样,希望本项目能够像流萤一般发出淡淡微光,为中文大语言模型社区尽绵薄之力,促进中文大语言模型社区的发展。

如果你的训练资源有限,我们极力推荐使用QLoRA的指令微调方式,因为我们在Open LLM Leaderboard上验证了该方法的有效性,详情见模型评测章节。

流萤(萤火虫的别称)是中华传统文化的一个符号,虽说腐草为萤,带有悲悯意味,但萤火虽小,也能凭借其淡淡荧光,照亮夜空。本项目的名称取自杜牧的《秋夕》:银烛秋光冷画屏,轻罗小扇扑流萤。


项目内容

项目主要内容如下:

支持全量参数指令微调、QLoRA低成本高效指令微调、其中QLoRA是我们主推的一种高效的训练方式。

支持绝大部分主流的开源大模型,如Baichuan2、CodeLLaMA、LLaMA2、LLaMA、Qwen、Baichuan、ChatGLM2、InternLM、Ziya、Bloom、XVERSE等。

支持lora与base model进行权重合并,推理更便捷。

模型裁剪:通过LLMPruner:大语言模型裁剪工具 ,开源裁剪后的Bloom模型权重 。在保留预训练中文知识的前提下,有效减少模型参数量,降低训练成本,提高训练效率。

整理并开源指令微调数据集:firefly-train-1.1M 、moss-003-sft-data、ultrachat、 WizardLM_evol_instruct_V2_143k、school_math_0.25M。

开源Firefly系列指令微调模型权重 。

在Open LLM Leaderboard上验证了QLoRA训练流程的有效性。


安装环境

在requirements.txt下固定了几个主要的python包的版本,执行如下脚本即可。

注意:Baichuan2需要安装pytorch 2.0。除Baichuan2以外,其他模型的训练,我们均在torch==1.13上进行训练。

pip install requirements.txt


仅供个人学习参考/导航指引使用,具体请以第三方网站说明为准,本站不提供任何专业建议。如果地址失效或描述有误,请联系站长反馈~感谢您的理解与支持!

链接: https://fly63.com/nav/4041

更多»
热门资源
豆包AI
字节跳动旗下 AI 智能助手
官网
扣子Coze
职场AI,就用扣子
官网
DeepSeek
幻方量化公司旗下的开源大模型平台
官网
GitHub
码上飞(CodeFlying)
用一句话自动生成小程序、APP、H5网页应用
官网
01Agent
AI内容创作智能体,选题+创作+排版+多平台分发
官网
AiPPT
全智能AI一键生成 PPT
官网
堆友AI
零门槛,多风格AI绘画免费生成,电商海报设计神器
官网
Trae
字节跳动推出的 AI原生编程工具
官网
美图设计室
AI智能一键生成海报,免费平面设计
官网
爱派AiPy
一款可本地部署的AI智能体,帮你操作电脑、手机、服务器设备
官网
SpeedAI
一键去重、降AIGC率、数据可视化、论文写作
官网
Seedance 2.0
字节跳动新一代AI视频生成模型全面解析
官网
类似于Firefly(流萤)的资源
Gemini
Google 推出的一款对话式 AI 工具
官网
10WEB
一个基于Elementor的人工智能驱动的网站建设工具
官网
妙言妙语AI
集成多款顶级大模型
官网
LangBot
大模型时代的即时通信机器人平台
官网
GitHub
Context Engineering
告别智能体健忘症,管理AI模型上下文
点击进入
GitHub
Imagen
GoogleAI文字到图像生成模型
官网
Quivr
一个开源的「第二大脑」工具
官网
GitHub
RoboNeo
美图公司推出的专注影像生产力场景的 AI 视觉设计智能体
官网
目录

手机扫一扫预览

》
分享组件加载中...
首页 技术导航 在线工具 技术文章 教程资源 前端标签 AI工具集 前端库/框架 实用工具箱 广告合作 关于我们

Copyright © 2018 Web前端开发网 All Rights Reserved. 提供免费在线工具、编程学习资源(教程/框架/库),内容以学习参考为主,助您解决各类实际问题,快速提升专业能力。