kiln微调大模型-使用deepseek R1去训练一个你的具备推理能力的chatGPT 4o

news/2025/2/27 6:06:42

前言

        随着deepseek的爆火,对于LLM的各种内容也逐渐步入我的视野,我个人认为,可能未来很长一段时间,AI将持续爆火,进入一段时间的井喷期,AI也会慢慢的走入我们每个家庭之中,为我们的生活提供便利,由此出发,我将在接下的内容里面给大家讲一下如何使用kiln.ai去微调你自己的大模型

微调工具介绍

        本文使用的为最简单的kiln AI,Kiln AI 是一款开源的 AI 开发工具,能够简化大型语言模型大型语言模型(LLM)的微调、合成数据生成和数据集协作。它提供直观的桌面应用程序,支持 Windows、MacOS 和 Linux,用户可以基于零代码方式对多种模型进行微调并自动部署。

        如果你看完本文觉得很简单,可以去尝试进阶版的unsloth和其他的微调工具,功能会更加强大,具备更多功能

(下图来自b站up九析,大家可以去up那学习一下,我讲的可能还有很多不到位的)

 安装kiln AI

下载连接:Kiln 的 GitHub 发布页面大型语言模型

(因为是github链接,需要翻墙)

下图为Windows安装包

 下载解压好后双击运行就行

安装运行之后会在网页打开一个标签页

这样就安装好了 

开始训练微调数据集 

接下来我们需要用到ollama蒸馏的deepseek R1 14b模型(因为低于14b在继续数据集训练时会出错)和open ai的key

【我后面会专门出一个安装ollama,并在本地上跑的教程,暂时不会的小伙伴可以先了解流程后续实践一下】

 

点击GET STARTED我们开始kiln AI微调的大门

 在这里连接本地的ollama和openAI的key

 

创建你的项目名 ,也可以直接用案例

接着编写你这个项目的要求和任务(可以理解为你想这个智能体成为什么样的人),我这也是直接使用的案例(创建一个笑话生成器) 

 

run这里写入你的主题,然后选择你的模型,他会根据你的要求生成一个回答

 

生成的数据会在dataset里面显示

 

在这里使用openAI去生成你要生成的主题和他对应的子主题,然后生成你需要的数据,当所有数据生成完毕时点击save all

 

 在弹出的面板里点击你需要的微调的模型,比如我们这边就是deepseek R1(因为我们需要把open AI的训练出自主思考的能力)

然后点击run and save去用deepseek R1讲数据集进行整合 (需要等待一段时间)

由此我们就将数据集准备好了,下一篇讲如何运用这个数据集去训练我们的微调模型


http://www.niftyadmin.cn/n/5869608.html

相关文章

【人工智能】数据挖掘与应用题库(101-200)

1、有矩阵A32 ,B23 ,C33 ,下列运算有意义的是( ) 答案:BC 2、13524 的逆序数为( ) 答案:3 3、矩阵A中元素a14的余子式记作M14,代数余子式记作A14,二者关系为( ) 答案:相反 4、关于机器学习与深度学习的范畴关系,下列说法正确的是? 答案:深度学…

【Rust中级教程】2.13. 结语(杂谈):我学习Rust的心路历程

2.13.1. 【Rust自学】专栏的缘起 笔者我在去年12月份之前对Rust还一无所知,后来看到JetBrains推出了Rust Rover,想着自己毕竟是买的全产品证书就下载下来玩了一下。原本就是看看,都打算卸载了,后来去网上查才发现Rust这门语言挺牛…

阿里重磅模型深夜开源;DeepSeek宣布开源DeepGEMM;微软开源多模态AI Agent基础模型Magma...|网易数智日报

阿里重磅模型深夜开源:表现超越Sora、Pika,消费级显卡就能跑 2月26日,25日深夜阿里云视频生成大模型万相2.1(Wan)正式宣布开源,此次开源采用Apache2.0协议,14B和1.3B两个参数规格的全部推理代码…

设计模式Python版 备忘录模式

文章目录 前言一、备忘录模式二、备忘录模式示例1三、备忘录模式示例2 前言 GOF设计模式分三大类: 创建型模式:关注对象的创建过程,包括单例模式、简单工厂模式、工厂方法模式、抽象工厂模式、原型模式和建造者模式。结构型模式&#xff1a…

神经网络 - 函数饱和性、软性门、泰勒级数

在接下来对于神经网络的学习中,我们会涉及到函数饱和性、软性门的概念,还需要用到泰勒级数,本文我们来理解这些基础知识,为后续学习神经网络的激活函数做准备。 一、函数饱和性 “函数具有饱和性”通常指的是当函数的输入达到某…

算法题(79):两个数组的交集

审题: 本题需要我们查找两个给定数组的无重复数据交集,并以数组的形式返回 思路: 方法一:set 之前我们学习过unordered_set的使用,但是unordered_set是无序的,而这里我们的比对算法需要有序数据&#xff0c…

MATLAB基础应用精讲-【数模应用】牛顿迭代法(附MATLAB、C++、R语言和python代码实现)

目录 前言 算法原理 什么是牛顿迭代法? 牛顿迭代如何迭代? 啥时候停止迭代呢? 特点 牛顿迭代法的扩展 迭代过程 数学模型 电力系统中牛顿拉夫逊法(N-R)潮流计算的直角坐标形式详细推导 潮流计算的牛顿-拉夫逊方法 牛顿-拉夫逊法的原理 牛顿-拉夫逊法的意义和…

Linux系统之DHCP网络协议

目录 一、DHCP概述 二、DHCP部署实操 2.1、安装DHCP软件 2.2、拷贝配置文件 2.3、配置文件详解 2.4、重启软件服务 2.5、新开一台服务器,查看dhcp地址获取 一、DHCP概述 DHCP(Dynamic Host Configuration Protocol)是一种应用层网络协…