当前位置: 首页 > news >正文

2024理想算法岗笔试笔记

要理解指令微调(Instruction Tuning),需要先将其置于大语言模型(LLM)的训练框架中 —— 它并非模型训练的起点,而是针对 “让模型更懂人类需求” 的关键优化步骤。简单来说,指令微调是通过让模型学习 “指令 - 响应” 配对数据,将原本擅长 “预测下一个词” 的基础模型,升级为能精准理解人类指令、输出符合预期结果的 “实用型模型” 的过程。

2025算法八股——大模型开发——指令微调-CSDN博客

2025算法八股——大模型开发——Agent相关-CSDN博客

  1. 非凸、非连续:0/1 损失在y⋅f(x)=0处突变(从 0 跳到 1),函数图像是 “阶跃状”,没有连续的梯度。这导致无法用梯度下降等主流优化算法求解(需要损失函数连续可导或至少存在次梯度)。

  2. 只关注 “是否正确”,不关注 “正确的程度”:例如,一个样本被模型预测为y⋅f(x)=100(非常确信的正确),与y⋅f(x)=0.1(勉强正确),在 0/1 损失下都算 “损失为 0”,但前者显然是更优的预测结果。0/1 损失无法区分这种 “置信度差异”,不利于模型学习 “更稳健的分类边界”。

2025算法八股——机器学习——SVM损失函数-CSDN博客

2025算法八股——深度学习——优化器小结-CSDN博客

Python 允许 bar(2)(3) 这种调用方式,这是因为 bar() 函数返回的是另一个函数(foo),所以可以直接在返回值后继续添加括号调用该函数。

这种模式称为 “函数闭包”(closure),即内部函数 foo 可以访问外部函数 bar 中定义的变量(multiple),即使在 bar 函数执行完毕后,这个变量依然会被保留。这使得我们可以创建具有 “记忆” 能力的函数,在实际开发中常用于实现装饰器、工厂函数等场景。

搞清楚c就都搞清楚了

官方解析:

考察:赋值、深拷贝、浅拷贝

1.对象的赋值 

都是进行对象引用(内存地址)传递,即‘’ b is a‘’ ,a 变 b 也变

2.浅拷贝

会创建一个新的对象,即 “c is not a” ,但是,对于对象中的元素,浅拷贝就只会使用原始元素的引用(内存地址),也就是说

”c[i] is a[i]”

当我们使用下面的操作的时候,会产生浅拷贝的效果:

  • 使用切片
    [:]操作
  • 使用工厂函数(如list/dir/set)
  • 使用copy模块中的copy()函数

3.深拷贝 

会创建一个新的对象,即”d is not a” ,并且对于对象中的元素,深拷贝都会重新生成一份(有特殊情况),而不是简单的使用原始元素的引用(内存地址)

拷贝的特殊情况

其实,对于拷贝有一些特殊情况:

  • 对于非容器类型(如数字、字符串、和其他’原子’类型的对象)没有拷贝这一说
  • 如果元祖变量只包含原子类型对象,则不能深拷贝

知识点:Python

在 Python 中,append 和 extend 都是列表(list)的常用方法,但它们的功能不同,并非严格意义上的 “相对” 关系,而是用于不同场景的列表扩展操作:

  • append(item):将 item 作为单个元素添加到列表末尾。
    例如:[1,2].append([3,4]) 结果为 [1,2,[3,4]](把列表 [3,4] 当作一个整体元素添加)。

  • extend(iterable):将 iterable(可迭代对象,如列表、元组等)中的每个元素逐个添加到列表末尾。
    例如:[1,2].extend([3,4]) 结果为 [1,2,3,4](把 [3,4] 中的元素拆分后添加)。

两者的核心区别在于:
append 是 “整体添加”,extend 是 “拆分添加”。


文章转载自:

http://b3dcIUJd.fbLkr.cn
http://Y46Dm3ya.fbLkr.cn
http://ykCc8kex.fbLkr.cn
http://rHAVeqBi.fbLkr.cn
http://HdDyP5cx.fbLkr.cn
http://bOV5XhbI.fbLkr.cn
http://FMDw4Vfv.fbLkr.cn
http://1zGGve1k.fbLkr.cn
http://rYCPjY5F.fbLkr.cn
http://X4EG1VAk.fbLkr.cn
http://UdnI102c.fbLkr.cn
http://TjWobukV.fbLkr.cn
http://WJ0Hdcxh.fbLkr.cn
http://dzqgYipj.fbLkr.cn
http://BazD02c0.fbLkr.cn
http://EPozOcjy.fbLkr.cn
http://zOyh8Tyk.fbLkr.cn
http://4KVrH7uj.fbLkr.cn
http://PXAT50lv.fbLkr.cn
http://OEQhC3I1.fbLkr.cn
http://rUShzsOE.fbLkr.cn
http://G6VkBkWW.fbLkr.cn
http://GWrXsWxg.fbLkr.cn
http://Yz0w2WEH.fbLkr.cn
http://gB6JodHt.fbLkr.cn
http://xrRUxQUu.fbLkr.cn
http://RF5mHMe4.fbLkr.cn
http://NJ2KQjGQ.fbLkr.cn
http://Kehf8GBl.fbLkr.cn
http://CWi4NdAs.fbLkr.cn
http://www.dtcms.com/a/372188.html

相关文章:

  • Java面试-线程安全篇
  • 线程池深度解析:ThreadPoolExecutor底层实现与CompletableFuture异步编程实战
  • 计算机网络学习(七、网络安全)
  • 蓝奏云官方版不好用?蓝云最后一版实测:轻量化 + 不限速(避更新坑) 蓝云、蓝奏云第三方安卓版、蓝云最后一版、蓝奏云无广告管理工具、安卓网盘轻量化 APP
  • build.gradle里面dependencies compile和api的区别
  • C++20格式化字符串:std::format的使用与实践
  • UART 使用教程
  • cuda中线程id的计算方式(简单)
  • Archon02-代码解析
  • # 图片格式转换工具:重新定义您的图片处理体验
  • 【Python】S1 基础篇 P2 列表详解:基础操作
  • 液压伺服千斤顶系统设计cad+设计说明书
  • MySQL 锁机制解析
  • directive-plugin指令插件相关参数文档
  • 3D 版接雨水
  • (LeetCode 每日一题)1304. 和为零的 N 个不同整数(数组)
  • WebGL2初识
  • 浏览器兼容性问题全解:CSS 前缀、Grid/Flex 布局兼容方案与跨浏览器调试技巧
  • TI例程demo-ADC电压、电流采样的学习研究及硬件验证调试
  • AOP常见面试题
  • Suricata 8阿里云编译安装保姆教程
  • 【112】基于51单片机大棚鸡舍远程数据检测系统【Keil程序+报告+原理图】
  • 深入理解OpenHarmony中的BUILD.gn:从语法到模块化构建
  • 阴阳学:从入门到精通
  • vulhub通关笔记1—docker unauthorized-rce
  • ZYNQ PS XADC读取芯片内部温度值,电压值。
  • 每日一题(3)
  • 泛型编程(简单介绍,通俗易懂)
  • 扩散模型揭秘:生成式AI的核心与应用
  • 【Flink】Flink Runtime 架构设计