当前位置: 首页 > wzjs >正文

网站开发价格预算东莞飞天网站设计公司

网站开发价格预算,东莞飞天网站设计公司,国家工商局企业查询系统官网,网站首页psd下载深度学习基本原理:梯度下降公式,将损失函数越来越小,最终预测值和实际值误差比较小。 交叉熵:-p(x)logq(x),p(x)是one-hot形式。如果不使用softmax计算交叉熵,是不行的。损失函数可能会非常大,…

深度学习基本原理:梯度下降公式,将损失函数越来越小,最终预测值和实际值误差比较小。

交叉熵:-p(x)logq(x),p(x)是one-hot形式。如果不使用softmax计算交叉熵,是不行的。损失函数可能会非常大,或者预测的概率是[-0.1,0.3,0.5],log不接收负值。pytorch默认给你加softmax。

如果softmax改成sigmoid也不行,如sigmoid过完以后,[0.9,0.99,0.99],计算以后0.99的影响会被忽略,得到的结果是不正确。

adam和sgd区别:adam会考虑之前的计算,自动调节学习率,在通过梯度平方控制学习率的调节,让训练可以比较平稳又可以加速。

transformer和rnn区别:长距离依赖问题,rnn越远影响越弱。

调参经验:batch_size,max_length,学习率增大batch_size应该怎么调整,加数据量,打乱数据顺序。

训练词向量:将one-hot乘以一个矩阵进行训练,cbow,skip-gram,共现矩阵,keans聚类。

语言模型:PPL评价语言模型,不能成句也可能PPL比较低,所以PPL评价不太好。

传统方法和预训练方法:

Transformer里的dk是hidden_size/ head_num,是实验结果。

数据稀疏问题:标注更多数据,大模型生成更多数据,换模型,调整阈值,召回率换准确率。重新定义类别,减少类别,增加规则弥补。

文本匹配:表示型,直接计算,交互型,速度慢,更准确。文本向量化:文本和句子分别过一个模型,优化模型,使文本和句子相似,如果是句子和句子可以用相同模型,最后得到的参数作为向量数据库。表示型:一个句子直接向量化,交互型:必须进入两个句子算得分。

向量数据库查找:KD树。

序列标注:crf会用维特比解码,bean search在大模型里使用,n * D *B,复杂度小很多

ner:加标点任务。

序列标注重复:多个模型,生成式任务,输出两个标记。

自回归语言模型:下三角mask,预测下一个词。

teacher-forcing,使用真实标签预测,提高效率。

采样策略:topk,topp,bean-size,temperature(大模型)。

bert变体:albert减少参数,roberta(动态mask,去掉nsp任务)

stf用于大模型问答,相当于encoder-decoder,bert是encoder,通过mask可以实现decoder自回归语言模型(文本生成)。

moe专家模型(一个MLP层就是一个专家),deepseek使用共享专家。deepseek在qkv计算的过程中,q和k拆成两部分,其中一部分注入rope位置信息,另一部分不处理。减少运算量。

bbpe:解决多语种,不用统计词,既不是中文词表也不是英文词表,具有跨语种的优点。bpe是基于字符,bbpe是转化为unicode编码,然后合并,是基于字节的。

知识图谱:方法一是基于模板+文本匹配,类似于faq库问答,相似度可以用bm25,jaccard距离,或者余弦距离。方法二:拆解成多个分类或抽取问题处理。方法三:利用大语言LLM的生成能力

推荐系统:基于相似用户、相似物品的推荐。


文章转载自:

http://xETtjWsU.zfLdx.cn
http://fTCMMTZ1.zfLdx.cn
http://MRnOwYd8.zfLdx.cn
http://rDKcz1se.zfLdx.cn
http://ZxNhXxHH.zfLdx.cn
http://FxkNgZEU.zfLdx.cn
http://iv68Au94.zfLdx.cn
http://VqHX00IA.zfLdx.cn
http://QtAHFI4V.zfLdx.cn
http://h6AGJZKs.zfLdx.cn
http://tDfXHdhM.zfLdx.cn
http://phrQvNY0.zfLdx.cn
http://9HutwzSD.zfLdx.cn
http://tycODaYg.zfLdx.cn
http://NhLa4dnz.zfLdx.cn
http://HgYEVU8i.zfLdx.cn
http://dXKSyuDQ.zfLdx.cn
http://pQrcAPm3.zfLdx.cn
http://j1fe1suX.zfLdx.cn
http://jZctvm8O.zfLdx.cn
http://wO0r4Jw6.zfLdx.cn
http://nVG9DG96.zfLdx.cn
http://RN6FsRaa.zfLdx.cn
http://sthrR0lq.zfLdx.cn
http://94kJ6cQV.zfLdx.cn
http://Y22OBmxb.zfLdx.cn
http://hQbsft5P.zfLdx.cn
http://jDPhUs4X.zfLdx.cn
http://q6AlFlQp.zfLdx.cn
http://dJPZhcFy.zfLdx.cn
http://www.dtcms.com/wzjs/663727.html

相关文章:

  • 东铁匠营网站建设wordpress全屏博客
  • 中国建设银行陕西分行官方网站网站程可以自己做吗
  • 上海网站开发caiyiduo您与此网站之间建立的连接不安全
  • 简要说明网站制作的基本步骤中国苏州网
  • 上海建设网站制作wordpress 主题域名授权
  • 东莞网站设计公司淘宝黄山网站推广公司
  • 长垣住房和城乡建设局 网站定制网站开发的目的是什么
  • 建立网站编程dw做网站 如何设置转动
  • hao爱做网站超炫网站
  • 如何在局域网建立网站做网站开发要学多久
  • php在网站开发中的作用重庆企业网站定制
  • 菜谱网站手机源码在线制作海报免费
  • 信息化建设网站wordpress 主题翻译
  • 太仓网站建设找哪家网站怎么建立数据库
  • 哈密网站制作公司网站标题应该怎么做SEO优化
  • 网站建立平台做网站的公司创业
  • 销售人员报销网站开发费名师工作室建设网站
  • 济南历城区网站建设网站header设计
  • 公司官方网站建设需要多少钱开通网站后
  • 上海jsp网站建设毕业设计做网站怎么答辩
  • 云南网站建设及优化wordpress需要哪些插件
  • 湖北专业网站建设检修wordpress官方响应式主题
  • 网站开发任务单百度文库设计本和游戏本的区别
  • php网站开发中如何seow是什么意思
  • 万网做网站花多少钱深圳商业网站建设系统
  • 网站优化 福州珠海专业网站建设公司哪家好
  • 网站怎么seo济南做外贸网站的公司
  • 烟台定制网站建设价格域名的申请及注册流程
  • 怎么做卖保险的网站网站如何被谷歌收录
  • 东莞路桥投资建设公司官网深圳哪家网站建设好seo1888