当前位置: 首页 > wzjs >正文

营销型网站建设价格贵吗wordpress主题解压后有多个文件

营销型网站建设价格贵吗,wordpress主题解压后有多个文件,安徽住房和城乡建设部网站,网页制作软件哪里有文章目录一、论文和代码网址二、代码复现1.Linux系统下拉取代码、编译2.数据集:情感分析3.训练4.评估模型:用训练集评估模型精度5.测试三、代码结构四、模型架构五、fastText模型评价一、论文和代码网址 论文:https://arxiv.org/pdf/1607.01…

文章目录

  • 一、论文和代码网址
  • 二、代码复现
    • 1.Linux系统下拉取代码、编译
    • 2.数据集:情感分析
    • 3.训练
    • 4.评估模型:用训练集评估模型精度
    • 5.测试
  • 三、代码结构
  • 四、模型架构
  • 五、fastText模型评价

一、论文和代码网址

论文:https://arxiv.org/pdf/1607.01759v2
代码:https://github.com/facebookresearch/fastText



二、代码复现

1.Linux系统下拉取代码、编译

wget https://github.com/facebookresearch/fastText/archive/v0.9.2.zip
unzip v0.9.2.zip
cd fastText-0.9.2
make

2.数据集:情感分析

IMDB 评论25000条:https://ai.stanford.edu/~amaas/data/sentiment/

假设我们要做情感分析任务,任务是根据电影评论判断情感是积极还是消极。那么我们可以准备如下格式的训练数据:

train.txt

__label__positive  This movie is fantastic, I loved it!
__label__negative  I hated this movie, it was awful.
__label__positive  Absolutely amazing, best movie I've seen!
__label__negative  Terrible, waste of time.
__label__positive  Great movie, will watch again.
__label__negative  Didn't enjoy it at all, very boring.

3.训练

修改epoch轮次

vim classification-example.sh

找到-epoch,从5改为20


训练模型命令:

./fasttext supervised -input train_25000.txt -output model./fasttext supervised -input train_25000.txt -output model -lr 0.01 -epoch 300 -dim 300 -neg 10 -loss hs【 loss 0.137】./fasttext supervised -input train_25000.txt -output model -lr 0.05 -epoch 50 -dim 300 -neg 30 -loss ns 【ns:很差】./fasttext supervised -input train_25000.txt -output model -lr 0.1 -epoch 50 -dim 300 -neg 30 -loss hs【 loss 0.111

最终输出:

Read 5M words
Number of words:  281111
Number of labels: 2
Progress: 100.0% words/sec/thread:  835193 lr:  0.000000 avg.loss:  0.137626 ETA:   0h 0m 0s

4.评估模型:用训练集评估模型精度

./fasttext test model.bin train.txt
./fasttext test model.bin train_25000.txt
./fasttext test model.bin test_label.txt
N	25000
P@1	0.996
R@1	0.996N	107
P@1	0.897
R@1	0.897

5.测试

test.txt

I loved this movie, it was fantastic!
The movie was very boring and predictable.
I didn't enjoy it at all, such a disappointment.

预测命令:

./fasttext predict-prob model.bin train_25000.txt

这将输出每行文本的预测标签。预测结果会以以下格式显示:

__label__positive 0.81732
__label__negative 0.698711
__label__positive 0.999979
__label__positive 0.862
__label__positive 0.999925
__label__positive 0.992208
__label__positive 0.999989
__label__positive 0.910747
__label__positive 0.848151
__label__negative 1.00001__label__positive 1.00001
__label__negative 0.832305
__label__positive 0.999992
__label__negative 0.973684
__label__positive 0.99999
__label__negative 0.965739



三、代码结构

C++辅以Python实现:

1.训练过程:fasttext.cc
(1)train()函数

void FastText::train(const Args& args, const TrainCallback& callback) {

2.模型:model.cc
模型计算与更新:model.cc 中主要处理 隐藏层计算、预测 和 模型参数更新 的过程。每次训练时都会通过 反向传播 来更新模型的 词向量。


3.损失函数:loss.cc
损失函数:loss.cc中实现了多种 损失函数(如负采样、层次化 softmax 和 标准softmax),每个损失函数都有自己的forward方法,负责计算损失并进行反向传播。



四、模型架构

在这里插入图片描述


五、fastText模型评价

1.工作原理
(1)词向量
通过词向量(Word Embeddings)的方式来表示每个词。将每个词拆分成了子词(subwords),利用n-gram技术,以更好地处理词形变化(复数形式、时态变化)和生僻词。

(2)线性分类器
fastText 使用一个线性分类器来进行文本分类任务。它会将文本中的所有词的向量表示(或子词的向量)平均起来,得到文本的向量表示,然后通过一个线性分类器(例如 logistic regression)来进行预测。
这种方法非常快速,尤其适合文本分类任务。

2.优势
没有复杂的神经网络,因此对于大规模文本,训练速度很快。

加速训练:
(1)Hierarchical Softmax
(2)负样本(Negative Samples):

负样本是随机从词汇表中选择的 不相关的词汇,这些词不与给定的中心词共同出现在同一上下文中。
例如,在训练 “cat” 的词向量时,负样本可能是从整个词汇表中随机选择的单词 “dog”、“apple”、“car” 等,这些词不与 “cat” 出现在同一上下文中。


3.缺陷
对于双重否定句,无法准确判断。


4.改进:
改用LSTM、GRU、Transformer、BERT等深度学习模型。含有自注意力机制的模型对中长语句的理解能力更强。能更好地处理文本中的长距离依赖上下文信息,捕捉到更丰富的句法和语义信息。

fastText太轻量级,以至于无法加入早停Dropout,采用的是负采样层次化softmax来训练词向量。


文章转载自:

http://6oer5WY3.yxgqr.cn
http://sspfQkry.yxgqr.cn
http://wKdOUyqP.yxgqr.cn
http://oeduMegW.yxgqr.cn
http://qxB2CJJ3.yxgqr.cn
http://Bhn2SYFS.yxgqr.cn
http://2bydHtne.yxgqr.cn
http://JSPldnWS.yxgqr.cn
http://Un8BXDfR.yxgqr.cn
http://NifkKd4P.yxgqr.cn
http://jGbzr1XF.yxgqr.cn
http://4StT9ac1.yxgqr.cn
http://grJj29QV.yxgqr.cn
http://4UeM8T0I.yxgqr.cn
http://KexYeCh5.yxgqr.cn
http://jh58llPM.yxgqr.cn
http://oEBRxv62.yxgqr.cn
http://f7YWlxFj.yxgqr.cn
http://5e5iOxVy.yxgqr.cn
http://fhx52ED1.yxgqr.cn
http://hZorV6Kr.yxgqr.cn
http://j57jcG11.yxgqr.cn
http://RoeCATPi.yxgqr.cn
http://VcnSfLFa.yxgqr.cn
http://BoQ7iFkQ.yxgqr.cn
http://yoaSfQmF.yxgqr.cn
http://HzQnPSWP.yxgqr.cn
http://OVbs8o7v.yxgqr.cn
http://NOP7T5qg.yxgqr.cn
http://ag7rhc9d.yxgqr.cn
http://www.dtcms.com/wzjs/772702.html

相关文章:

  • 北京网站开发网络公司郑州网站建设特色
  • 自己做的网站发到网上杭州做兼职网站建设
  • 淘宝代做网站玉树电子商务网站建设公司
  • 长春建站费用中卫网架配件多少钱
  • 网站备案名称更改宝丰网站制作效果好
  • 东莞营销网站建设报价房山企业网站建设公司
  • 山东广饶县建设局网站wordpress如何降级
  • 济南手机建站模板joomla 多语言网站
  • 门户网站啥意思wordpress开启新用户注册功能
  • 网站建设的内容管理免费qq刷赞网站推广
  • 安溪网站建设公司网页设计可以从事什么工作
  • 厚街网站建设费用质量好的购物平台
  • 默认网站预览能能显示建设中车牌照损坏在网站做的能用吗
  • 网站建设开发的规划流程百度在线识图查图片
  • 谷秋精品课程网站建设软件手机有办法做网站吗
  • 免x网站网站semseo先做哪个
  • 二七区网站建设php如何做网站
  • 做seo比较好的网站公司购买网站建设费用会计分录
  • 电商网站建设需要数字营销策略有哪些
  • 网站如何做h5动态页面vps搭建wordpress
  • 传奇新开网站网页设计基础入门
  • 外贸网站小语种珠海的网站建设
  • 网站建设太金手指六六十八简单网站搭建
  • 怎样做网站api接口平台类网站有哪些
  • 网站建设合同有哪些怎么在百度做免费推广
  • 建设部物业证书查询官方网站wordpress 命令行高亮
  • 做网站的一些好处国内顶尖的公司
  • 苏宁易购网站上的营销页面专业建设网站多少钱
  • 门户网站类型wordpress打字不显示
  • vue做的博客网站公司做网站的原因