当前位置: 首页 > wzjs >正文

dw个人网站主页怎么做织梦网站更改标题长度

dw个人网站主页怎么做,织梦网站更改标题长度,深圳网站建设公司哪好,wordpress模板电子书下载站赛题描述:根据提供的脱敏资讯新闻数据,选手需要对提供的训练集进行特征工程,构建资讯分类模型,对与测试集进行准确的新闻分类。 最终得分:0.8120。十二点关榜没看到排名,估算100? 训练集很小&am…

赛题描述:根据提供的脱敏资讯新闻数据,选手需要对提供的训练集进行特征工程,构建资讯分类模型,对与测试集进行准确的新闻分类。
最终得分:0.8120。十二点关榜没看到排名,估算100+?
训练集很小,只有八千条数据,痛苦了三天,调参加模型效果不升反降。

训练集只有三列:新闻ID,文字,标签,一共四类标签。
标签分布
根据文本列中的数字个数加入了文本长度特征,能够反映出文本的复杂性或信息量。

X_train['length'] = X_train['文本'].apply(lambda x: len(str(x).split()))
X_test['length'] = X_test['文本'].apply(lambda x: len(str(x).split()))

文本列使用TfidfVectorizer:将文本数据转换为 TF-IDF 特征。
length列使用StandardScaler:将其转换为均值为 0,标准差为 1 的数值范围。

preprocessor = ColumnTransformer(transformers=[('text_tfidf', TfidfVectorizer(), '文本'),('length_scaler', StandardScaler(), ['length'])],remainder='passthrough'
)

选择线性支持向量机作为分类器:

classifier = LinearSVC(class_weight='balanced', random_state=42, dual=False)

使用 GridSearchCV 来进行超参数调优。

param_grid = {'preprocessor__text_tfidf__ngram_range': [(1, 2)],'preprocessor__text_tfidf__max_features': [50000, 70000, 90000],'preprocessor__text_tfidf__min_df': [1, 2, 3],'preprocessor__text_tfidf__max_df': [0.85, 0.9, 0.95],'classifier__C': [0.5, 1.0, 2.0, 5.0, 8.0, 10.0],
}

ngram_range: 设置为 (1, 2),表示我们使用 1-gram 和 2-gram(单词和双词组合)来表示文本特征。

max_features: 控制 TfidfVectorizer 中考虑的最大特征数量。尝试不同的值可以帮助我们找到最佳的特征数量。

min_df 和 max_df: 这些参数控制了 TfidfVectorizer 在选择特征时的文档频率范围,有助于排除低频和高频的噪声词汇。

C: 正则化参数,控制模型的复杂度和对训练数据的拟合程度。

对模型进行了多次交叉验证,以选择最佳参数组合。

grid_search = GridSearchCV(pipeline, param_grid, cv=cv_strategy,scoring='f1_macro',n_jobs=-1,verbose=2)
best_model = grid_search.best_estimator_
predictions = best_model.predict(X_test)

小白第一次参加类似比赛,大佬轻喷。


文章转载自:

http://yywFVzS1.tyrLk.cn
http://Sd5Ez0yd.tyrLk.cn
http://7y4PaKb3.tyrLk.cn
http://MSvKEuX7.tyrLk.cn
http://7eiZJAkH.tyrLk.cn
http://UJooIiSN.tyrLk.cn
http://5ON0THVM.tyrLk.cn
http://JsHAxQfY.tyrLk.cn
http://SCEsZS5M.tyrLk.cn
http://618f1t9o.tyrLk.cn
http://uGu3TR70.tyrLk.cn
http://D5Q4eYJi.tyrLk.cn
http://BquTgYup.tyrLk.cn
http://zt5O2gvV.tyrLk.cn
http://0hUoRpYo.tyrLk.cn
http://GSv5Bzvf.tyrLk.cn
http://51G9SpaK.tyrLk.cn
http://Kbx9lQzB.tyrLk.cn
http://MdazGCGa.tyrLk.cn
http://umLHDY5o.tyrLk.cn
http://KtGB8znI.tyrLk.cn
http://zNHq28Px.tyrLk.cn
http://tTjCX7i5.tyrLk.cn
http://04nsaKYL.tyrLk.cn
http://1yRWfM51.tyrLk.cn
http://xzK49w2j.tyrLk.cn
http://tF0bnmco.tyrLk.cn
http://uzYMcYrE.tyrLk.cn
http://TXFHsFAL.tyrLk.cn
http://YoUp7q2U.tyrLk.cn
http://www.dtcms.com/wzjs/658143.html

相关文章:

  • dnf游戏币交易网站建设网站设计软件开发
  • 成都工业学院文献检索在哪个网站做外链生成工具
  • 深圳网站建设51duoshi网站建设培训 店
  • 响应式电商网站制作深圳制作网站的公司简介
  • 长阳网站建设重庆规模最大的建网站公司
  • 海口网站建设价格招聘网站做竞品分析
  • 网站备案 固定电话wordpress邮件新文章
  • 建设厅网站密码忘了怎么办wordpress文章怎么生成标签
  • 400网站建设推广优设网的特点
  • 做网站设计的公司四川整站优化关键词排名
  • 化州网站建设wordpress自定义后台菜单
  • 做seo推广手机网站代做百度首页排名价格
  • 淘宝网站建设属于什么类目网站制作岗位职责
  • 网站申请建设网络推广培训班培训机构
  • 整人网站怎么做沈阳制作网站的公司有哪些
  • 模板建设网站招人在哪个网站比较好找
  • 做网站赚钱交税公司网站建设的分类
  • 陶瓷类网站建设哪些网站做推广
  • 冠县企业做网站推广三亚市住房和城乡建设局
  • 重庆快速网站建设安徽合肥做网站的公司
  • 什么是理财北京网站建设公司西双版纳网站建设开发公司
  • 网站建设的实践体会购物网站建设价格
  • 做公司网站 烟台爱企业查询
  • 网站的管理付网站建设费用会计分录
  • 漯河建网站主播做的头像在哪个网站上做的
  • 兰溪建设网站衡水精品网站建设
  • 网络优化网站 s网站页头尺寸
  • 找企业网站制作遵义市建设局网站官网
  • 哈尔滨网站制作哪儿好薇注册一个有限公司需要多少钱
  • 网站建设申请计划wordpress yusi主题