当前位置: 首页 > wzjs >正文

室内设计师培训网seo优化操作

室内设计师培训网,seo优化操作,聊城网站建设,找人做短视频网站在对1600行内容,进行中英互译时,发现报错: 一开始以为是文件内容或是语法问题,反复查验,未发现文件内容方面的问题; 语法方面,切换了多个googletrans版本,均出现报错; …

在对1600+行内容,进行中英互译时,发现报错:

一开始以为是文件内容或是语法问题,反复查验,未发现文件内容方面的问题;

语法方面,切换了多个googletrans版本,均出现报错;

最后把文档内容做了切分,发现数据记录相对较少的文件可以正常运转,排除语法方面问题;

经测试:但是每次报错的节点不一样,有时候198条内容报错,有时281条内容报错,每次都不一致,排除文件格式问题,经过多次尝试,怀疑是过度频繁的使用网页请求而被系统监测到,从而报错;

使用time.sleep()处理:

40条记录,休息10秒,ok;

50条记录,休息10秒,ok;

100条记录,休息10秒,报错;

1条记录,休息1秒,暂未报错(已运行500+条)

# import asyncio
import time
import numpy as np
from googletrans import Translator
import pandas as pd
filepath='/Users/kangyongqing/Downloads/'
file1='Location分布.xlsx'
df1=pd.read_excel(filepath+file1)
# df=df1[df1['location'].str.contains(r'[\u4e00-\u9fff]+')].copy()  #  \u4e00-\u9fff 是unicode中汉字的常用范围
df=df1.copy()
df['loc1']=''translator=Translator()
# df['loc1']=df['location'].map(lambda x:translator.translate(x,dest='en').text)
k=1
i=0
# for i in range(i,len(df)):
#     print(i)
#     df.iloc[i, 1] = translator.translate(df.iloc[i, 0], dest='en').text
#     print(df.iloc[i, 1])
#     i+=1
#     if np.mod(i,40)==0:
#         df.iloc[(k-1)*40:i,:].to_excel(filepath + f'chuli到{(k-1)*40}到{i-1}条记录.xlsx')
#         k+=1
#         time.sleep(10)
#     elif i==len(df):
#         df.iloc[(k - 1) * 40:i, :].to_excel(filepath + f'chuli到{(k - 1) * 40}到{i - 1}条记录.xlsx')# for i in range(i,len(df)):
#     print(i)
#     df.iloc[i, 1] = translator.translate(df.iloc[i, 0], dest='en').text
#     print(df.iloc[i, 1])
#     i+=1
#     if np.mod(i,50)==0:
#         df.iloc[(k-1)*50:i,:].to_excel(filepath + f'chuli到{(k-1)*50}到{i-1}条记录.xlsx')
#         k+=1
#         time.sleep(10)
#     elif i==len(df):
#         df.iloc[(k - 1) * 50:i, :].to_excel(filepath + f'chuli到{(k - 1) * 50}到{i - 1}条记录.xlsx')for i in range(i,len(df)):print(i)df.iloc[i, 1] = translator.translate(df.iloc[i, 0], dest='en').texttime.sleep(1)i+=1# if np.mod(i,500)==0:#     df.iloc[(k-1)*500:i,:].to_excel(filepath + f'chuli到{(k-1)*500}到{i-1}条记录.xlsx')#     k+=1#     time.sleep(10)# elif i==len(df):#     df.iloc[(k - 1) * 500:i, :].to_excel(filepath + f'chuli到{(k - 1) * 500}到{i - 1}条记录.xlsx')
df.to_excel(filepath+'fanyi.xlsx')

结果1:

结果2:

逐条监督运行,成功翻译1600+记录,并导出明细,达成目标:

pandas筛选含有汉字的行:

# df=df1[df1['location'].str.contains(r'[\u4e00-\u9fff]+')].copy()  #  \u4e00-\u9fff 是unicode中汉字的常用范围

http://www.dtcms.com/wzjs/118617.html

相关文章:

  • 科技部政务服务平台北京seo排名外包
  • wordpress首页显示特定分类文章移动端排名优化软件
  • 智慧建设网站如何在百度发布信息推广
  • 网站做用户记录表如何让百度收录自己信息
  • 2023最好用的浏览器seo优化在哪里学
  • 做h的动漫在线观看网站seo职位描述
  • 网页设计代码大全下载网站关键字优化软件
  • 域名注册好后怎么建设网站石家庄seo推广公司
  • wordpress手机发表文章seo一键优化
  • 网站开发自学要多久2023年最新新闻摘抄
  • 免费企业网站建设介绍网络销售模式有哪些
  • 阿里云ecs部署网站seo创业
  • 武汉汉口做网站公司百度百度
  • 团购网站做二级域名山东网络推广优化排名
  • 团购网站建设外贸网站建设流程
  • 网站建设品牌好手机优化大师官方免费下载
  • dw网页设计软件的学习网站品牌运营
  • 网上自建网站开店资源搜索神器
  • 上海公司章程在哪里可以查询打印考拉seo
  • wordpress参考书宁波seo优化公司
  • 招聘网站如何做百度搜索排名查询
  • 杭州企业网站建设 哪里好性价比高seo排名
  • 企业电子商务网站的域名命名营销是做什么
  • 网站怎么怎么做关键字网推是什么
  • 网站建设制作设计seo优化南宁推广如何做网上引流
  • 整站优化加盟百度百科词条
  • 企业网络营销顾问抖音seo关键词优化
  • 张家港市凤凰镇建设局网站太原整站优化排名外包
  • 滨州j建设局网站投诉电话整站优化代理
  • 南宁网站建设怎么样站外引流推广渠道