当前位置: 首页 > wzjs >正文

找工作在哪个app找比较真实可靠广州seo优化

找工作在哪个app找比较真实可靠,广州seo优化,百度网站建设微信封面,化妆品网站建设的维护在对1600行内容,进行中英互译时,发现报错: 一开始以为是文件内容或是语法问题,反复查验,未发现文件内容方面的问题; 语法方面,切换了多个googletrans版本,均出现报错; …

在对1600+行内容,进行中英互译时,发现报错:

一开始以为是文件内容或是语法问题,反复查验,未发现文件内容方面的问题;

语法方面,切换了多个googletrans版本,均出现报错;

最后把文档内容做了切分,发现数据记录相对较少的文件可以正常运转,排除语法方面问题;

经测试:但是每次报错的节点不一样,有时候198条内容报错,有时281条内容报错,每次都不一致,排除文件格式问题,经过多次尝试,怀疑是过度频繁的使用网页请求而被系统监测到,从而报错;

使用time.sleep()处理:

40条记录,休息10秒,ok;

50条记录,休息10秒,ok;

100条记录,休息10秒,报错;

1条记录,休息1秒,暂未报错(已运行500+条)

# import asyncio
import time
import numpy as np
from googletrans import Translator
import pandas as pd
filepath='/Users/kangyongqing/Downloads/'
file1='Location分布.xlsx'
df1=pd.read_excel(filepath+file1)
# df=df1[df1['location'].str.contains(r'[\u4e00-\u9fff]+')].copy()  #  \u4e00-\u9fff 是unicode中汉字的常用范围
df=df1.copy()
df['loc1']=''translator=Translator()
# df['loc1']=df['location'].map(lambda x:translator.translate(x,dest='en').text)
k=1
i=0
# for i in range(i,len(df)):
#     print(i)
#     df.iloc[i, 1] = translator.translate(df.iloc[i, 0], dest='en').text
#     print(df.iloc[i, 1])
#     i+=1
#     if np.mod(i,40)==0:
#         df.iloc[(k-1)*40:i,:].to_excel(filepath + f'chuli到{(k-1)*40}到{i-1}条记录.xlsx')
#         k+=1
#         time.sleep(10)
#     elif i==len(df):
#         df.iloc[(k - 1) * 40:i, :].to_excel(filepath + f'chuli到{(k - 1) * 40}到{i - 1}条记录.xlsx')# for i in range(i,len(df)):
#     print(i)
#     df.iloc[i, 1] = translator.translate(df.iloc[i, 0], dest='en').text
#     print(df.iloc[i, 1])
#     i+=1
#     if np.mod(i,50)==0:
#         df.iloc[(k-1)*50:i,:].to_excel(filepath + f'chuli到{(k-1)*50}到{i-1}条记录.xlsx')
#         k+=1
#         time.sleep(10)
#     elif i==len(df):
#         df.iloc[(k - 1) * 50:i, :].to_excel(filepath + f'chuli到{(k - 1) * 50}到{i - 1}条记录.xlsx')for i in range(i,len(df)):print(i)df.iloc[i, 1] = translator.translate(df.iloc[i, 0], dest='en').texttime.sleep(1)i+=1# if np.mod(i,500)==0:#     df.iloc[(k-1)*500:i,:].to_excel(filepath + f'chuli到{(k-1)*500}到{i-1}条记录.xlsx')#     k+=1#     time.sleep(10)# elif i==len(df):#     df.iloc[(k - 1) * 500:i, :].to_excel(filepath + f'chuli到{(k - 1) * 500}到{i - 1}条记录.xlsx')
df.to_excel(filepath+'fanyi.xlsx')

结果1:

结果2:

逐条监督运行,成功翻译1600+记录,并导出明细,达成目标:

pandas筛选含有汉字的行:

# df=df1[df1['location'].str.contains(r'[\u4e00-\u9fff]+')].copy()  #  \u4e00-\u9fff 是unicode中汉字的常用范围

http://www.dtcms.com/wzjs/74561.html

相关文章:

  • 做网站必要吗西安seo王尘宇
  • 做易拉宝设计的网站壹起航网络推广的目标
  • office免费模板网站品牌推广计划
  • 快站如何做网站长沙seo网络推广
  • 如何做一份企业网站深圳网络推广最新招聘
  • 全国领先网站制作行业关键词搜索排名
  • 温州网站推广效果深圳媒体网络推广有哪些
  • wordpress 页面设置上海网站搜索排名优化哪家好
  • 做适合漫画网站的图片网络推广营销方案免费
  • 修改网站版权推广关键词排名方法
  • 论坛网站建设教程百度网址大全网址导航
  • 武汉高端定制网站网站友情链接购买
  • 企业网站安全建设方案关键词是指什么
  • 各级院建设网站的通知软文宣传推广
  • 医疗器械为什么做网站关键词排名手机优化软件
  • h5手机制作网站开发自媒体是什么
  • 宁波专业做网站游戏推广员招聘
  • 淄博做网站建设的公司一手项目对接app平台
  • 怎么用html做百度首页网站杭州做搜索引擎网站的公司
  • 如何制作网站视频教程百度关键词搜索量排行
  • 软件技术专业里有网站开发吗重庆百度seo公司
  • 做网站业务搜索引擎推广的优势
  • 东莞企业网站定制设计宁波seo服务
  • wordpress 建网站视频云南疫情最新数据消息中高风险地区
  • 如何免费建网站网络营销好不好
  • 域名注册网站的域名哪里来的百度统计平台
  • 做花馍网站北京百度seo服务
  • 华为官方网站进入信息流广告公司排名
  • 网站链接怎么做谷歌下载
  • 导航网站开发广州aso优化公司 有限公司