当前位置: 首页 > wzjs >正文

做网站策划书吧网络营销的培训课程

做网站策划书吧,网络营销的培训课程,安溪县住房和城乡规划建设局网站,行业网站建设分析在对1600行内容,进行中英互译时,发现报错: 一开始以为是文件内容或是语法问题,反复查验,未发现文件内容方面的问题; 语法方面,切换了多个googletrans版本,均出现报错; …

在对1600+行内容,进行中英互译时,发现报错:

一开始以为是文件内容或是语法问题,反复查验,未发现文件内容方面的问题;

语法方面,切换了多个googletrans版本,均出现报错;

最后把文档内容做了切分,发现数据记录相对较少的文件可以正常运转,排除语法方面问题;

经测试:但是每次报错的节点不一样,有时候198条内容报错,有时281条内容报错,每次都不一致,排除文件格式问题,经过多次尝试,怀疑是过度频繁的使用网页请求而被系统监测到,从而报错;

使用time.sleep()处理:

40条记录,休息10秒,ok;

50条记录,休息10秒,ok;

100条记录,休息10秒,报错;

1条记录,休息1秒,暂未报错(已运行500+条)

# import asyncio
import time
import numpy as np
from googletrans import Translator
import pandas as pd
filepath='/Users/kangyongqing/Downloads/'
file1='Location分布.xlsx'
df1=pd.read_excel(filepath+file1)
# df=df1[df1['location'].str.contains(r'[\u4e00-\u9fff]+')].copy()  #  \u4e00-\u9fff 是unicode中汉字的常用范围
df=df1.copy()
df['loc1']=''translator=Translator()
# df['loc1']=df['location'].map(lambda x:translator.translate(x,dest='en').text)
k=1
i=0
# for i in range(i,len(df)):
#     print(i)
#     df.iloc[i, 1] = translator.translate(df.iloc[i, 0], dest='en').text
#     print(df.iloc[i, 1])
#     i+=1
#     if np.mod(i,40)==0:
#         df.iloc[(k-1)*40:i,:].to_excel(filepath + f'chuli到{(k-1)*40}到{i-1}条记录.xlsx')
#         k+=1
#         time.sleep(10)
#     elif i==len(df):
#         df.iloc[(k - 1) * 40:i, :].to_excel(filepath + f'chuli到{(k - 1) * 40}到{i - 1}条记录.xlsx')# for i in range(i,len(df)):
#     print(i)
#     df.iloc[i, 1] = translator.translate(df.iloc[i, 0], dest='en').text
#     print(df.iloc[i, 1])
#     i+=1
#     if np.mod(i,50)==0:
#         df.iloc[(k-1)*50:i,:].to_excel(filepath + f'chuli到{(k-1)*50}到{i-1}条记录.xlsx')
#         k+=1
#         time.sleep(10)
#     elif i==len(df):
#         df.iloc[(k - 1) * 50:i, :].to_excel(filepath + f'chuli到{(k - 1) * 50}到{i - 1}条记录.xlsx')for i in range(i,len(df)):print(i)df.iloc[i, 1] = translator.translate(df.iloc[i, 0], dest='en').texttime.sleep(1)i+=1# if np.mod(i,500)==0:#     df.iloc[(k-1)*500:i,:].to_excel(filepath + f'chuli到{(k-1)*500}到{i-1}条记录.xlsx')#     k+=1#     time.sleep(10)# elif i==len(df):#     df.iloc[(k - 1) * 500:i, :].to_excel(filepath + f'chuli到{(k - 1) * 500}到{i - 1}条记录.xlsx')
df.to_excel(filepath+'fanyi.xlsx')

结果1:

结果2:

逐条监督运行,成功翻译1600+记录,并导出明细,达成目标:

pandas筛选含有汉字的行:

# df=df1[df1['location'].str.contains(r'[\u4e00-\u9fff]+')].copy()  #  \u4e00-\u9fff 是unicode中汉字的常用范围

http://www.dtcms.com/wzjs/500335.html

相关文章:

  • b2c网站的促销策略玉溪seo
  • 网站优化吧百度手机网页版
  • 上线了做网站要钱seo深圳网络推广
  • 网站建设中的功能模块描述河南今日头条新闻
  • 做emu对网站有什么要求整站优化要多少钱
  • 响应设网站多少钱可以做惠州seo关键词
  • 建网站的专业公司正规的代运营公司
  • 佛山营销网站建设多少钱公司网站免费自建
  • 长宁区公司网站建设专业seo外包
  • 网站推广用什么方法最好百度网站名称
  • 优秀网站欣赏怎么查询百度收录情况
  • 移动端网站如何做开放式配电子商务主要干什么
  • 苹果企业网站建设天津关键词优化网排名
  • 网站设计及开发网站内容优化关键词布局
  • 仿站网站建设网络营销效果评估
  • 微交易网站建设网文网站排名
  • 陕西网站建设设计深圳网络推广公司有哪些
  • 怎么做自动下单网站seo精准培训课程
  • 北京大兴企业网站建设咨询如何注册自己的网站
  • 网站专题设计模板外链发布平台大全
  • 网站维护推广怎么做网站维护是做什么的
  • 贵州网站建设线上推广策划方案范文
  • 网站建设首选定制开发永久免费无代码开发平台网站
  • 宜昌模板网站建设网络推广的方法有
  • 网站要做手机版怎么做查网站域名
  • 建立个大型网站需要多少投入搜索引擎入口google
  • 网站开发页面怎么进公司业务推广
  • 内网穿透做网站seo百度快照优化公司
  • 上海建网站开发公司长沙企业网站设计
  • 携程旅行网站内容的建设天津百度推广公司地址