当前位置: 首页 > wzjs >正文

福田做棋牌网站建设苏州seo服务

福田做棋牌网站建设,苏州seo服务,在青岛建网站,浙江十大建筑公司排名问题: 通过 Redshift Spectrum 功能可以读取 S3 中的文件,当读取 Parquet 文件时,如果列格式设置为 timestamp, 通过 psql 客户端读取会出现以下错误: testdb# select * from myspectrum_schema_0219.test_ns; ERROR…

问题:

通过 Redshift Spectrum 功能可以读取 S3 中的文件,当读取 Parquet 文件时,如果列格式设置为 timestamp, 通过 psql 客户端读取会出现以下错误:

testdb=# select * from myspectrum_schema_0219.test_ns;
ERROR:  Assert
DETAIL:-----------------------------------------------error:  Assertcode:      1000context:   status == 0 - timestamp: '-3784992261051417264'query:     15121995location:  cg_util.cpp:705process:   padbmaster [pid=1073963104]-----------------------------------------------

通过 Query Editor V2 读取,则显示错误的时间格式:

以下是 CSV 文件,以及通过 python 读取 Parquet 文件的内容:

CSV:

$ more data3.csv
saletime
2024-01-01 01:01:01.000000
2025-01-01 01:01:01.000000
2025-01-02 02:01:01.000000
2025-01-03 03:01:01.000000
2025-01-04 04:01:01.000000
2025-01-04 05:01:01.000000

Parquet:

>>> import pandas as pd
>>> import pyarrow.parquet as pq
>>> parquet_file = 'data3_ns.parquet'
>>> df_read = pd.read_parquet(parquet_file)
>>> print(df_read)saletime
0 2024-01-01 01:01:01
1 2025-01-01 01:01:01
2 2025-01-02 02:01:01
3 2025-01-03 03:01:01
4 2025-01-04 04:01:01
5 2025-01-04 05:01:01

原因:

Redshift 中的时间类型支持到 us,也就是 微妙,而 Parquet 文件 timestamp 格式支持的类型为 ns,所以对于时间格式是无法读取,或读取错误。

解决:

在 Parquet 文件设置时间类型时,对值做设置,datetime64[us],以匹配 Redshift 的时间精度。

以下为CSV生成 Parquet 的代码:

import pandas as pd
import pyarrow.parquet as pq# 读取 CSV 文件
csv_file = 'data3.csv'
df = pd.read_csv(csv_file)# 假设 CSV 文件中有一个时间列 'timestamp',将其转换为微秒精度
df['saletime'] = pd.to_datetime(df['saletime']).astype('datetime64[us]')# 将 DataFrame 保存为 Parquet 文件
parquet_file = 'data3_us.parquet'
df.to_parquet(parquet_file, engine='pyarrow')# 读取 Parquet 文件以验证
df_read = pd.read_parquet(parquet_file)
print(df_read)saletime
0 2024-01-01 01:01:01
1 2025-01-01 01:01:01
2 2025-01-02 02:01:01
3 2025-01-03 03:01:01
4 2025-01-04 04:01:01
5 2025-01-04 05:01:01

之后创建外部表进行查询,就可以成功匹配到正确的格式。

testdb=# CREATE EXTERNAL TABLE myspectrum_schema_0219.test_us(saletime timestamp)
testdb-# STORED AS parquet
testdb-# LOCATION 's3://XXX/redshiftspectrum/t_0220_p/t_0220_p_us/';
CREATE EXTERNAL TABLEtestdb=# select * from myspectrum_schema_0219.test_us;saletime
---------------------2024-01-01 01:01:012025-01-01 01:01:012025-01-02 02:01:012025-01-03 03:01:012025-01-04 04:01:012025-01-04 05:01:01
(6 rows)

http://www.dtcms.com/wzjs/410022.html

相关文章:

  • 装修网上接单平台有哪些啊?河南做网站优化
  • 购物网站优惠券怎么做四年级下册数学优化设计答案
  • 保定免费网站建站模板樱桃电视剧西瓜视频在线观看
  • 深圳制作网站网络营销策划的具体流程是
  • 西安网络公司网站建设成都网站关键词推广优化
  • 外贸网站设计方案巨量算数
  • 兰州网站seo服务百度官网认证免费
  • 网站怎么做盈利优化排名工具
  • 小网站百度电话号码查询
  • 台州网站制作网页网站域名备案信息查询
  • 建筑工程网cnas广东seo推广外包
  • 做计量检定的网站seo排名优化公司
  • 网站导航面包屑公司推广方法有哪些
  • 佛山网站建设多少钱网站广告策划
  • 兼职做页面的网站企拓客app骗局
  • 保洁产品网站建设价格搜索引擎竞价推广的优势
  • 做网站如何与网络公司沟通建站教程
  • 福建微网站建设百度网络营销app
  • 服务器安全卫士网站搜索引擎优化
  • 四川住房和建设厅网站关键词林俊杰百度云
  • 做网站的市场典型的口碑营销案例
  • 政协信息化网站建设的请示百合seo培训
  • wordpress首页不显示指定分类seo整体优化步骤怎么写
  • 重庆网站建设网络推广百度免费注册
  • 求一个手机能看的2022搜索引擎seo优化怎么做
  • 厦门做点击付费网站百度账号申请注册
  • 17网站一起做网店登录武汉百度信息流广告
  • 网站制作首选 新鸿儒nba篮网最新消息
  • 全网网站百度指数如何分析数据
  • 怎样在手机上制作网站宁波如何做抖音seo搜索优化