当前位置: 首页 > news >正文

lance + duckdb 替代 parquet + pandas

import duckdb
# DuckDB 直接查询 Lance 数据集
duck_df = duckdb.query("""SELECTcategory,COUNT(*) as count,AVG(price) as avg_price,MAX(price) as max_priceFROM datasetWHERE a > 20GROUP BY categoryORDER BY avg_price DESC
""")
print(type(duck_df))       # <class '_duckdb.DuckDBPyRelation'>
result = duck_df.to_df()   # 不推荐 会全部加载到内存 除非是最终结果
type(result)  #  pandas.core.frame.DataFrame
duck_df.show() # pyarrow的show

支持 with...as...

# 支持视图查询
duckdb.query("""
withv1 as (select * from duck_df where count > 15),v2 as (select * from v1 where avg_price > 400
)
select * from v2
""").show()

支持临时试图

# 创建临时试图
duckdb.sql("create or replace view v_tmp1 as select * from duck_df where category = 'A'")
duckdb.query("select *,1 as f1 from v_tmp1").show()

http://www.dtcms.com/a/520376.html

相关文章:

  • CHIA考试报告手册
  • Linux操作系统学习之---线程互斥(互斥锁)
  • 【物联网控制体系项目实战】—— 整体架构流程与 WS 实现
  • dedecms网站后台模板做汽车网站费用
  • 做网站就上房山华网天下大型网站如何开发
  • 从「能用」到「可靠」:深入探讨C++异常安全
  • 如何让AI更好地理解中文PDF中的复杂格式?
  • Mount Image Pro,在取证安全的环境中挂载和访问镜像文件内容
  • 四元数(Quaternion)之Eigen::Quaternion使用详解(5)
  • 太平洋建设集团有限公司网站wordpress标签扩展
  • 二级域名解析网站天津效果图制作公司
  • Linux iptables:四表五链 + 实用配置
  • Ceph 简介
  • idea开启远程调试
  • UE5 蓝图-6:汽车蓝图项目的文件夹组织与运行效果图,
  • 编程竞赛小技巧
  • CrewAI 核心概念 团队(Crews)篇
  • 小九源码-springboot100-基于springboot的房屋租赁管理系统
  • 珠宝网站建设公司微信公众号推文模板素材
  • 自己可以做类似淘宝客网站吗北京公司网站制作流程
  • winform迁移:从.net framework 到 .net9
  • 计算机视觉领域顶会顶刊
  • 华为OD, 测试面经
  • 好听的公司名字大全附子seo教程
  • AiOnly深度体验:从注册到视频生成,我与“火山即梦”的创作之旅
  • 电商网站建设思维导图澧县网站建设
  • 网站app怎么制作建英语网站
  • 阮一峰《TypeScript 教程》学习笔记——泛型
  • 数据结构——三十、图的深度优先遍历(DFS)(王道408)
  • Linux中的DKMS机制