当前位置: 首页 > news >正文

Deploy StarRocks with Docker

官网文档:Deploy StarRocks with Docker | StarRocks

如果Downloading 不动,停止后再启动。

#启动:starrocks
docker run -p 9030:9030 -p 8030:8030 -p 8040:8040 -itd --name quickstart starrocks/allin1-ubuntu#下载数据包
curl -O https://raw.githubusercontent.com/StarRocks/demo/master/documentation-samples/quickstart/datasets/72505394728.csvcurl -O https://raw.githubusercontent.com/StarRocks/demo/master/documentation-samples/quickstart/datasets/NYPD_Crash_Data.csv# MySql终端链接
docker exec -it quickstart mysql -P 9030 -h 127.0.0.1 -u root --prompt="StarRocks > "
##  --prompt 解释:是 MySQL 客户端的一个选项,用于自定义命令行提示符。

 连接成功:

或使用Mysql工具连接  ROOT 密码为空

创建数据库、表

CREATE DATABASE IF NOT EXISTS quickstart;

USE quickstart;

 

报错:curl: (3) URL using bad/illegal format or missing URL

原因:PowerShell 中使用的是交互式输入方式(即每行手动输入),这种方式容易导致 curl 解析参数失败。

特别是当你在终端中逐行输入命令时,PowerShell 的 curl.exe 会尝试立即执行它已经“看到”的内容,而不是等待整个命令拼接完成。

优化通过脚本通过Python写入

import requests
from requests.auth import HTTPBasicAuth
import os# 配置参数
STARROCKS_URL = "http://localhost:8030/api/quickstart/crashdata/_stream_load"
CSV_FILE_PATH = "./NYPD_Crash_Data.csv"HEADERS = {"label": "crashdata-0","column_separator": ",","skip_header": "1","enclose": '"',"max_filter_ratio": "1","columns": ("tmp_CRASH_DATE, tmp_CRASH_TIME, ""CRASH_DATE=str_to_date(concat_ws(' ', tmp_CRASH_DATE, tmp_CRASH_TIME), '%m/%d/%Y %H:%i'),""BOROUGH,ZIP_CODE,LATITUDE,LONGITUDE,LOCATION,""ON_STREET_NAME,CROSS_STREET_NAME,OFF_STREET_NAME,""NUMBER_OF_PERSONS_INJURED,NUMBER_OF_PERSONS_KILLED,""NUMBER_OF_PEDESTRIANS_INJURED,NUMBER_OF_PEDESTRIANS_KILLED,""NUMBER_OF_CYCLIST_INJURED,NUMBER_OF_CYCLIST_KILLED,""NUMBER_OF_MOTORIST_INJURED,NUMBER_OF_MOTORIST_KILLED,""CONTRIBUTING_FACTOR_VEHICLE_1,CONTRIBUTING_FACTOR_VEHICLE_2,""CONTRIBUTING_FACTOR_VEHICLE_3,CONTRIBUTING_FACTOR_VEHICLE_4,""CONTRIBUTING_FACTOR_VEHICLE_5,COLLISION_ID,""VEHICLE_TYPE_CODE_1,VEHICLE_TYPE_CODE_2,VEHICLE_TYPE_CODE_3,""VEHICLE_TYPE_CODE_4,VEHICLE_TYPE_CODE_5"),"Expect": "100-continue"
}USER = "root"
PASSWORD = ""  # 如果设置了密码,请填写(如 'your_password')def upload_to_starrocks():if not os.path.exists(CSV_FILE_PATH):print(f"❌ 文件 {CSV_FILE_PATH} 不存在")returnprint("⏳ 正在上传文件...")with open(CSV_FILE_PATH, "rb") as f:try:response = requests.put(STARROCKS_URL,auth=HTTPBasicAuth(USER, PASSWORD),headers=HEADERS,data=f,timeout=6000  # 设置最大等待时间)except requests.exceptions.Timeout:print("❌ 请求超时,请检查网络或 StarRocks 是否正常")returnexcept Exception as e:print(f"❌ 发生异常:{e}")returnprint("✅ 响应状态码:", response.status_code)try:print("📄 响应内容:\n", response.json())except Exception:print("📄 原始响应内容:\n", response.text)if __name__ == "__main__":upload_to_starrocks()

 这个脚本试了很慢,采用文件上传至容器内的方式,导入成功

docker cp ../weather/output/isd_lite_2021_china_with_station_info.csv quickstart:/data/tmp

root@46b4bd1c3a6a:/data/tmp# curl --location-trusted -u root \
>     -T ./isd_lite_2021_china_with_station_info.csv \
>     -H "label:gz-weather-0" \
>     -H "column_separator:," \
>     -H "skip_header:1" \
>     -H "enclose:\"" \
>     -H "max_filter_ratio:1" \
>     -H "columns:year,month,day,hour,temp,dew_point,slp,wind_dir,wind_speed,sky_cover,precip_1hr,precip_6hr,station_id,station_name,country,latitude,longitude,elevation,datetime" \

 成功导入2000万条数据速度极快

http://www.dtcms.com/a/263318.html

相关文章:

  • ubuntu源码安装python3.13遇到Could not build the ssl module!解决方法
  • Deepoc 大模型在无人机行业应用效果的方法
  • Python函数参数实例练习--输出信息
  • 抗量子域名系统:全面的系统级研究
  • 前端领域的技术热点与深度解析
  • 对selenium进行浏览器和驱动进行配置Windows | Linux
  • [面试]手写题-Promise.all() Promise.race()
  • 博图SCL编程:结构体(STRUCT)使用详解与实战案例
  • HTML<span>元素详解
  • 安装bcolz包报错Cython.Compiler.Errors.CompileError: bcolz/carray_ext.pyx的解决方法
  • 条件运算符和逗号运算
  • Intel Fortran Compiler (ifx) 详细使用指南:新一代 Fortran 编译器在流体动力学模拟中的应用
  • 51单片机CPU工作原理解析
  • python环境快速搭建
  • 深入比较 Gin 与 Beego:Go Web 框架的两大选择
  • Spring Boot 统一功能处理:拦截器详解
  • 机器视觉检测系统的影响因素解析
  • Prompt 精通之路(七)- 你的终极 AI 宝典:Prompt 精通之路系列汇总
  • 《Building REST APIs with Flask》读后感
  • 打造现代Web应用的高效解决方案:Full Stack FastAPI模板
  • JVM 垃圾回收(GC)笔记
  • Nestjs框架: Nestjs 复杂企业应用场景架构设计分析
  • WPF中依赖属性和附加属性
  • API接口安全-2:签名、时间戳与Token如何联手抵御攻击
  • 时序数据集---UWave
  • 显著性预测 SUM
  • tcpdump工具交叉编译
  • 《JMS事务性会话彻底解析:消息监听中的 commit、rollback 和幂等设计》
  • 每天一个前端小知识 Day 17 - 微前端架构实战与 Module Federation
  • 记录H5内嵌到flutter App的一个问题,引发后面使用fastClick,引发后面input输入框单击无效问题。。。