【R语言编程——数据调用】
这里写自定义目录标题
- 可用库及数据集
- 外部数据导入方法
- 查看数据集信息
在R语言中,有多个库支持调用内置数据集或外部数据,包括studentdata
等教学或示例数据集。以下是常见的库和方法:
可用库及数据集
openintro
库
该库包含多个教学数据集,包括studentdata
。安装并加载库后可直接调用:
install.packages("openintro")
library(openintro)
data(studentdata)
datasets
库
R内置的基础库,提供经典数据集如mtcars
、iris
:
data(mtcars)
ISLR
库
《统计学习导论》配套数据集,如Auto
、College
:
install.packages("ISLR")
data(Auto)
gapminder
库
包含全球发展数据,适合可视化练习:
install.packages("gapminder")
data(gapminder)
外部数据导入方法
读取CSV文件
使用read.csv
或readr::read_csv
:
data <- read.csv("path/to/file.csv")
读取Excel文件
借助readxl
库:
library(readxl)
data <- read_excel("file.xlsx")
从数据库导入
使用DBI
和RSQLite
等库连接数据库:
library(RSQLite)
con <- dbConnect(RSQLite::SQLite(), "database.db")
data <- dbGetQuery(con, "SELECT * FROM table")
查看数据集信息
调用数据后,可用以下命令检查结构:
head(studentdata) # 查看前几行
str(studentdata) # 数据结构
summary(studentdata) # 统计摘要