数据结构
对象的5种类型:
1. 字符character
2. 数值 numeric
3. 整数 integer
4. 复数 complex (1+2i)
5. 逻辑 logical (TRUE/FALSE)
属性:
1. 名称 name 2. 纬度 dimensions:行,列 3. 类型 Class 4. 长度 length
向量(vector):
1. 只能包含同一类型的对象
2. 创建向量
vector() 向量
c() 字符函数
as.logical()/as.numeric()/as.character() 强行转换类型
矩阵matrix
1.向量+纬度属性(整数向量:nrow,ncol)
x <- matrix(data(1:10),ncol=2, nrow=5)
矩阵运算赋值的时候按列赋值,先第一列赋值完才赋值到第二列
2. 创建矩阵
——matrix():先列后行
——vectro()+dim()
——cbind()列拼接矩阵, rbind()行拼接矩阵
——attributes()判断矩阵类型
数组 (array)
——与矩阵类似,但是纬度可以大于2
——创建数组
x <- array(1:24, dim = c(4,6))——简单数组
x1 <- array(1:24,dim = c(2,3,4))——有4组的2行3列的矩阵
列表(list):
——可以包含不同类型的对象
——创建列表
list()
l <- list("a", 2, 10L, 3+4i, TRUE)
l2 <- list(a=1, b=2, c=3)
l3 <- list(c(1,2,3), c(4,5,6,7))
x <- matrix(1:6,nrow = 2,ncol = 3)
dimnames(x) <- list(c("a","b"), c("c","d","e"))给矩阵的每行每列命名
因子(factor):
——分类数据/有序VS.无序
——整数向量+标签(label)(优于整数向量)
Male/Female vs. 1/2
常用语lm(), glm()
x <- factor(c("female","female","male","male","female"))
y <- factor(c("female","female","male","male","female"), levels = c("male","female"))——c的括号里谁在(male)前面谁是(male)基线水平
table(x) 把x列表按表格显示
缺失值(missing value)
——NA/NaN: NaN(数字的缺失值)属于NA(数字,字符等), NA不属于NaN
——NA有类型属性:integer NA,
character NA等
——is. na()/is.nan()
数据框(data frame)
——存储为表格数据(tabular data)
——视为各元素长度相同的列表
每个元素代表一列数据
每个元素的长度代表行数
元素类型可以不同
日期与时间(date, time)
——日期: Date
距离1970-01-01的天数/date()/Sys.Date()
weekdays()/ months() / quarters()
——时间: POSIXct / POSIXlt
距离1970-01-01 的秒数/ Sys.time()
POSIXct: 整数,常用于存入数据框
POSIXit: 列表,还包含星期、年、月、日等信息
共同學(xué)習(xí),寫下你的評論
評論加載中...
作者其他優(yōu)質(zhì)文章