-
3-5Lattice 繪圖系統(tǒng)之基礎知識
lattice包:xyplot/bwplot/histogram等
? ? ? ? ? ? ? ? 格式:xyplot(y~x|f*g,data)(f*g的含義是分類變量)
? ? ? ? ? ? ? ? panel函數(shù),用于控制每個面板內(nèi)的繪圖
grid包:實現(xiàn)了獨立于base的繪圖系統(tǒng)
? ? ? ? ? ? ? lattice包是基于grid創(chuàng)建的;很少直接從grid包調(diào)用函數(shù)
Lattice與Base的重要區(qū)別:
Base繪圖函數(shù)直接在圖形設備上繪圖
Lattice繪圖函數(shù)返回trellis類對象,而不是直接繪圖(打印函數(shù)真正執(zhí)行了在設備上繪圖,命令執(zhí)行時,trelllis類對象會被自動打?。?/p>
查看全部 -
3-4R語言 基本繪圖系統(tǒng)之全局參數(shù)
par("bg")(作圖面板的背景顏色)
par("col")(圖的顏色為黑色)
par("mar")(圖的邊距)
par("mfrow")(1行1列,只能做一個圖)
par("mfcol")(同上,以列的方式做填充)
?par
舉例:
1.par(mfrow=c(1,2))
? ?hist(airquality$Temp)
? ?hist(airquality$Wind)
2.par(mfcol=c(2,1))
? ?hist(airquality$Temp)
? ?hist(airquality$Wind)
查看全部 -
3-3 R語言 基本繪圖系統(tǒng)之實踐
hist(airquality$Wind,xlab="Wind")(數(shù)值型變量風速的柱狀圖)
boxplot(airquality$Wind,xlab="Wind",ylab="Speed(mph)")(箱圖)
boxplot(Wind~Month,airquality,xlab="Month",ylab="Speed(mph)")(一個分類變量和一個數(shù)值變量的關(guān)系,每個月份的風速)
plot(airquality$Wind,airquality$Temp)(風速和溫度的散點圖)=with(airquality,plot(Wind,Temp))
title(main="Wind and Temp in NYC")(加標題,可以直接將括號中的命令放入with命令中)
with(airquality,plot(Wind,Temp,main="Wind and Temp in NYC",type="n"))(除了點以外其他的信息都有)
with(subset(airquality,Month==9),points(Wind,Temp,col="red"))(按月份畫點,不同月份顯示的點有不同的顏色)
with(subset(airquality,Month%in%c(6,7,8)),points(Wind,Temp,col="red"))
fit<-lm(Temp~Wind,airquality)(擬合模型)
abline(fit,lwd=2)
legend("topright",pch=1,col=c("red","blue","black"),legend=c("Sep","May","Other"))(點的顏色代表的含義)
查看全部 -
3-2 基本繪圖系統(tǒng)之基礎知識
繪圖函數(shù)(graphics包):
plot/hist(柱狀圖)/boxplot/points/lines/text(指定位置添加文字)/title/axis(添加坐標軸)
調(diào)用函數(shù)會啟用一個圖形設備(如果沒有正在運行的圖形設備),并設備上繪圖
基本繪圖系統(tǒng)+屏幕設備
plot():plot(x,y,.....)? ?重要參數(shù):xlab/ylab/lwd/lty/pch/col
?par(了解更多重要參數(shù))
par():用于設置全局參數(shù)(作用于R中的所有plot繪圖)
bg(背景顏色)/mar(作圖時與邊界的邊距)/las(呈現(xiàn)x的坐標的話 輸入的漢字是橫排版或豎排版)/mfrow(當前的畫板分為幾行幾列,并且作圖時按照行來填充)/mfcol(當前的畫板分為幾行幾列,并且作圖時按照列來填充)
這些參數(shù)可以在每次plot之前進行修改
查看全部 -
第3章 R的繪圖系統(tǒng)
3-1R語言 三大繪圖系統(tǒng)簡介
基本繪圖系統(tǒng)(Base Plotting System ):
特點是繪圖始于空白帆布,所以有人稱為藝術(shù)家的調(diào)色板。需要事先計劃(圖里的點線以及坐標軸都是人為加上去的);直觀地實時反映繪圖和分析數(shù)據(jù)的邏輯
兩步=圖+修飾/添加=執(zhí)行一系列函數(shù)
適合繪制2D圖
Lattice繪圖系統(tǒng)(Lattice Plotting System):
繪圖=使用一次函數(shù)調(diào)用(一次成圖)
特別適用于觀測變量間的交互:在變量z的不同水平,變量y如何隨變量x變化
ggplot2繪圖系統(tǒng)(ggplot2 Plotting System):
The Grammar of Graphics
圖:動詞、名詞、形容詞等
本質(zhì)是把數(shù)據(jù)映射到幾何客體(points/lines/bars)的美學屬性(顏色/形狀/大?。?/p>
可以視為基本繪圖系統(tǒng)+Lattice繪圖系統(tǒng)的合體
既可以像Lattice繪圖系統(tǒng)一樣自動處理標題/文字說明/空間等,但也像基本繪圖系統(tǒng)允許通過添加注釋進行修改
查看全部 -
2-3分類變量的特征和可視化
一個分類變量的可視化:頻率表(frequency table)、條形圖(bar plot)
兩個分類變量的關(guān)系:關(guān)聯(lián)表(contingency table)、相對頻率表(relative frequencies)、分段條形圖、相對頻率分段條形圖、馬賽克圖(mosaicplot)
一個分類變量、一個數(shù)值變量的關(guān)系:并排箱圖(side-by-side box plot)
查看全部 -
2-2數(shù)值變量的特征和可視化
集中趨勢
分散趨勢
x<-c(1,9,2,8,3,9,4,5,7,6)
mean(x)
median(x)
var(x)
sd(x)
summary(x)
穩(wěn)健統(tǒng)計量(robust statistics):中位數(shù)、四分位差(受極端值影響小)
一個變量的可視化:
柱狀圖(histogram)、點圖(dot plot)(分布)、箱圖(box plot)(中位數(shù)、分位點、極端值)
兩個變量的關(guān)系:
散點圖(scatter plot):方向、形狀、強度、極端值
查看全部 -
第2章 了解數(shù)據(jù)特征
2-1R語言數(shù)據(jù)基礎
以上為1個數(shù)據(jù)矩陣
變量的類型:數(shù)值(quantitative):連續(xù)性和離散型
? ? ? ? ? ? ? ? ? ? 分類:無序(不可比較)? ?有序(順序有意義)
變量間的關(guān)系(對應不同的可視化方法和統(tǒng)計分析方法)
? ? ? ? ? ? ? ? ? ??
查看全部 -
1-3完整的數(shù)據(jù)分析流程
定義研究問題
定義理想的數(shù)據(jù)集
確定能夠獲取什么數(shù)據(jù)
獲取數(shù)據(jù)
清理數(shù)據(jù)
探索性分析(數(shù)據(jù)可視化)
統(tǒng)計分析/建模(機器學習)等
解釋/交流結(jié)果(數(shù)據(jù)可視化)
挑戰(zhàn)結(jié)果(有沒有其他可能)
書寫報告(Reproducibe原則)
假設驅(qū)動 vs? 數(shù)據(jù)驅(qū)動
查看全部 -
ggplot
查看全部 -
3-6沒看懂
查看全部 -
side-by-side box plot
查看全部 -
兩個邊線的含義不是值域。是Q1-1.5IQR
Q3+1.5IQR。
豎線外是極端值。??異常值
查看全部 -
11111
查看全部 -
11111111
查看全部
舉報