데이터

교재 예제 데이터

austenbooks

Jane Austen Books.

binaryclass1_test

두 범주 테스트 표본 1.

binaryclass1_train

두 범주 학습표본 표본 1.

binaryclass2

두 범주 학습표본 2.

binaryclass3_test

두 범주 테스트 표본 3.

binaryclass3_train

두 범주 학습표본 표본 3.

binaryclass4_inseparable

두 범주 학습표본 표본 4 - 선형분리불가능.

binaryclass4_nonlinear

두 범주 학습표본 표본 4 - 비선형분리.

binaryclass4_separable

두 범주 학습표본 표본 4 - 선형분리가능.

binaryclass5

두 범주 학습표본 표본 5.

biometric

나이, 키, 몸무게 학습표본.

clusterdata1

군집분석 데이터 1.

clusterdata2

군집분석 데이터 2.

clusterdata3

군집분석 데이터 3.

clusterdata4

군집분석 데이터 4.

customerclass_test

고객 새 표본.

customerclass_train

고객 학습표본.

defecttype

공정변수-불량 종류 데이터

financials

국내 증권회사의 주요 재무제표

gainchart_group1

집단별 관측빈도.

gainchart_yfreq

실제범주별 관측빈도.

healthbehavior

건강 문진

iris90

붓꽃 데이터.

multiplsreg

다종속변수 학습표본.

pcrdata

주성분 회귀분석 학습표본.

pcusage1

PC 사용 데이터 1.

pcusage2

PC 사용 데이터 2.

purchasedata_reference

시장바구니 구매 데이터.

purchasedata_target

시장바구니 목표고객 구매 데이터.

ratingdata_reference

시장바구니 평점 데이터.

ratingdata_target

시장바구니 목표고객 평점 데이터.

rollsteel

열연코일 인장강도 데이터.

student

학생 평점 학습표본.

telconnection

성능변수에 따른 통신 만족도.

telsatisfaction

통신서비스 만족도.

telsatisfaction_range

통신서비스 만족도 변수 범위.

trafficviolation

운전경력에 따른 사고횟수.

transactiondata

트랜잭션.

transactionseq

고객 시퀀스.

wordtfidf

문서별 단어 TF-IDF 가중치.

wordweight

사용자 단어 가중치.

판별분석

fisher_ld()

피셔 선형 판별 함수.

fisher_ld_prediction()

피셔 선형 판별 함수 예측값.

fisher_ld_threshold()

피셔 선형 판별 함수 분류 경계값.

ld_fun()

범주별 판별함수 - 선형 판별 분석.

predict_da()

새 데이터에 대한 범주 예측.

qd_fun()

범주별 판별함수 - 이차 판별 분석.

score_da()

범주별 판별함수값 계산.

로지스틱 회귀분석

fit_binary_logistic_regression()

이분 로지스틱 회귀분석 계수 추정.

fit_multinom_logistic_regression()

명목형 로지스틱 회귀분석 계수 추정.

fit_ordinal_logistic_regression()

서열형 로지스틱 회귀분석 계수 추정.

grad_binary_logistic_regression()

이분 로지스틱 회귀분석 로그우도함수의 gradient.

loglik_binary_logistic_regression()

이분 로지스틱 회귀분석 로그우도함수.

loglik_multinom_logistic_regression()

명목형 로지스틱 회귀분석 로그우도함수.

loglik_ordinal_logistic_regression()

서열형 로지스틱 회귀분석 로그우도함수.

posterior_binary_logistic_regression()

이분 로지스틱 회귀분석 사후확률 추정.

회귀분석

anova_linear_regression()

다중선형회귀모형 분산분석표.

evaluate_linear_regression()

다중회귀모형 선택척도 산출

fit_linear_regression()

다중회귀모형 선형 회귀계수 추정

fn_sum_of_squares_ols()

회귀 제곱합

gr_sum_of_squares_ols()

회귀 제곱합 미분값

mallows_c()

맬로우즈 Cp 통계량

predict_linear_regression()

다중선형회귀모형 미래반응치 예측.

select_variables_stepwise()

다중회귀모형 단계적 선택방법을 통한 회귀모형 입력변수 선택

test_type2_linear_regression()

다중회귀모형 Type II 제곱합을 이용한 F 검정

ttest_linear_regression()

다중선형회귀모형 회귀계수 검정.

vif_linear_regression()

다중회귀모형 분산팽창계수

주성분분석

fit_pca()

주성분 분해

fit_pcr()

주성분 회귀분석

nipals_pca()

NIPALS 알고리즘 - 주성분분해

predict_pca()

주성분 스코어 계산.

predict_pcr()

주성분 회귀분석 반응치 예측.

부분최소자승 회귀분석

fit_plsr()

부분최소자승 회귀분석

nipals_plsr()

NIPALS 알고리즘 - 부분최소자승 회귀분석

nipals_plsr_n()

NIPALS 알고리즘 - 부분최소자승 회귀분석

기타 함수들

group_mean()

범주별 평균벡터. Group mean.

group_nest()

범주별 데이터 프레임. Group nest.

group_summary()

범주별 통계치. Group summary.

group_variance()

범주별 표본 분산-공분산행렬. Within-group variance-covariance matrix.

pooled_variance()

합동 분산-공분산행렬. Pooled variance.

factor_to_matrix()

범주(factor)형 벡터를 행렬로 변환.

normalize_to_prob()

비음행렬의 값을 확률로 변환.

eval_mad()

평균절대오차

eval_mse()

평균제곱오차

eval_rmse()

평균제곱오차의 제곱근