Course Logistics
Table of contents
선수과목
다음 과목을 선수 과목으로 한다.
- 통계학과 학부교과목 수학통계 1, 2 (326.311, 326.312)
- 통계학과 학부교과목 데이터마이닝 방법 및 실습 (326.413) 또는 컴퓨터공학부 학부교 과목 기계학습개론 (4190.420)
즉 선형대수학 기초지식과 참고문헌 Wasserman (2004)에 소개되는 통계이론을 알고 있는 것을 전제로 한다. 만약 위의 선수과목을 수강하지 않은 경우 담당교수와 개별면담을 통해 수강신청여부를 결정한다. 다음과 같은 내용을 반드시 숙지해야 한다.
- Convergence in probability and distribution.
- Maximum likelihood estimation: Fisher information 3. Hypothesis testing
- Bayesian inference
- Linear regression
- Logistic regression
- Regularization
- Bayes classifiers.
- Support vector machine
- Determinants, eigenvalues and eigenvectors
참고문헌
강의는 Efron and Hastie (2021)를 기반으로 진행될 예정이다.
- Efron, B. and Hastie, T. (2021). Computer Age Statistical Inference: Algorithms, Ev- idence, and Data Science, Student Edition. Cambridge University Press. ISBN 978- 1108823418 (교재) - Available at https://hastie.su.domains/CASI/index.html.
- Hastie, T., Tibshirani, R. and Friedman, J. (2009). The Elements of Statistical Learn- ing: Data Mining, Inference, and Prediction, 2nd edition. Springer. ISBN 978-0387848570. (참고문헌) - Available at https://web.stanford.edu/~hastie/ElemStatLearn/.
- Murphy, P. K. (2022). Probabilistic Machine Learning: An Introduction. ISBN 978- 0262046824. (참고문헌),Available at https://probml.github.io/pml-book/book1.html .
- Wasserman, L. (2004). All of Statistics: Concise Course in Statistical Inference. Springer. ISBN 978-0387402727. (참고문헌) - Available at http://link.springer.com/book/10.1007/978-0-387-21736-9 on campus
평가방법
격주로 숙제가 나갈 예정이며 숙제는 숙제제출 마감날짜 오후 5시까지 25동 2층의 숙제 제출함에 제출하여야 한다. 늦게 제출한 숙제는 0점 처리할 예정임.
시험일정. 중간고사와 기말고사 일정은 다음과 같다.
- 중간고사: 10월 25일 오후 6-8시 (수요일)
- 기말고사: 12월 15일 오후 6-9시 (금요일)
최종학점은 다음과 같이 계산된다.
- 수업참여도 5%
- 숙제 35%
- 중간고사 30%
- 기말고사 30%
프로그래밍 언어
이 과목에서 사용되는 예제는 모두 R를 사용하여 분석결과를 제시할 예정이다. R은 통계분석에 최적화된 언어로 파이썬, Matlab과 비교시 자료분석에 있어서 여러가지 장점이 있다. R에 관한 다양한 튜터리얼과 참고문헌은 http://www.r-project.org 에서 찾아볼 수 있으며 R에 과한 (조금 오래된) 뉴욕타임즈의 기사는 https://www.nytimes.com/2009/01/07/technology/business-computing/07program.html에서 읽을 수 있다. 한국어로 된 참고문헌으로는 R for Practical Data Analysis http://r4pda.co.kr/ 이나 권재명 (2017) 따라하면서 배우는 데이터 과학 http://dataninja.me/ipds-kr/을 추천한다.