Course Logistics

Table of contents

  1. 선수과목
  2. 참고문헌
  3. 평가방법
  4. 프로그래밍 언어

선수과목

다음 과목을 선수 과목으로 한다.

  • 통계학과 학부교과목 수학통계 1, 2 (326.311, 326.312)
  • 통계학과 학부교과목 데이터마이닝 방법 및 실습 (326.413) 또는 컴퓨터공학부 학부교 과목 기계학습개론 (4190.420)

즉 선형대수학 기초지식과 참고문헌 Wasserman (2004)에 소개되는 통계이론을 알고 있는 것을 전제로 한다. 만약 위의 선수과목을 수강하지 않은 경우 담당교수와 개별면담을 통해 수강신청여부를 결정한다. 다음과 같은 내용을 반드시 숙지해야 한다.

  1. Convergence in probability and distribution.
  2. Maximum likelihood estimation: Fisher information 3. Hypothesis testing
  3. Bayesian inference
  4. Linear regression
  5. Logistic regression
  6. Regularization
  7. Bayes classifiers.
  8. Support vector machine
  9. Determinants, eigenvalues and eigenvectors

참고문헌

강의는 Efron and Hastie (2021)를 기반으로 진행될 예정이다.

  1. Efron, B. and Hastie, T. (2021). Computer Age Statistical Inference: Algorithms, Ev- idence, and Data Science, Student Edition. Cambridge University Press. ISBN 978- 1108823418 (교재) - Available at https://hastie.su.domains/CASI/index.html.
  2. Hastie, T., Tibshirani, R. and Friedman, J. (2009). The Elements of Statistical Learn- ing: Data Mining, Inference, and Prediction, 2nd edition. Springer. ISBN 978-0387848570. (참고문헌) - Available at https://web.stanford.edu/~hastie/ElemStatLearn/.
  3. Murphy, P. K. (2022). Probabilistic Machine Learning: An Introduction. ISBN 978- 0262046824. (참고문헌),Available at https://probml.github.io/pml-book/book1.html .
  4. Wasserman, L. (2004). All of Statistics: Concise Course in Statistical Inference. Springer. ISBN 978-0387402727. (참고문헌) - Available at http://link.springer.com/book/10.1007/978-0-387-21736-9 on campus

평가방법

격주로 숙제가 나갈 예정이며 숙제는 숙제제출 마감날짜 오후 5시까지 25동 2층의 숙제 제출함에 제출하여야 한다. 늦게 제출한 숙제는 0점 처리할 예정임.

시험일정. 중간고사와 기말고사 일정은 다음과 같다.

  • 중간고사: 10월 25일 오후 6-8시 (수요일)
  • 기말고사: 12월 15일 오후 6-9시 (금요일)

최종학점은 다음과 같이 계산된다.

  • 수업참여도 5%
  • 숙제 35%
  • 중간고사 30%
  • 기말고사 30%

프로그래밍 언어

이 과목에서 사용되는 예제는 모두 R를 사용하여 분석결과를 제시할 예정이다. R은 통계분석에 최적화된 언어로 파이썬, Matlab과 비교시 자료분석에 있어서 여러가지 장점이 있다. R에 관한 다양한 튜터리얼과 참고문헌은 http://www.r-project.org 에서 찾아볼 수 있으며 R에 과한 (조금 오래된) 뉴욕타임즈의 기사는 https://www.nytimes.com/2009/01/07/technology/business-computing/07program.html에서 읽을 수 있다. 한국어로 된 참고문헌으로는 R for Practical Data Analysis http://r4pda.co.kr/ 이나 권재명 (2017) 따라하면서 배우는 데이터 과학 http://dataninja.me/ipds-kr/을 추천한다.