통계 데이터과학과 4 데이터마이닝 1. 최근 생성형 AI에 관한 관심이 고조되고 있다. 생성형 AI는 많은 양의 데이터의 축적과 학습(learning)에 토대를 두고 있다. 생성형 AI의 발전과 데이터마이닝 기법의~ 다운로드
[목차]
1. 최근 생성형 AI에 관한 관심이 고조되고 있다. 생성형 AI는 많은 양의 데이터의 축적과 학습(learning)에 토대를 두고 있다. 생성형 AI의 발전과 데이터마이닝 기법의 연관성 유무를 판단하고 그 근거를 기술하시오. 단, 필자의 생각을 독창적으로 기술하시오. (6점)
2. 와인품질 데이터에 로지스틱 회귀모형을 적합하고자 한다. 과거의 분석 경험을 통해 alcohol 변수와 sulphates 두 변수가 매우 중요한 변수라는 것이 밝혀졌다고 하자. ① 이 두 변수만을 입력변수로 하여 와인 품질을 예측하는 로지스틱 회귀모형을 적합하시오. 또한, 이 적합 결과를 교재의 ② 전체 변수를 모두 넣고 분석한 결과 및 ③ 변수 선택을 하여 몇 개의 변수만 선택하고 분석한 결과와 비교하시오. (6점)
3. 입력변수와 목표변수가 모두 범주형인 어떤 데이터의 두 입력 변수 X1과 X2는 1, 2, 3 등 세 가지 값을 갖고, 목표변수는 Y=1, Y=2의 2개의 범주를 갖는다고 할 때, 각 집단별로 X1과 X2에 대하여 분할표를 아래와 같이 생성하였다. 물음에 답하시오. (목표변수가 범주형임에 유의)
Y=1 Y=2
① 분할표를 보고 이 데이터의 원형을 유추하여 생성하시오. 단, 데이터 세트의 첫째 줄에는 변수명 X1, X2, Y를 명시하시오. (2점)
② 지니지수를 이용하여 최초 분할 시 최적의 분리점을 찾으시오. (2점)
③ 뿌리노드가 한번 분할된 분류의사결정나무를 생성하고, 두 자식노드에서 관찰치들의 집단별 빈도를 밝히시오. (2점)
④ 위에서 생성된 분류의사결정나무(한 번만 분할)의 불순도 감소분을 계산하시오. (3점)
4. 배깅, 부스팅, 랜덤포레스트에 관하여 다음에 답하시오. (교재에 명시된 알고리즘(p.116∼122) 참조)
① 각 알고리즘을 쓰시오. (3점)
② 각 알고리즘에 명시되어 있는 수식을 비교하여 타 알고리즘과 구별되는 특징적인
...
1. 최근 생성형 AI에 관한 관심이 고조되고 있다. 생성형 AI는 많은 양의 데이터의 축적과 학습(learning)에 토대를 두고 있다. 생성형 AI의 발전과 데이터마이닝 기법의 연관성 유무를 판단하고 그 근거를 기술하시오. 단, 필자의 생각을 독창적으로 기술하시오. (6점)
2. 와인품질 데이터에 로지스틱 회귀모형을 적합하고자 한다. 과거의 분석 경험을 통해 alcohol 변수와 sulphates 두 변수가 매우 중요한 변수라는 것이 밝혀졌다고 하자. ①…(생략)
%EC%97%90%20%ED%86%A0%EB%8C%80%EB%A5%BC%20%EB%91%90%EA%B3%A0%20%EC%9E%88%EB%8B%A4.%20%EC%83%9D%EC%84%B1%ED%98%95%20AI%EC%9D%98%20%EB%B0%9C%EC%A0%84%EA%B3%BC%20%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%A7%88%EC%9D%B4%EB%8B%9D%20%EA%B8%B0%EB%B2%95%EC%9D%98~_hwp_09_.gif)
(이미지를 클릭하시면 확대/미리보기를 볼 수 있습니다.)