문제 1
단답형
텍스트 데이터를 분석해 데이터의 빈도(출현 횟수)나 중요도를 시각적으로 보여주는 시각화 방법을 무엇이라고 할까요?
워드 클라우드
워드클라우드
World cloud
Worldcloud
힌트
텍스트 데이터를 분석해 데이터의 빈도(출현 횟수)나 중요도를 시각적으로 보여주는 시각화 방법을 워드클라우드라고 합니다.
워드 클라우드
워드클라우드
World cloud
Worldcloud
텍스트 데이터를 분석해 데이터의 빈도(출현 횟수)나 중요도를 시각적으로 보여주는 시각화 방법을 워드클라우드라고 합니다.
데이터가 한 쪽으로 치우쳐서 전체를 제대로 보여주지 못하는 것을 데이터 편향성이라고 합니다.
질문을 따라가며 선택지를 분류하는 방식을 뜻하는 데이터 분석 기법은 의사결정트리입니다.
의사결정트리의 모델은 트리가 깊어질수록 학습한 모델의 정확도가 높아집니다. 정확도가 높은 것이 모델의 성능을 결정적으로 좌우하지 않습니다.
선형관계는 한 값이 커지면 다른 값도 일정한 비율로 커지거나 작아지는 관계를 말합니다. 그래프로 그렸을 때 직선과 비슷한 모양이 나옵니다.
박스형 그래프는 박스 안에 포함되어있지 않은 데이터의 이상치 여부를 확인하기 좋습니다.
데이터 학습은 데이터 전처리 과정에 포함되지 않습니다.
라벨 인코딩은 범주마다 숫자를 부여하는 방식으로 범주가 많을 때 부여한 숫자의 크기에 따라 중요도를 다르게 인식할 수 있는 단점이 있습니다.
의사결정트리의 깊이를 제한해 과적합 모델을 개선할 수 있습니다.