데이터 분석 및 시각화 정리
개발 관련 개념
1. 주요 개념 정리Series : 1차원 데이터DataFrane : 2차원 데이터index(인덱스) : 행 순서, *각 행(row)를 식별하기 위한 고유한 키(Key) → *데이터에 접근할 수 있는 주소 값column(컬럼) : 세로줄, 같은 종류의 속성이 모여있는 집합 → 특정한 항목에 대한 모든 값이 들어 있는 데이터row(행) : 가로줄, 하나의 데이터 기록(레코드)의 집합2. 데이터 실분석Data.co.kr 공공데이터포털에서 실데이터의 csv 파일을 불러올 수 있다.→ 여기에서 얻은 csv 파일을 판다스 read_csv 함수를 통해 불러올 수 있다.데이터 분석을 위한 계산을 위해 라이브러리 numpy를 사용하며, 이를 시각화 하기 위하여 matplot 뭐시기, seaborn을 사용함.https:..
손실함수의 의미 및 대표적 손실함수 (MAE, MSE)
개발 관련 개념
들어가기에 앞서 본 페이지는 탐구의 목적에 비중이 있기 때문에간략한 요약을 원한다면 다른 전문가의 블로그를 참조하는 것을 추천한다.1) 손실함수가 무엇인가머신러닝에서의 손실함수(loss function)는 모델이 얼마나 높은 정확도로 예측하는지를 평가하는 지표로 쓰인다.정확하게는, 추론값과 정답값을 기반으로 오차값을 리턴하여 모델의 가중치를 조정할 수 있도록 사용된다. 2) 손실함수의 종류가 나뉘는 이유가 무엇일까어떤 모델이 추론한 결과가 종합적으로 얼마나 틀렸는지의 정도를 알아낼 수 있을까?알아낼 방법은 다양할 것이다. 큰 오차가 없어야 하는 데이터라면 작은 오차도 최대화하여 그 정도를 매길 수 있을 것이고, 평균 오차가 적어야 하는 데이터라면 오차의 크기와 무관하게 일정하게 가중하여 그 정도를 매길..