KHUDA 활동 아카이브 (10) 썸네일형 리스트형 Ch 2. 데이터 다루기 - 수상한 생선을 조심해라! 이 글은 이전 글인 " Ch 1. 나의 첫 머신러닝 - 이 생선의 이름은 무엇인가요? " 에서 이어지는 내용입니다. 앞에서 우리는 도미와 빙어를 구분해주는 머신러닝을 직접 개발해봤습니다. k-최근접 알고리즘 이라고 불리는걸 활용했죠. 여기서 간단히 용어를 정리해보겠습니다. 입력 : 주어지는 입력 데이터를 의미. 앞의 예시에서는 [길이,무게] 한 쌍이 입력 데이터였습니다. 타깃 : 주어진 입력의 정답을 의미. 앞의 예시에서는 도미가 1, 빙어가 0으로 표기한게 입력에 대한 정답, 즉 타깃이었구요. 훈련 데이터 : 입력과 타깃을 통틀어 부르는 용어. 앞의 예시에서는 " [25.4, 242.0] 는 1 " 이라는게 훈련데이터가 되겠네요. 특성 : 데이터를 표현하는 하나의 성질 앞의 예시에서는 '무게, 길이'가.. Ch 1. 나의 첫 머신러닝 - 이 생선의 이름은 무엇인가요? 어떤 분야를 처음 접할 때, 가장 먼저 소개하는 것은 역시 역사입니다. 역사는 물론 중요하죠. 하지만 우리의 주요 관심사는 역사가 아닌, "인공지능이 무엇인지, 어떻게 구현되는지" 일 것입니다. 이에 대해 간략하게 설명하고 넘어가겠습니다. 인공지능 사람처럼 '학습' 하고, '추론' 할 수 있는 지능을 가진 시스템을 의미합니다. 머신러닝 이 인공지능의 '지능' 을 구현하기 위한 분야를 의미합니다. 즉, 인공지능을 기술적으로 구현하는 분야가 머신러닝인 것입니다. 우리의 목적은 최종적으로 인공지능을 구현해보는 것입니다. 그렇다면 당연히 머신러닝을 사용해야겠죠? 현재 이 머신러닝을 가장 구현하기 쉬운 언어가 파이썬 입니다. 왜냐하면, 파이썬 내에 있는 사이킷런(scikit-learn) 이라는 라이브러리를 이용하.. 이전 1 2 다음