파이썬 scikit-learn 예제

clf(분류기용) 추정기 인스턴스가 먼저 모델에 장착됩니다. 즉, 모델에서 배워야 합니다. 이것은 맞춤 방법으로 교육 세트를 전달하여 수행됩니다. 학습 집합의 경우 예측에 예약할 마지막 이미지를 제외한 데이터 집합의 모든 이미지를 사용합니다. digits.data의 마지막 항목을 제외한 모든 항목을 포함하는 새 배열을 생성하는 [:-1] Python 구문으로 학습 세트를 선택합니다. 예제. 기능 연합 및 파이프 라인 : 잭 스튜어트는 Kaggle 대회에서 자신의 경험을 기반으로 파이프 라인 모델의 가치를 보여줍니다. scikit-learn의 파이프라인 모듈을 사용하면 변압기와 추정기를 하나의 단위로 사용할 수 있도록 함께 체인할 수 있습니다. 이 기능은 몇 가지 데이터 추출, 변환, 정규화 를 거치고 마지막으로 모델을 학습(또는 예측 생성에 사용하는 데 사용)해야 할 때 매우 유용합니다.

scikit-learn에는 분류를 위한 홍채 및 숫자 데이터 세트와 회귀를 위한 보스턴 주택 가격 데이터 세트와 같은 몇 가지 표준 데이터 집합이 함께 제공됩니다. 그런 다음 작업할 이미지를 시각화하여 탐색을 한 단계 더 단계 올라갈 수 있습니다. 이 목적을 위해 python의 데이터 시각화 라이브러리 중 하나를 사용할 수 있습니다. 이러한 요소입니다. 예를 들어 1936년 로널드 피셔가 분석한 아이리스 데이터 집합을 생각해 보십시오. 우리는 해본 라이브러리를 사용하여 팬더 DataFrame의 형태로이 데이터 세트를 다운로드 할 수 있습니다 : 라이브러리는 SciKit-learn을 사용하기 전에 설치해야합니다 SciPy (과학 파이썬)에 내장되어 있습니다. 포함이 스택: Scikit-learn에서 대다수 규칙 앙상블 분류기: Scikit에서 가중 대다수 규칙 앙상블 분류기 구현의 간단 하 고 보수적인 접근-세바스찬 Raschka 그것을 시도 하는 때 현저 하 게 좋은 결과 산출 배울 카글 경쟁. 앞에서 설명한 Iris 데이터 집합을 사용하여 이 프로세스의 또 다른 예를 살펴보겠습니다. 우리의 질문은 다음과 될 것입니다 : 아이리스 데이터의 일부에 대해 학습 된 모델을 감안할 때, 우리는 나머지 라벨을 얼마나 잘 예측할 수 있습니까? 팁 : 파이썬 데이터 조작 라이브러리 팬더로 데이터를 가져오는 것에 대해 더 알고 싶다면 파이썬 코스에서 DataCamp의 데이터 가져오기 를 고려하십시오. make_column_transformer를 사용하여 두 단계를 수행할 수 있습니다. 이 기능은 현재 버전의 scikit-learn(0.19)에서는 사용할 수 없습니다. 현재 버전에서는 파이프라인에서 레이블 인코더와 핫 인코더 하나를 수행할 수 없습니다.

그것은 우리가 개발자 버전을 사용하기로 결정 한 이유입니다. 또는 파이썬 코스에서 사이킷 학습 및 감독되지 않은 학습으로 DataCamp의 감독 학습을 확인하십시오! Scikit & 팬더와 의사 결정 나무 : 게시물은 scikit 학습과 팬더를 사용하여, 파이썬의 의사 결정 트리 (분류)를 다룹니다.

Comments are closed