전체 글

교차 검증
1. 사이킷런 - 사이킷런 기반 프레임워크 사이킷런(scikit-learn)은 파이썬 머신러닝 라이브러리 중 가장 많이 사용되는 대표적인 라이브러리이다. 사이킷런에서는 분류 알고리즘을 구현한 클래스를 Classifier로, 회귀 알고리즘을 구현한 클래스를 Regressor로 지칭한다. (사이킷런에서는 매우 많은 유형의 Classifier와 Regressor 클래스를 제공한다.) Classifier와 Regressor를 합쳐서 Estimator 클래스라고 부른다. (즉, 지도학습의 모든 알고리즘을 구현한 클래스를 Estimator라고 부른다.) Estimator 클래스 (내부)에서 fit()과 predict()를 구현함. - 해당 Estimator를 인자로 받는... cross_val_score()와 같은..

티스토리에 PDF 올리기 (구글 드라이브 이용)
제가 티스토리에 pdf를 올리려고 알아보려고 검색해본 대부분의 방법이 저에게는 작동하지 않아서 (추측으로는) 새로 바뀌었다 생각이 들어.. 제가 다음에 또 까먹을 때 보려고 써놓는 글입니다 ㅎㅎ 1. 해당 PDF를 구글 드라이브에 올려놓는다. ( +새로 만들기 -> 파일 만들기 선택 후 업로드하면 된다.) 2. 해당 파일의 오른쪽 마우스 클릭 후 공유 버튼을 누른다. 3. 하단 의 변경 버튼을 누른다. 4. [제한됨] 으로 되어있는 것을 [링크가 있는 모든 사용자에게 공개]로 변경한 후, 완료 버튼을 누른다. 5. 그리고 다시 2번 순서 '해당 파일의 오른쪽 마우스 클릭 후 공유 버튼을 누른다.' 로 위의 화면으로 가서 하단의 [링크 보기]에 있는 링크에서 내 id를 추출해야한다. 우린 id만 필요하다...
![[Pandas] DataFrame 데이터 삭제](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2FcwAnTZ%2Fbtq0900Goi0%2FAAAAAAAAAAAAAAAAAAAAAFu83Om-Dr7134pgApb-aJBnk-XwHMByNyxRCvX729Fz%2Fimg.png%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1759244399%26allow_ip%3D%26allow_referer%3D%26signature%3DjVa25bEyMr9DEJcWG%252F6WxqvRsiI%253D)
[Pandas] DataFrame 데이터 삭제
DataFrame.drop(labels=None, axis=0, index=None, columns=None, level=None, inplace=False, errors='raise') * = None 이라 표시된 것은 '='으로 어떤 값을 할당하는게 아니란 의미! 즉, labels 옵션은 그냥 어떠한 값을 적어주면 된다. ex) 'Pclass' 이중 가장 중요한 파라미터는 labels, axis, inplace이다. 1. labels 데이터프레임에서 제거할 (컬럼의)컬럼명이나 (특정 로우를 가리키는) 인덱스를 넣어주는 파라미터. 2. axis axis=0을 입력하면, DataFrame의 특정 로우를 드롭하고자 하는것. -> 이상치를 제거하고자할 때 가끔 쓰임. axis=1을 입력하면, DataFram..

ndarray, 리스트, 딕셔너리와 DataFrame 상호 변환하기
일반적으로 DataFrame으로 변환 시에는 컬럼명을 지정해준다. DataFrame이 2차원 데이터(행과 열)이기 때문에, 기본적으로 2차원 이하의 데이터들만 DataFrame으로 변환될 수 있다. 1. 1차원_리스트와 ndarray(넘파이) import numpy as np import pandas as pd list1 = [1,2,3] # 1차원 리스트 array1 = np.array(list1) # 1차원 numpy ndarray col_name1 = ['col'] # 컬럼이름 리스트 # 리스트를 이용해 데이터프레임 생성 df_list1 = pd.DataFrame(list1, columns=col_name1) # ndarray를 이용해 데이터 프레임 생성 df_array1 = pd.DataFrame..
![[DataFrame] 특정 문자와 일치하는 행 추출 및 제거하기](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2FbqG8Os%2Fbtq0AqFLQUW%2FAAAAAAAAAAAAAAAAAAAAAIbRkbJLk-kosbb6roYfrcRpi91cRsbTQ4Da_7Ng-Ny2%2Fimg.png%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1759244399%26allow_ip%3D%26allow_referer%3D%26signature%3Dv7CB8PTLQ3wlPckwI%252BRFi%252FZ54ws%253D)
[DataFrame] 특정 문자와 일치하는 행 추출 및 제거하기
해당 데이터는 공공데이터 포털 사이트에서 가져온 데이터입니다. 자주 사용하는데 자꾸 까먹어서 쓸 때마다 인터넷에 구글링하는 시간들이 아까워서 정리해놓으려 한다.. 추출 '신호등 종류'라는 컬럼에서 '보행등'과 일치하는 행만 추출하고자한다면! 한 줄로 해결 완료! 삭제 데이터 프레임에서 특정 문자열이 있는 행을 삭제하고자 할 때는 위에서 추출한 행들의 index를 이용한다. 아래의 코드는, 데이터프레임의 '신호등 종류'라는 컬럼에서 '버스'라는 문자열 값이 있는 행들만 추출하여 그 행들의 index들을 이용해서! drop 함수로 제거하는 내용이다. # idx는 '버스'와 일치하는 문자열인 행들의 인덱스 번호가 저장된다. idx = traffic_light[traffic_light['신호등 종류'] == '..