전체 글

K-NN 알고리즘의 쉬운 예제
머신러닝에는 지도학습(Supervised Learning)과 비지도 학습(Unsupervised Learning)이 있습니다. 지도학습에는 최근접 이웃 (Nearest Neighbor) 나이브 베이즈 (Naive Bayes) 의사결정 트리 (Decision Trees) 분류 규칙 학습자 (Classification Rule Learners) 선형 회귀 (Linear Regression) 회귀 트리 (Regression Trees) 모델 트리 (Model Trees) 신경망 (Neural Networks) 서포트 벡터 머신 (Support Vector Machines) 이 정도가 대표적인 알고리즘입니다. 그중 KNN은 가장 고전적/직관적인 방법이라고 알려져있습니다. 또한 K-NN은 '분류'에 속하는데, 분..
jupyter notebook을 html로 전환하기
jupyter notebook에서 코드를 작성한 후에 코드와 output을 함께 html로 저장해서 파일로 제출해야 할 경우! 간단한 명령어 혹은 jupyter notebook 작업 페이지에서 쉽게 html을 다운받을 수 있다. 명령어로 해결하기 1. cmd창(windows 메뉴 - cmd 검색) 을 열고 해당 파일이 있는 폴더로 이동한다. cd 명령어를 이용! cd 폴더명 # 만약 현재 위치보다 상위 폴더로 나가려면 cd .. 2. 다음 명령어를 적으면 끝이다. >jupyter nbconvert 변환할 파일명.ipynb --to html # 아래와 같이 출력이 뜨면 성공! [NbConvertApp] Converting notebook 변환할 파일명.ipynb to html [NbConvertApp] W..
![[colab] 8. colab으로 Iris 데이터 활용하기](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2FbAJAcI%2FbtqUzwjzul8%2FAAAAAAAAAAAAAAAAAAAAAJA2RSUoa3pQ_Q3kGWo_jmqBNmQ3qQ2-ves0WtAQz-JU%2Fimg.png%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1759244399%26allow_ip%3D%26allow_referer%3D%26signature%3Dvx71vbJ58Lb8wFcS7Y9IOLjNNZE%253D)
[colab] 8. colab으로 Iris 데이터 활용하기
Iris 데이터셋은 데이터셋을 활용하는 실습에서 다들 한번 씩 해봤을 법한 입문용 데이터셋이다. iris는 붓꽃이라는 꽃인데, 붓꽃에는 여러가지의 품종이 있다. 이 꽃의 품종을 Iris 데이터셋에 있는 꽃잎의 길이와 너비, 꽃받침의 길이와 너비를 기반으로 예측하는 것이다. 우리는 지도학습의 대표적인 예인 분류 방법을 이용할 것이다. 그래서 학습을 위해 주어지는 데이터 세트 (학습 데이터)와 머신러닝 모델의 예측 성능을 평가하기 위해 주어지는 데이터 세트 (테스트 데이터)가 있어야 한다. 먼저 load_iris() 함수로 iris dataset을 가져오는데, 그 데이터셋 구성을 설명하겠다. iris 데이터 셋 구성 (iris['필드명']으로 볼 수 있다.) DESCR : 데이터셋의 정보를 보여준다. dat..
![[colab] 7. colab으로 scikit-learn 모듈 사용하기(Linear SVC)](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2FcZ7YZk%2FbtqUtVRMuTq%2FAAAAAAAAAAAAAAAAAAAAALhmxDs9fWBMOGG55Lg-lcUweV5b9Za_uUZK17GBHSe4%2Fimg.png%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1759244399%26allow_ip%3D%26allow_referer%3D%26signature%3DP%252BxxWebUf9tw2e%252BzE0JaM2ZMxDs%253D)
[colab] 7. colab으로 scikit-learn 모듈 사용하기(Linear SVC)
scikit-learn 이라는 사이트에는 좋은 알고리즘 모듈들을 매우 많이 제공한다. (https://scikit-learn.org) 대표적인 파이썬 머신러닝 프레임워크로, - 다양한 머신러닝 알고리즘 - 샘플 데이터 - 머신러닝 결과를 검증하는 기능 (가설 검증 혹은 가설을 세운뒤 모델이 산출한 결과를 검증) 등을 제공한다. BSD 라이선스이기 떄문에 무료로 사용할 수 있고 배포까지 가능하다는 점이 큰 장점이다. 그리고 scikit-learn에서는 알고리즘 치트 시트(https://scikit-learn.org/stable/tutorial/machine_learning_map/)를 제공한다! 이는 각 데이터 특성에 따라 어떤 알고리즘을 쓰면 좋을지 제안해주는 그림(?)이라 생각하면 된다. 만약 내가 데..
![[colab] 6. 머신러닝](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2Fr1nME%2FbtqUo9wsLHe%2FAAAAAAAAAAAAAAAAAAAAACnFBSzdsJX0abb0v7Q9hem4NoD6vDmEr9RnB6VWxnFQ%2Fimg.png%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1759244399%26allow_ip%3D%26allow_referer%3D%26signature%3DT4tF6Rrk1qZ%252F9ly%252BITaWWn8q7lc%253D)
[colab] 6. 머신러닝
이제 다음에 다룰 데이터(Iris 데이터와 Titanic 데이터)부터는 실제로 우리가 알고리즘을 사용하여 데이터에 대한 가설을 검증하는 등의 과정을 거칠 것이다. 그전에 머신러닝에 대해 간단히 개념을 짚고 넘어가야겠다. 우선, 현재 데이터 처리가 원초인? 분야에서 많이 거론되는 분야에 대해 적어보겠다. - 인공지능(AI) : 사람의 지능을 모방하여, 사람이 하는 것과 같은 복잡한 일을 할 수 있도록 기계를 만드는 것 - 머신러닝 : 기본적으로 알고리즘을 이용해 데이터를 분석 및 학습하며, 학습한 내용을 기반으로 판단이나 예측하는 것 - 딥러닝 : 인공신경망에서 발전한 형태의 인공지능. 머신러닝 중 하나의 방법론 머신러닝은 데이터(Data)를 기반으로 (알고리즘을 이용해) 패턴(Model)을 학습하여 결과..
![[colab] 5. colab으로 matplotlib를 이용한 그래프 그리기](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2FdbSJhC%2FbtqUsd5YbBw%2FAAAAAAAAAAAAAAAAAAAAAOQs6NLjQML_eBOUITJzqKetkvwkeTTdkOQgi7tWrpqm%2Fimg.png%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1759244399%26allow_ip%3D%26allow_referer%3D%26signature%3DphAoprKNf34hQtPBxXTGmDlSGYU%253D)
[colab] 5. colab으로 matplotlib를 이용한 그래프 그리기
matplotlib는 그래프를 그려주는 외부 라이브러리이다! 드디어 나도 데이터 시각화를 할 수 있다. 우리는 matplotlib 라이브러리의 pyplot 모듈을 이용해서 그래프를 그리는 기능을 사용하겠다. 그래서 pandas와 numpy를 import한 것처럼 pyplot도 import하고 시작해보자! 이번 글에서는 간단히 그래프를 그리는 방법만 간단히 알아보겠다. - 먼저 그래프를 그리기 전에 글꼴 및 그래프에 대한 설정을 하겠다. import matplotlib.pyplot as plt import pandas as pd import numpy as np %matplotlib inline plt.rc('font', family='NanumGothic Eco')# 글꼴 정의 plt.rcParams['..