목록Machine Learning/Tensorflow (11)
ecsimsw
Keras 활용 / BMI 계산 / 학습 후 저장, 오답 확인 1. bmi 계산식을 이용해서 20000개의 키/몸무게/상태 데이터를 csv 파일로 생성한다. 2. Keras 학습하여 bmi 계산식을 모르는 상황에서 학습만으로 얼마나 정확히 분류할 수 있는가 평가한다. 3. 학습된 결과를 확인하고, 예측에 실패한 데이터를 확인한다. 4. model은 JSON, weight는 h5으로 각각 저장하고 불러와 해당 모델을 사용해본다. 5. svm과 학습 결과를 비교한다. 설명 참고 : https://ecsimsw.tistory.com/entry/Keras 코드 내용 1. Create BMI data import random dataSrc = "./data_bmi/" ## CreateBMI data Set def..
Cross validation https://ecsimsw.tistory.com/entry/Cross-validation Cross validation Cross validation - 교차 검증. 머신러닝 모델의 타당성을 검증한다. - 학습용 데이터는 복잡하나, 테스트용 데이터는 간단한 경우, 그 모델의 스코어는 사실보다 높게 평가되고, 반대 상황의 경우 사실보다 낮게.. ecsimsw.tistory.com Iris classification / 붓꽃 분류기 / cross validation : Iris는 꽃받침 길이, 꽃받침 폭, 꽃잎의 길이, 꽃입의 너비에 따라 3가지 종류로 구분할 수 있다. 150개의 Iris 데이터를 받아 이를 학습하고, 그 학습 결과를 검증한다. - https://archiv..
SVM https://ecsimsw.tistory.com/entry/Support-Vector-Machine-Random-Forest Support Vector Machine / Random Forest from sklearn import svm, metrics clf = svm.SVC() clf.fit(valData,labelData) pre = clf.predict(valTEST) actualScore = metrics.accuracy_score(LabelTEST,pre) from sklearn.ensemble import RandomForestCl.. ecsimsw.tistory.com 언어 구분 학습 - 파이썬을 이용한 머신러닝, 딥러닝 실전 개발 입문에 소개된 언어 구분 학습 예제이다. - 기본..
Using GPU - tensorflow는 CPU와 GPU를 사용하여 연산을 처리할 수 있다고 공부하였다. 이번에는 tensorflow에서 연산 장치를 결정하는 방법을 공부했다. - tensorflow_ using gpu / 텐서플로우 블로그 - 6. 병렬 처리를 참고하였다. Supported device - tensorflow는 device type을 다음처럼 string으로 표시한다. "/cpu:0": The CPU of your machine. "/device:GPU:0": The GPU of your machine, if you have one. "/device:GPU:1": The second GPU of your machine, etc. - 현재 사용중인 디바이스를 확인하고자 할때는 log_d..
Architecture - tensorflow architecture를 tensorflow docs _ architecture와 [생각의 웹] 텐서플로우 소스 구조 분석 (TensorFlow Internal)를 참고하여 공부하였다. Overview Client : Defines dataflow graph / Initiates session C API : Separates user level code in different languages from core runtime Distributed Master : Prunes graph / Distributes them to worker services Worker Services : Schedule to appropriate to the available h..
Placeholder / Variable - 텐서플로우를 공부하면서 Placeholder / Variable를 좀 더 명확하게 하고 싶어 공부하였다. placeholder - placeholder는 다른 텐서를 할당하기 위해 사용되는 변수 타입이다. 한마디로 함수에서 파라미터 같은 친구이다. 잘 와닿지 않을 수 도 있는데, 나한테는 가장 쉬운 예시였다. 예를들어, 어떤 값에 3을 더한 값을 리턴하는 함수를 만든다고 생각해보자 위 그림에서 빨간색으로 표신되어 입력을 받는, 즉 파라미터의 역할을 하는 노드가 바로 placeholder가 하는 역할이다. 나머지 설계와 학습에 입력될 데이터를 placeholder로 구분하므로써 입력에 대한 출력을 확인하거나 코드 자체에서 입력 데이터를 명확하게 할 수 있다는 장..
Multi-variable / matrix Multi-variable - 텐서플로우에서 여러개의 변수를 사용하는 것도 기존의 1개의 변수를 사용하여 학습한 것과 똑같다. hypothesis식 H(a)= Wa+u에서 변수의 개수만 늘려 다음처럼 표시하면 되는 것이다. cost 역시 위에서 구한 H(a,b,c)-y 제곱의 평균이므로 이전과 다를게 없이 구할 수 있다. "변수가 3개인 학습" x1_data = [73.,93.,89.,96.,73.] x2_data = [80.,88.,91.,98.,66.] x3_data = [75.,93.,90.,100.,70.] y_data = [152.,185.,180.,196.,142.] x1 = tf.placeholder(tf.float32) x2 = tf.placeho..
Linear Regression / Cost - 지도 학습에서 많이 사용되고 있는 알고리즘, 선형 회귀 방식을 공부하였다. 홍콩 과기대의 김성훈 교수님의 유튜브 강의로 공부하였다. [Sung kim] Lec 00 - Machine/Deep learning 수업의 개요와 일정 Linear Regression - Linear Regression(선형 회귀) 방식은 지도 학습에서 기본이 되는 알고리즘으로 주어진 인풋 데이터를 표현할 수 있는 가장 합리적인 직선을 찾는 것이 그 알고리즘의 원리가 된다. 위 그림에서 입력된 데이터를 표현할 수 있는 가장 합리적인 그래프는 어떤 것일까. 당연히 빨간색이고 그걸 비교할 수 있도록 손실도를 계산하도록 하는 방법이 Cost function이다. Cost function ..