Python(AI)(8)
-
Boston Housing 데이터를 활용한 선형회귀 분석 실습
Boston Housing 데이터를 활용한 선형회귀 분석 실습이번 포스팅에서는 인공지능 7단계를 기반으로, Boston Housing 데이터를 활용하여 주택 가격을 예측하는 회귀 모델을 학습하고 평가해봤습니다.✅ 인공지능 7단계 프로세스문제 정의 수치형 데이터를 예측하므로 지도학습(회귀) 문제입니다.데이터 수집 boston_housing.csv 데이터 사용.데이터 전처리불필요한 컬럼 제거범주형 컬럼(CHAS, RAD) 타입 정리정답 데이터(MEDV) 분리 및 이름 변경 → PRICEEDA (탐색적 데이터 분석)상관관계 분석 (heatmap 활용)모델 학습에 도움이 되는 변수 우선순위 파악전처리: 데이터 정규화StandardScaler를 활용한 정규화 수행평균 0, 표준편차 1로 맞추어 스케일 차이 제..
2025.07.02 -
선형회귀 완전 정복: 수학 공식 vs 경사하강법 비교
선형회귀 모델을 활용한 최적의 가중치(w), 절편(b) 찾기1. 데이터 준비pandas, numpy, matplotlib 등 필수 라이브러리를 불러온 후, 공부 시간과 성적 데이터를 기반으로 데이터프레임을 생성한다.import pandas as pdimport numpy as npimport matplotlib.pyplot as pltdata = pd.DataFrame( [[2, 20], [4, 40], [8, 80], [9, 90]], index=["은유", "자영", "지희", "영화"], columns=["시간", "성적"])2. 수학 공식을 통해 선형 회귀 모델로 최적의 w, b 구하기sklearn의 LinearRegression을 사용하여 수학적으로 최적의 직선의 기울기(w)와 ..
2025.07.01 -
Decision Tree 시각화 방법 정리 (graphviz vs matplotlib)
Decision Tree 시각화 방법 정리 (graphviz vs matplotlib)이번 포스팅에서는 Decision Tree 모델을 학습한 뒤, 트리를 시각화하는 방법 두 가지를 정리해봤다.하나는 graphviz를 사용하는 방식이고, 다른 하나는 matplotlib의 plot_tree()를 사용하는 방식이다.1. 공통 전제: 트리 모델 학습from sklearn.tree import DecisionTreeClassifiertree_model = DecisionTreeClassifier()tree_model.fit(X_train, y_train)트리 모델 학습은 동일하다. 이 모델을 기반으로 각각 다른 방식으로 시각화를 해본다.2. 방법 ①: graphviz로 시각화graphviz는 시각적으로 정돈된 ..
2025.07.01 -
🧠 인공지능의 7단계
💡 AI 개발 실무 7단계 × 기술 및 언어 정리 단계 실무 용어 주요 작업 사용 기술 & 도구 사용 언어 1️⃣ 문제 정의(Problem Definition) 해결 목표 정의데이터 요건 파악평가 지표 설정 Notion, Google Docs, Whimsical협업툴: Jira, Trello, Slack 없음 (자연어 기술) 2️⃣ 데이터 수집(Data Collection) DB, API, 크롤링, 센서 수집파일 수집 (CSV, JSON 등) SQL (MySQL, PostgreSQL)API: REST, GraphQL웹 크롤링: Beautiful..
2025.06.17 -
🧠 AI 심화 수업 Day1: 머신러닝 개념 + 이미지 임베딩 실습 정리(with Orange)
오늘은 AI 심화 오프라인 수업 첫날이었고,머신러닝 기본 개념과 이미지 임베딩 실습을 Orange 툴로 진행했다.처음 설치부터 약간의 에러도 있었지만, 직접 해결해가며 구조를 익히는 과정이 재미있었다.🔍 머신러닝 학습 방식 3종 요약1. 지도학습 (Supervised Learning)정답(label, target)이 있는 데이터로 학습하는 방식.분류(Classification): 정답이 범주형 (ex: 성별, 혈액형, 스팸/정상)회귀(Regression): 정답이 연속형 숫자 (ex: 집값, 온도)✔ 예:스팸메일 분류 → 이진 분류 (0/1)주가 예측 → 회귀2. 비지도학습 (Unsupervised Learning)정답이 없는 데이터를 기반으로 패턴을 자동으로 탐색→ 클러스터링, 차원 축소 등3. 강화..
2025.06.16 -
🏥 의료기관 데이터분석 실습 정리
소상공인시장진흥공단의 의료기관 데이터셋을 활용해결측치 시각화, 컬럼 전처리, 시도별 분포 분석,업종 분류 시각화, 위경도 시각화 등을 실습합니다.🧩 1. 사용된 주요 모듈 설명모듈설명pandas데이터프레임 구조로 데이터를 불러오고 처리하는 Python 라이브러리numpy수치 연산을 위한 라이브러리matplotlib.pyplot시각화 라이브러리 (꺾은선, 막대, 파이 차트 등)seabornmatplotlib 기반의 고급 시각화 라이브러리missingno결측치 시각화를 위한 전문 라이브러리 📌 2. 사용된 함수 및 개념 요약✅ pandas 관련pd.read_csv(): CSV 파일 불러오기.head(), .info(), .shape: 데이터 구조 확인.isnull().sum(): 결측치 확인.drop()..
2025.06.09