본문 바로가기

프로젝트, 스터디

(9)
[Kaggle 필사] 성인 인구조사 소득 예측 대회 필사 - 코드 풀어서 공부하기( 결측치 처리, 중복행 출력, 라벨링) 안녕하세요 여러분 오랜만에 돌아왔습니다. 사실 일주일에 한번 [모두의 연구소]에서 데이터 분석 모임을 진행하는데, 그 안에서 팀을 꾸려 Kaggle이나 Dacon 대회를 나가기로 결정했어요! 근데 이제 우리의 차기 교수님인 욱님이 들어오면서 본격적으로 필사 + 준비하기로 했습니다. 그래서 필사 선정 코드도 제가 했던 것보다 더.. 어려운? 느낌이 들었어요. 어쩌겠어요.. 이해될때까지 쳐봐야죠 (그로스 해킹은 언제 할련지 ㅉ) - 읽을 필요 없는 주저리 - + 모델링보단 EDA, 전처리에 FOCUS를 두고 필사를 진행했습니다. 그럼 스타투 목차 들어가기 전에 대회소개 COLUMN 필사코드로 코드공부하기 들어가기전에 필사한 코드엔 주석이 쓰여져 있지않아 초보자인 저는 "이 코드를 왜 썼지? "란 생각이 들었..
[시각화공부] 코드 분해하며 공부하기 (kaggle 자전거 수요 예측 모델) - seaborn boxplot, pointplot , heatmap, regplot, scipy.stats.problot 이전글 [함수공부] 코드 분해하며 공부하기 (kaggle 자전거 수요 예측 모델) | calendar.day_name , calendar.month_nam Data Description datetime - hourly date + timestamp season - 1 = spring, 2 = summer, 3 = fall, 4 = winter holiday - whether the day is considered a holiday workingday - whether the day is neither a weekend nor holiday weather - 1: Clear, Few clouds, Partly debbie-da.tistory.com Data Description datetime - hour..
[함수공부] 코드 분해하며 공부하기 (kaggle 자전거 수요 예측 모델) | calendar.day_name , calendar.month_name , datetime.week , Missingno , astype Data Description datetime - hourly date + timestamp season - 1 = spring, 2 = summer, 3 = fall, 4 = winter holiday - whether the day is considered a holiday workingday - whether the day is neither a weekend nor holiday weather - 1: Clear, Few clouds, Partly cloudy, Partly cloudy 2: Mist + Cloudy, Mist + Broken clouds, Mist + Few clouds, Mist 3: Light Snow, Light Rain + Thunderstorm + Scattered cl..
[Tableau] 4일차 교육 정리 (테이블 계산 , 이중축 , 측정값 이름 이용) 4일차 강의 목적 1. 테이블 계산을 만들고 사용하는 방법 알아보기 2. 테이블 계산을 수정해 계산 방식을 더욱 정확하게 제어하는 방법 알아보기 3. 데이터 패널에 있는 '측정값 이름' 과 '측정값'필드가 어떻게 사용되는지 알아보기 | 테이블 계산 소개 ❓ 테이블 계산이란 테이블에 있느 모든 값을에 적용되는 계산으로, ⓐ 퀵 테이블 계산을 이용하거나 ⓑ 함수를 이용하다 "카테고리별 월별 수익 누계 값" 시각화 하기 ✅ 방법 1 ✔ 열 : 월(주문 날짜) → 행 : 합계(수익) → [퀵테이블 계산] : 누계 → 카테고리를 색상에 위치 ✅ 방법 2 ✔ 계산된 필드 만들기 → Running_sum 계산식 만들기 : Running_sum(누계([수익])) → 행에 가져다 놓기 → 카테고리를 마크 색상에 놓기 |..
[Tableau] 데이터 연결 / 계층화 / 필터적용 / 지도 시각화 / 시계열분석 (신병교육1일차) 🔸 목차 🔸 데이터 연결 (엑셀) 데이터 확인 및 정리 계층화 & 필터 : 어떤 제품의 실적이 안좋은가? 지도 시각화 : 수익성의 지역별 패턴을 확인할 수 있을까? 시계열분석 : 언제부터 문제가 있었나? 데이터 준비 (엑셀) 1. 데이터 파일을 불러옵니다 2. 주문데이터와 반품데이터를 드래그 합니다. ✔ JOIN 할 필드 세팅 (자동으로 "주문번호"필드로 세팅이 되네요) 3. 라이브 or 추출 중 선택 ✔ 라이브 : 실시간으로 쿼리를 던져서 실시간으로 반영 ✔ 추출 : 데이터가 새로고침하는 시점에 따라 새로고침을 해줘야함 4. 데이터 시트로 이동 데이터 확인 및 정리 시트1로 이동하면 위 화면이 나옵니다. 두 데이터를 하나의 데이터 set로 보기 위해 위 이미지와같이 ▼ 클릭 → [데이터 원본 테이블별 ..
[Kaggle 필사] Students' Academic Performance Dataset 1차 / 평균치 이상인데 LOW LEVEL 받은 이유 찾기 Students' Academic Performance 관련 다른 분들의 코드를 필사했습니다. ✅ 다른 사람은 어떤식으로 데이터에 접근했는지 ✅ 모델링 및 하이퍼파라미터 설정 확인하기 위 두가지를 목표로 필사를 진행했는데, 아직 한분의 코드(하이퍼 파라미터)를 필사하지 못했네요 ㅎㅎ 필사 정리 1탄입니다. 📍 CODE https://www.kaggle.com/code/kanncaa1/factors-affecting-success-in-school Factors Affecting Success in School Explore and run machine learning code with Kaggle Notebooks | Using data from Students' Academic Performance D..
[Kaggle] Students' Academic Performance Dataset (우리애 성적에 좋은 영향을 주는 건 뭘까?) *아래 정리는 Fastcampus의 "퀴즈처럼 풀면서 배우는 파이썬 머신러닝 300제+"라는 인터넷 강의에서 실습한 내용 + 기타 사이트 내용을 토대로 복습&공부하며 정리한 내용을 공유하고자 복기한 내용입니다. https://www.kaggle.com/datasets/aljarah/xAPI-Edu-Data Students' Academic Performance Dataset xAPI-Educational Mining Dataset www.kaggle.com 🎴 데이터 set 소개 더보기 1 Gender - student's gender (nominal: 'Male' or 'Female’) 2 Nationality- student's nationality (nominal:’ Kuwait’,’ Lebanon..
[mySQL] LIMIT OFFSET LIMIT OFFSET에 대해 정리해보겠습니다. || LIMIT OFFSET LIMIT과 OFFSET은 쉽게말해 페이징처리라고 볼 수 있습니다. 행을 몇개 가져올지, 어느 행부터 출력할건지 같은! • LIMIT: 몇개의 행을 가져올건지 • OFFSET: 어느행부터 가져올건지 ✅ 코드와 함께 이해하기 SELECT * FROM table ORDERS LIMIT N >> N개 만큼 행을 출력 SELECT * From table LIMIT N, M #예제 SELECT * From table LIMIT 5, 10 SELECT * From table LIMIT 5, 1 SELECT * From table LIMIT 4, 1 >> N+1 행부터 M개를 출력 #예제 >> 6행~15행 출력됨 >> 6행만 출력 >> 5행..