목록개발일지 (46)
나의 기록

수강생들이 가장 많이 혹은 가장 적게 듣는 시간과 요일을 데이터 분석으로 찾기 [과제] 수강생들이 가장 많이 혹은 가장 적게 듣는 시간과 요일을 데이터 분석으로 찾기 import pandas as pd #분석할 데이터 불러 오기 sparta_data= pd.read_table('/content/access_detail.csv', sep=',') #데이터 살펴보기. (head를 통해 상위 데이터 5개 확인 가능) sparta_data.head() #파이썬의 type()함수를 쓰면, 데이터의 종류를 확인 할수 있어요 :) print(type(sparta_data['access_date'][1])) #sparta_date 정보에서 access_date 열에서 데이터 첫번째 부분만 확인 하면 되겠죠?..

Window Function - RANK, SUM Window Function 은 각 행의 관계를 정의하기 위한 함수로 그룹 내의 연산을 쉽게 만들어줍니다 [실습] 음식 타입별로 주문 건수가 가장 많은 상점 3개씩 조회하기 ① 음식 타입별, 음식점별 주문 건수 집계하기 select cuisine_type, restaurant_name, count(1) cnt_order from food_orders group by 1,2 ② Rank 함수 적용하기 select cuisine_type, restaurant_name, cnt_order, rank() over (partition by cuisine_type order by cnt_order desc) ranking from ( select cuisine_..

Subquery 한 번 연산하고, 다시 연산을 활용할 수 있는 문법 = subquery 문 음식 타입별 지역별 총 주문수량과 음식점 수를 연산하고, 주문수량과 음식점수 별 수수료율을 산정하기 음식점수 5개 이상, 주문수 30개 이상 → 수수료 0.05% 음식점수 5개 이상, 주문수 30개 미만 → 수수료 0.08% 음식점수 5개 미만, 주문수 30개 이상 → 수수료 1% 음식점수 5개 미만, 주문수 30개 미만 → 수수로 2% select cuisine_type, total_quantity, count_res, case when count_res>=5 and total_quantity >=30 then 0.05 when count_res>=5 and total_quantity

함수명 : replace 언제 사용? 다른 문자로 수정하고 싶을 때, 하나하나 수동은 양이 많음 주소 전체가 아닌 '시도' 정보만 필요. 서울 통계만 필요한데 전체주소->서울로 문자 변경 replace(바꿀 컬럼, 현재 값, 바꿀 값) 식당 명의 ‘Blue Ribbon’ 을 ‘Pink Ribbon’ 으로 바꾸기 select restaurant_name "원래 상점명", replace(restaurant_name, 'Blue', 'Pink') "바뀐 상점명" from food_orders where restaurant_name like '%Blue Ribbon%' 주소의 ‘문곡리’ 를 ‘문가리’ 로 바꾸기 select addr "원래 주소", replace(addr, '문곡리', '문가리') "바뀐..

진도: 2주차 완강, 3주차 3-5까지 수강, 3주차부터 난이도 높아짐을 느낌. 오늘 배운 함수 정리 합계: sum(컬럼) 평균: avg(컬럼) 데이터 갯수세기: count(컬럼), (컬럼명 대신 1 혹은 *사용 가능) 몇 개의 값을 가지고 있는지 구할 때 distinct ex) 데이터 갯수: 주문 테이블의 전체 주문은 몇 건? 몇 개의 값: 주문을 한 고객은 몇 명? select count(1) count_of_orders, count(distinct customer_id) count_of_customers from food_orders -> 주문 건수 전체와, 주문 한 고객 수를 구함. 최솟값, 최댓값 구하기: min, max group by, order by order by: 음식 종류별 주문 금액..

#데이터분석 #sql SELECT: 데이터를 가져오는 기본 명령어, 데이터를 조회하는 모든 Query에 사용됨 FROM: 데이터를 가져올 테이블을 특정해주는 문법 * : 모든 컬럼을 가져와준다는 의미 1) 원하는 컬럼 선택 필요한 컬럼만 선택하여 조회 가능 모든 것을 조회하는 * 대신 필요한 컬럼 작성 select 컬럼1, 컬럼2 from 테이블 주문 테이블에서 주문번호와 식당 이름만 필요할 때 select order_id, restaurant_name from food_orders 2) 컬럼에 별명(alias) 을 주기 방법1 : 컬럼1 as 별명1 방법2 : 컬럼2 별명2 별명 지을 때 유의사항 예시 1) order_id 를 ord_no 로, 2) restaurant_name 을 식당 ..