나의 기록
[TIL/ Today I Learned] 20231226 본문
[오늘 배웠던 새로운 코드들]
category_range = set(sparta_data['area'])
print(category_range, len(category_range))
|
* set()을 사용하는 이유 -> set()은 데이터의 중복 없이 각각의 데이터가 unique한 값을 가질 수 있게 함.
중복값 제거.
* len() -> 리스트에 들어가 있는 원소 개수, 즉 리스트의 크기를 알려줌.
“접속지역, 해당 지역 위도, 해당 지역 경도” 만으로 이루어진 테이블 만들기
#새로운 테이블을 만들고자 할 땐 기존의 테이블에서 필요한 "열의 이름"을 대괄호에 넣어 변수에 지정해 주면 됩니다
area_info=sparta_data[['area','latitude','longitude']]
|
수많은 중복 정보 삭제 하기
#drop_duplicates()을 이용하면, area(지역) 컬럼의 중복 데이터를 처리 할 수 있습니다. :)
area_info=area_info.drop_duplicates(['area'])
area_info
|
가공된 테이블인 “지역의 이름”을 기준으로 데이터를 정렬하기!
area_info = area_info.sort_values(by=["area"], ascending=[True])
area_info
|
⇒ .sort_values를 통해 지정 값을 기준으로 레이블을 정렬할수 있어요!
⇒ by=[”정렬 기준이 될 레이블”]이에요!
⇒ ascending=[True] :True 면 오름차순, False면 내림차순으로 정렬 할 수 있어요!
대한민국 위도 경도 설정 하기
m = folium.Map(location=[37.5536067,126.9674308],
zoom_start=8)
m
|

💡 반복문 사용 방법
for x in 리스트: 수행할 문장
[반복문 01] 기본
fruits = ['사과', '배', '감', '귤']
for fruit in fruits: # fruit 은 우리가 임의로 지어준 이름입니다.
print(fruit) # 사과, 배, 감, 귤 하나씩 꺼내어 출력합니다.
[반복문 02] 살짝 응용 - 과일 갯수 세기
fruits = ['사과', '배', '배', '감', '수박', '귤', '딸기', '사과', '배', '수박']
count = 0
for fruit in fruits:
if fruit == '사과':
count = count + 1
# 사과의 갯수를 출력합니다.
print(count)
|
지도에 수강생 분포 그려주기
for n in result.index:
radius = result.loc[n,'user_id']
#loc[n,"열 이름"] => loc[]를 활용하여 n번째의 열을 조회 할수 있습니다!
#즉, n번째의 user의 수를 가져 올수 있는 것이죠!
folium.CircleMarker([result['latitude'][n],result['longitude'][n]],
radius = radius/50, fill=True).add_to(m)
#.add_to(m)를 활용하여, 지정해 두었던 우리나라의 지도를 가져올 수 있습니다!
m
|

1) 막대 그래프 색 변경 하기
#color ="색상"으로 바 색상을 지정 할수 있어요!
plt.bar(X, Y,color='원하는 색상 컬러')
|
ex) plt.bar(access_media.index,access_media.values,color="원하는색상")
(2) 각 바마다 다른 색 입히기
#alpha는 색의 투명도를 조절 하고 싶을때 씁니다! :) # #hex나 rgb로도 색상 표현도 가능해요! plt.bar(access_media.index,access_media.values, color = ['gold', 'b', '#FF0000', 'green','orange','red','#000000'], alpha = 0.3)
|
- alpha는 색의 진하기
- RGB : RGB 색상표기법은 rgb(red, green, blue) 형식으로 색상을 표현하는데, 각 요소에는 0에서 255사이의 숫자를 입력 해 줍니다.
- HEX: RGB 순서대로 16진수로 변환하여 00~ff까지 두자리씩 표기하는 색상 표기법 입니다. 예시) #000000 -> #000, #ffffff -> #fff
(3) 막대 그래프 테두리 색 및 두께 변경 하기
#edgecolor = '원하는 색상', linewidth = 원하는 두께로 각 바의 테두리의 색상과 두께 변경이 가능 합니다! plt.bar(access_media.index,access_media.values, color = ['gold', 'b', '#FF0000', 'green','orange','red','#000000'], alpha = 0.3,edgecolor = '원하는 색상', linewidth = 원하는 두께)
|
(4) 그래프 너비 바꾸기
#width=원하는 두께로 그래프의 바 너비를 변경 할 수 있어요! 기본 값은 0.8입니다!
plt.bar(access_media.index,access_media.values, width=원하는 두께)
|
(5) 그래프 폰트 크기 바꾸기
#fontsize="원하는 크기"로 폰트 사이즈를 조절 할수 있어요!
plt.title('수강생 별 수강 신청 경로',fontsize=원하는사이즈)
|
(6) 그래프 각 바의 수치 나타내기
#그래프를 bar라는 변수에 넣고,
bar = plt.bar(access_media.index,access_media.values)
#for 반복문으로,
for rect in bar:
#각 바의 세로길이 값을 구하고,
height = rect.get_height()
#bar의 가장 정 가운데 x 좌표 구하기 : get_x()로 x축의 가장 왼쪽 부분 + get_width의 절반 값
plt.text(rect.get_x() + rect.get_width()/2.0, height, '%.1f' % height, ha='center', va='bottom', size = 12)
|

(7) 가로 그래프 그리기 : x축의 이름들이 너무 길 때에는 가로 막대 그래프를 그려 가독성을 높일 수 있어요!
#plt.barh를 이용하면, 서로 축 변경이 가능 하답니다 :) plt.barh(access_media.index,access_media.values, color="g")
|

'개발일지 > TIL' 카테고리의 다른 글
[TIL / Today I Learned] 20231228 프로덕트 개선은 정말 도움이 되었을까?_ 전처리 및 분석 및 시각화 (1) | 2023.12.28 |
---|---|
[TIL / Today I Learned] 20231227_groupby 질문 (0) | 2023.12.27 |
[TIL/Today I Learned] 수강생들이 가장 많이 혹은 가장 적게 듣는 시간과 요일을 데이터 분석으로 찾기 (1) | 2023.12.22 |
[TIL / Today I Learned] Day3 (0) | 2023.12.21 |
[TIL/Today I Learned] DAY2 (1) | 2023.12.20 |