반응형

자기계발/Python 52

직장인의 혼공학습단 9기 후기 (feat. 혼자공부하는 데이터분석)

디지털 광고대행사에서 퍼포먼스 마케터로 열심히 커리어를 쌓고 있는(있던) 호등입니다. 개인정보 이슈로 리타겟 광고 퍼포먼스는 점점 하락하고 있고, 먼 훗날 직접 SQL이나 Python을 활용하여 원하는 데이터를 추출하는 업무도 접할 수 있지 않을까라는 기대감으로 데이터 분석에 관심을 갖기 시작했어요. 어느정도의 강제성이나 보상은 아무래도 학습이라는 행위의 트리거가 될 수 있잖아요? 마침 혼공학습단을 모집한다는 메일을 받았고, 지난 6주간 Python을 활용한 데이터분석을 공부했습니다. 한빛미디어에서 운영하는 혼공학습단을 짧게 소개해드리고 지난 활동을 회고하는 시간을 가져보려 합니다. 1. 혼공학습단이란? 1주에 한 번씩 총 6주간 개인 SNS에 시리즈의 학습 내용을 정리하고 공유하는 활동을 합니다. 교재..

자기계발/Python 2023.02.24

[혼공단 9기] 6주차 : Chapter 06 복잡한 데이터 표현하기

벌써 혼공단 마지막 주차가 되었네요. 아무것도 안했다면 그냥 흘러갔을 시간인데 정말 알찬 시간 보낸 것 같습니다. 아직 Python을 자유자재로 활용하는 것은 불가능하지만 데이터분석이 대강 어떻게 진행되는지 알 수 있었어요. 추후 실제 데이터를 가지고 교재 내용 참고하여 이것저것 실습해보고 다른 교재도 공부해보아야 겠어요. 이번 혼공단 9기에 참여하신 분들 고생 많으셨습니다. Chapter 06 복잡한 데이터 표현하기 6-1 객체지향 API로 그래프 꾸미기 그래프를 그리는 방식에는 두 가지 방법이 있다. 첫 번째로 matplotlib.pyplot에 있는 함수를 사용하는 pyplot 방식 두 번째로는 피겨 객체와 서브플롯 객체를 만들고 이 객체의 메서드를 사용하는 객체지향 API 방식이다. pyplot 방..

자기계발/Python 2023.02.17

[혼공단 9기] 5주차 : Chapter 05 데이터 시각화하기

하하하.. 회사에서 짤렸습니다. 정확히 말하자면 경영 악화로 인한 퇴직이며, 2월 말까지 근무하면 된다고 통보받았습니다. 사실 재취업 걱정은 없어요. 내가 바라는 이상적인 회사 찾는게 힘들지 타협만 하면 금방 취업할 것 같거든요. 그저 생각지도 못한 일을 겪게 되어서 머리가 띵- 할 뿐입니다. 이럴 때일수록 정신 차리고 똑바로 살아야겠습니다. 더 열심히 살면 미래에 대한 불안감도 없어지겠죠? 5주차 학습 정리 시작할게요~ 생각치도 못한 4주차 우수혼공족 선정..! 샌드위치 맛있게 잘 먹겠습니다. 감사합니다 :) 이번 주말에 책을 읽으려고 했는데 이디야에 가야겠군요 Chapter 05 데이터 시각화하기 5-1 맷플롯립(matplotlib) 기본 요소 알아보기 Figure 객체 - 그래프의 크기를 바꾸는 f..

자기계발/Python 2023.02.09

[혼공단 9기] 4주차 : Chapter 04 데이터 요약하기

혼공단 9기 4주차 학습 내용 정리 이번 챕터는 통계, 그래프에 대한 기본적인 내용을 다뤄서 저번주에 비해 내용이 정말 쉬웠다! 데이터 관련 자격증 공부를 하면서 한번 씩 배웠던 내용이라 금방 공부할 수 있었다. 주말에는 약속이 있으니까 얼렁 포스팅하고 숙제 제출해야지~! 보내주신 메가커피 크로플 맛있게 먹겠습니다. 감사합니당😊 Chapter 04 데이터 요약하기 4-1 통계로 요약하기 기술통계 구하기 : describe() 메서드 ns_book6.describe() ns_book7 = ns_book6[ns_book6['도서권수']>0] ns_book7.describe(percentiles=[0.3, 0.6, 0.9]) ns_book7.describe(include='object') describe() ..

자기계발/Python 2023.02.03

[혼공단 9기] 3주차 : Chapter 03 데이터 정제하기

혼공단 9기 3주차 학습 내용 정리~ 이거 하면서 더 크게 느낀건데 시간은 정말 빨리 가고 일주일은 매우 짧다. 이번 챕터에서는 데이터 정제하는 방법을 공부했다. 책은 쉽게쉽게 알려주었지만 저번주에 비해 갑자기 난이도가 크게 상승하여 시간도 꽤 많이 걸렸다. 내가 분석하고 싶은 데이터를 직접 전처리하려면 책을 다 공부한 뒤에 직접 해보아야 될 것 같다..! 책만 보고 따라하는건 아무 의미가 없으니 책 한 번 훑고 다시 공부해봐야지 Chapter 03 데이터 정제하기 03-1 불필요한 데이터 삭제 열 삭제하기 위의 데이터 프레임에서 불필요한 열을 삭제해보겠다. 불필요한 열을 삭제하는 방법은 정말 많다. 1) loc 메서드 슬라이싱 ns_book = ns_df.loc[:, '번호':'등록일자'] ns_boo..

자기계발/Python 2023.01.22

[혼공단 9기] 2주차 : Chapter 02 데이터 수집하기

혼공단 9기 2주차! 이번 주 일이 너무 힘들고 컴활 시험일도 겹쳐서 공부를 하나도 못했다. 컴활 시험 끝나자마자 부랴부랴 벼락치기 하는데 양이 생각보다 많다! 도서관 정보나루 API 이용하려면 승인을 받아야하기 때문에 책 내용 따라하는데 약간의 제약이 있었다. 이 부분은 차주 분량 공부하면서 복습하는 차원에서 한 번 더 따라해 보아야겠다. (다행히 뒷 부분은 제공되는 파일 덕분에 실습 잘 할 수 있었다.) 이번 챕터에서는 API의 개념과 JSON, XML 데이터 변환 기초를 공부하고, 가볍게 API 사용, 웹 스크래핑을 실습했다. 강제성이 없었으면 시험 끝났다고 대충 누워있다가 주말 다 보냈을텐데... 이렇게라도 공부하게 해주시니 감사합니다🙏 1주차에 보내주신 커피도 맛있게 잘 마셨습니다. 감사합니다!..

자기계발/Python 2023.01.15

[혼공단 9기] 1주차 : Chapter 01 데이터 분석을 시작하며

한빛미디어에서 진행하는 혼공단 9기 1주차! 나는 이전에 데이터분석, Python에 관심이 있어서 빅데이터분석기사 자격증 준비를 했었다. 하지만 성실하지 않은 성격 탓에 벼락치기로 시험 준비를 하게 되더라... 자격증 취득은 어찌 성공했지만 자기계발이라는 순수한 본 목적 달성은 실패해버렸다. 내 스스로 공부하면 좀 더 공부다운 공부를 할 수 있지 않을까 싶어 혼공단 9기를 신청했고, 커리큘럼 따라 교재로 독학한다. 신청 전 교재 목차를 보니 API도 활용 내용도 있고, Python의 다양한 패키지도 다뤄볼 수 있을 것 같았다. 이 책이 이번에 따끈따끈하게 새로 나온 신상 IT 도서인 점도 마음에 들었다. 퇴근 시간 이후에 남는 시간을 활용하여 공부를 해야하는데 다른 자격증 시험도 준비해야 했기에 1주차는..

자기계발/Python 2023.01.08

[빅데이터분석기사] 실기 작업형 1유형

제2회 실기 작업형 제1유형 문제 1-1 ① crim 변수의 상위 10번째 값으로 crim 변수의 상위 10개의 값을 변환하고 ② age가 80이상인 값에 대하여 crim의 평균 출력하기 #1. 데이터 불러오기 import pandas as pd data = pd.read_csv('boston_housing.csv') #2. 데이터 형태 확인(생략 가능) print(data.head()) #3. 'crim' 변수 기준 내림차순으로 데이터 정렬 print(data.sort_values(by='crim', acsending = False)) #정렬이 제대로 되었는지 print로 중간 확인 data_sort = data.sort_values(by='crim', acsending = False data_sort..

자기계발/Python 2022.06.26

[빅데이터분석기사] 28 군집분석

군집분석(Cluster Analysis) 개체들의 특성을 대표하는 몇 개의 변수들을 기준으로 몇 개의 그룹(군집)으로 세분화하는 방법이다. 개체들을 다양한 변수를 기준으로 다차원 공간에서 유사한 특성을 가진 개체로 묶는다. 개체들 간 유사성은 개체 간의 거리를 사용하고, 거리가 상대적으로 가까운 개체들을 동일 군집으로 묶는다. 개체 간의 거리는 대표적으로 유클라디안 거리로 계산한다. scikit-learn 군집분석은 사이킷런에서 cluster 모듈에 있다. 이 중 KMeans가 대표적인 군집분석 알고리즘이다. KMeans의 옵션 중 가장 핵심적인 것은 n_clusters, 몇 개의 군집을 묶을건지 결정한다. 1) 기본 라이브러리 불러오기 import warnings warnings.filterwarnin..

자기계발/Python 2022.06.25

[빅데이터분석기사] 27 엘라스틱넷

엘라스틱넷(Elasticnet) 엘라스틱넷은 릿지회귀와 라쏘회귀를 절충한 모델이다. 규제항은 릿지와 라쏘의 규제항을 단순히 더해서 사용한다. 두 규제항의 혼합정도를 혼합비율 r을 사용해 조절하게 된다. 만약 r=0이면 릿지회귀와 같고, r=1이면 라쏘회귀와 같게 된다. scikit-learn 엘라스틱넷(Elasticnet) 회귀모델은 사이킷런의 linear_model에서 ElasticNet이다. 하이퍼파라미터 역시 alpha, 디폴트 값은 alpha=1이다. 알파값이 커지면 계수를 0에 가까ㅃ게 제약하여 훈련데이터의 정확도는 낮아지지만 일반화에는 기여한다. 이 부분은 라쏘회귀 설명이랑 같다. 1) 기본모델 적용 from sklearn.linear_model import ElasticNet model = ..

자기계발/Python 2022.06.25
반응형