728x90

Data Analysis 7

[데이터 분석 7차] 따릉이 예측 결과 발표 & 회고

2달 동안 교육받았던 데이터 분석 교육 과정의 마지막 시간이다. 마지막 시간에는 서울시 빅캠 공모전 수상작들을 살펴보고 팀 프로젝트 결과를 정리해 발표하는 시간을 가졌다. 요즘 한창 시험 기간으로 너무 바빠서 간략하게 글을 남기고자 한다. 우선 다음은 완성된 ppt 자료이다. https://github.com/jini11/Data_Analysis/tree/main/11.27 이 중 주로 나는 데이터 수집, 전처리, 시각화 역할을 수행하였고, 추가 시각화, 예측 부분은 다른 팀원 분이 진행하셨다. (하지만, 그 팀원분 마저 도중에 잠수를 타서 결국 나 혼자 마무리했다...😥) 느낀 점 2달 동안 데이터 분석 중급 교육 과정을 통해 1. 데이터 분석 과정 중 데이터 수집과 전처리에 소요되는 시간이 생각보다 ..

Data Analysis 2021.11.29

[데이터분석 6차] 네이버 챗봇 실습1, 따릉이 예측 모델

벌써 이번 주가 데이터 분석 교육 과정의 마지막 주이다. 두 달이 정말 빨리 가는 것 같다.. 1. CLOVA 챗봇 실습 이번주에는 네이버의 CLOVA CHATBOT에 대해 학습하였다. 그래서 오늘은 각자 주제를 정해 챗봇을 만들어보는 수업을 진행했다. 다음과 같이 간단하게 작성해보았다. 아직은 익숙하지 않아서 헷갈리는 부분이 많아 조금만 작성해두었다. 내일 더 배워서 자세하게 구현해봐야겠다. 2. 따릉이 대여수 예측 모델 저번 주에는 현재 우리 팀이 사용하고 있는 데이터에 적합한 모델이 XGBoost 모델이라는 사실을 알아냈다. 그리고 이를 바탕으로 오늘은 XGBoost 모델 학습을 실시했다. from xgboost import XGBRegressor, plot_tree, plot_importance ..

Data Analysis 2021.11.24

[데이터분석 5차] 네이버 AI API 실습, 따릉이 예측 모델

1. 네이버 AI API 실습 이번 주는 네이버 ncloud의 AI API를 이용한 실습을 진행해왔다. 그 중 오늘은 CLOVA OCR 실습을 진행했다. OCR은 연쇄물 상의 글자와 이미지를 디지털 데이터로 자동으로 추출하는 기술을 말한다. 저번 시간에는 OCR을 이용해 연쇄물 상의 글자를 추출하는 실습을 했고, 오늘은 이미지 상의 글자를 디지털 데이터로 자동으로 추출하는 실습을 진행하였다. 그 예로 영수증, 등기부등본의 이미지를 통해 추출하고자 하는 범위를 설정하고 다른 데이터로 테스트 해보는 실습을 진행하였다. OCR 실습을 통해 소비자가 사용한 영수증에서 가격, 품목 등의 정보를 추출해 날짜별 가계부를 대신 작성해주는 프로그램을 만들면 좋겠다라는 생각이 들었다. 2. 따릉이 예측 모델 실습 지난 시..

Data Analysis 2021.11.21

[데이터분석 4차] 네이버 AI API 활용, 프로젝트 주제 선정

1. 네이버 API 활용 오늘은 네이버 클라우드에서 제공하는 API를 활용한 실습을 진행하였다. (1) CLOVA Speech Recognition(CSR) (2) CLOVA Face Recognition(CFR) (3) Papago Text Translation (4) Papago Language Detection (5) Papago Korean Name Romanizer 이 중 가장 인상 깊었던 것은 speech recognition이었다. 평소 유튜브나 넷플릭스를 보면서 자막을 어떻게 만들지에 대해 의문이 있었다. 사람의 말도 학습하는 것이 인상 깊었고, 이 부분에 대해 나중에 프로젝트(도움을 청하는 말을 인식하는 프로그램 등)를 진행해보고 싶다. 2. 프로젝트 주제 선정 (1) 주제: 따릉이 수 ..

Data Analysis 2021.11.17

[데이터분석 3차] 이미지 데이터 인식, 따릉이 데이터 예측

1. 이미지 데이터 인식 실습 이번 시간에는 이미지 데이터에 대해 학습하였다. "teachable machine" 사이트를 통해 이미지, 음성, 행동 인식을 간단하게 실습할 수 있으며, 이를 코드로 변환할 수도 있다. 각자 인식하고 싶은 이미지들을 수집해 모델에 학습시킨 후 결과를 보기로 하였다. 나는 "반려견 목줄 인식이 가능한가"에 대해 목줄을 착용한 강아지와 미착용한 강아지의 사진을 수집하여 모델에 학습시켰다. 그리고 그 결과 생각보다 인식이 잘 되는 것을 알 수 있었다. (주제에 대한 내용은 학교 컴퓨터 비전 수업에서 개인 프로젝트로 진행하기로 한 주제라 자세한 이야기는 나중에 풀어보겠다.) 그리고 모델을 코드로 변환시켜 colab에서도 실시해보았다. 수업 시간에 이미지 데이터를 수집한 것이기 때..

Data Analysis 2021.11.14

[데이터분석 2차] 데이터 전처리, 따릉이 데이터 분석

1. 복습 저번 주에는 데이터 수집 방법에 대해 수업하였다. 그래서 BeautifulSoup, Selenium을 사용한 크롤링 실습을 진행하였고, 그와 동시에 날씨와 시간에 따른 따릉이(공공자전거) 대여 수 변화에 대해 분석 및 시각화를 실시하였다. 데이터 분석 실습에 대한 내용을 다음과 같다. 지역을 따릉이의 이용수가 가장 많은 여의도로 선정하였고, 2021년 6월 1일~13일 따릉이 이용정보(따릉이) 주제: 날씨, 시간 별 따릉이(공공자전거) 대여 수 분석 및 시각화 데이터셋: 2021년 6월 1일~13일 시간별 따릉이 이용정보(공공데이터 포털), 2021년 6월 1일~13일 시간별 날씨(강수, 기온, 풍속, 습도) 데이터(기상청 공공데이터) 데이터 전처리: 지역을 따릉이의 이용 수가 가장 많은 여의..

Data Analysis 2021.11.10

[데이터 분석 1차] 회고

bluemoon dream 에서 실시하는 데이터 분석 교육에 참여해 10~11월 두 달간 교육을 받고 있다. 일주일에 화, 수, 목 6시~10시(4시간), 토 10시~7시(8시간) 교육을 진행하고 있다. 그리고 이 글은 현재까지 공부한 내용 중 중요 내용과 실습에 대한 내용을 담고 있다. 10월 한 달동안 파이썬 문법에 대한 공부를 실시하였다. 파이썬의 기초 문법과 이를 이용한 opencv 실습을 실시하였다. 10월 온라인 수업으로 진행되었기 때문에 강사님이 올린 코드를 따라 하며 학습하는 방식이었다. 11월 11월부터 본격적인 데이터 분석 실습을 진행하였다. (1) Kaggle, DACON 사이트에서 많은 데이터 분석 대회가 열리고 있는 것을 확인하였다. (2) 데이터 분석 흐름: 학습 데이터를 통해 ..

Data Analysis 2021.11.07
728x90