분석 4

[2월][4주차] SQL에서 PYTHON으로 DB 불러와서 분석 및 시각화

2025.02.26 수요일 [미니 팀프로젝트] 주제 : 사용자 선호도를 반영한 DVD 대여 트렌드 분석 (in 미국) 조건 : MYSQL의 내장 데이터 sakila 활용해서 분석 및 인사이트 제공✅문제 인식 및 목적영화 대여 서비스에서 사용자 선호도를 정확히 파악하지 못하면, 매출과 만족도가 저하될 수 있음.어떤 장르와 배우가 인기가 있는지 명확한 데이터 기반 분석이 부족하면, 인기 없는 콘텐츠 확보로 인한 비용 낭비가 발생할 수 있음.사용자들이 선호하는 장르와 배우를 파악하지 못하면 추천 시스템의 효과가 떨어지고, 대여율이 낮아질 가능성이 있음.효율적인 콘텐츠 라이브러리 운영대여율이 높은 장르와 배우를 고려하지 않고 무작위로 콘텐츠를 확보하면, 인기 없는 영화들이 라이브러리에 과도하게 포함될 수 있음...

🕥시계열 데이터 분석 완벽 가이드🕥

시계열 데이터는 시간의 흐름에 따라 수집된 데이터를 의미하며, 금융, 기상 예측, 의료, 제조 등 다양한 분야에서 활용됩니다. 본 글에서는 시계열 데이터의 개념부터 주요 분석 기법(예측, 분류, 이상 탐지)에 대해 정리해보겠습니다.1. 시계열 데이터란?시계열 데이터(Time Series Data)는 시간 축에 따라 순차적으로 기록된 데이터로, 일정한 간격으로 수집되는 것이 일반적입니다.주식 가격 변화 (1분, 1시간, 1일 단위)기온 변화 (시간별, 일별 기온 데이터)소셜 미디어 트렌드 (해시태그, 검색어 트렌드)제조 공정 데이터 (센서 데이터, 품질 검사 데이터)이러한 데이터는 일반적인 정형 데이터와 달리 시간 의존성이 강하므로, 분석 방법도 다릅니다.2. 시계열 데이터의 주요 구성 요소🔹 1) 추세..

[LG U+ 5기]/Study 2025.02.22

[Hacker Rank] SQL_Intermediate_Medium (재귀함수/REPEAT)

난이도 : 중하소요시간 : 20분 앞에서 재귀함수로 골머리를 앓고 드디어 나온 재귀함수 문제 ! 함수 작성은 약간 책의 도움을 받긴 했지만, 그래도 스스로 변수에 맞춰서 수정완료 ㅎ 설명을 하자면, p라는 함수에는 n 컬럼 존재, 처음엔 1 과 union으로 자기 스스로 값에 +1을 덧붙이게 됨. => 컬럼 n 출력하면,=> 1     2     3     4........ 이런식으로 출력될 것임. 문제는 숫자가 아닌 문자열을 갯수만큼 나오게 하는, 파이썬의 피라미드 세우기 같은 형태니까, 문자열*숫자로 출력진행with recursive p (n)as ( select 1 union all select (n+1) from p where n=> 얘는 자꾸 00000이렇게 출력 됨. 알아보니 SQL에서 (문자..

SQL 2025.01.30

[1월][4주차][AWS] 2일차 (EBS/ELB 생성 및 연결)

2025.01.22 수요일2일차 오늘 9호선 지연으로 간당간당 했지만,,,,8시 58분 세이프..!  아무래도 내일은 5분정도 더 일찍 나와야겠다.  오늘은 좀 더 깊게 AWS에 대해서 배워봤다. 실제로 페이지 주소를 만들고 블로그 페이지 생성? 같은 걸 진행했는데, 하면서 admin이라던가, 로드 발란싱이라던가, 하는 용어들을 배우고, 또 약간 개발자 모먼트 적인 부분을 진행하니까 솔직히 개발자 친구들이랑 대화할 때 이해가 안가던 부분이나 현직자 데이터 분석가 분들을 만났을 때, 대화하면서 뭐지(?) 싶은 부분들이 많았는데 아주 약간 조금은 이해가 되는 것 같달까... 오늘 수업하면서 느낀점은 데이터 분석가라고 해서 데이터만 보고, 분석만 하는게 아니라 앱 로그 분석이라면, 분석가 분들이 개발자 분들한..

[LG U+ 5기]/Study 2025.01.22