기존 캐글 데이터 셋 eda
데이터 분석가 평균 연봉 약 6만 ~8만 (주니어의 경우 조금 낮을 수 있음.)
대부분 스타트업이나 대기업에서 근무
사무실 주로 뉴욕, 캘리포니아, 텍사스 주
회사의 규모는 rating과 salary에 영향을 미치지 않음
회사의 수익 또한 영향을 미치지 않음
가장 낮은 평가를 받는 곳은 스타트업이나 소규모 기업
Top 3 Sectors by Salary: Biotech & Pharma, Real Estate and Arts, Entertaiment & Recreation.
3 Sectors with lowest Salary: Tourism, Mining and Restaraunts & Food
Top 3 Job titles by Salary: Marketing Data Analysts, Lead Data Analysts and Business Data Analysts.
Last 3 are: Data Warehouse Analysts, SQL Data Analysts and Techical Data Analysts.
고임금 산업: 생명과학 및 의약품, 부동산, 예술 및 엔터테인먼트와 같은 산업은
데이터 분석 결과가 비즈니스 결과에 미치는 영향이 상당
이러한 산업은 복잡한 데이터를 처리하며 규정 준수를 요구할 수 있어, 숙련된 분석가에 대한 수요가 높아 높은 임금을 지급할 수 있음
고임금 직책: 마케팅 데이터 분석가, 리드 데이터 분석가, 비즈니스 데이터 분석가
리드 데이터 분석가는 추가적인 책임을 맡고 있을 수 있으며 이는 더 높은 급여를 정당화소규모 기업 및 스타트업 회피: 데이터 분석가는 장기적인 안정성, 성장 잠재력 및 직장 보안에 대한 우려로 인해 소규모 기업이나 스타트업을 피할 수 있습니다. 또한 작은 기업은 확립된 프로세스와 인프라가 부족할 수 있으며, 이는 무거운 업무 부담과 일-생활 균형에 영향을 줄 수 있습니다.이러한 요인을 이해하면 데이터 분석가들이 자신의 직업 경로와 채용 기회에 대해 현명한 결정을 내릴 수 있습니다.
라는 인공지능 답변.
da+de+ds 데이터셋 concat
eda? 끝없는 시각화..?
spacy
!pip install spacy==2.0.0.0
gensim 설치
ModuleNotFoundError: No module named 'gensim.summarization'
gemsim을 최신버전에서 summarization 관련 매소드를 불러오면 다음과 같은 에러가 발생
3.4.0으로 다운그레이드
pip install gensim==3.4.0
전에 어느 모듈 pandas 2.0미만에서 돌아간다고 다운그레이드.
근데 또 이거는 이상이어야 한다 .. 고.
버전 맞추기... 유의할 점.
240419수_TIL (0) | 2024.04.11 |
---|---|
240409화_TIL (0) | 2024.04.09 |
240405금_TIL (0) | 2024.04.05 |
240404목_TIL (0) | 2024.04.04 |
240402수_TIL (0) | 2024.04.02 |