상세 컨텐츠

본문 제목

240314목_TIL

TIL

by 30303 2024. 3. 14. 20:56

본문

728x90

스파크

 

file format

디스크에 데이터를 어떻게 저장하는가

 

csv,txt

comma-separated values의 약자, 콤마로 구분

 

json

python의 dictionary와 같은 형식

utf-8

 

pickle

개인용 플젝용

협업 어려운.

 

parquet 

빠르고 가벼운. 

 

I/O input output 데이터 입출력

 

데이터 수급 구조

network<disk<memory

 

왜 클라우드?

쉬운 관리, 보안, 가용성

여러대의 컴퓨터= 통상 클라우드 서버를 가리킴

 

클라우드 종류

AWS

GCP-bigquery

Microsoft Azure

 

클라우드의 기능

스토리지 

simple storage service

 

엔진

ssh이용하여 접속 혹은 vscode

 

데이터베이스

데이터 공유/보호, 보안/검색/백업 및 복원 기능

 

RDS 관계형 데이터베이스

postgres, mysql

 

Athena 대화형 쿼리 서비스, serverless.


1차회의:

배너 제작완료 / 방향성 설정-두갈래에서 일단은 시범으로 한개 진행 후, 피드백 보완하여 2차 진행토록

특정 커뮤니티만 크롤링 하면 될듯하다. - 크롤링 한 자료를 어떻게 이용할 것인가?


내일은 머런강의에만 집중할 것,,~

 

'TIL' 카테고리의 다른 글

240319화_TIL  (0) 2024.03.19
240318월_TIL  (2) 2024.03.18
240313수_TIL  (0) 2024.03.13
실전 프로젝트 KPT 회고  (0) 2024.03.13
240312화_TIL  (0) 2024.03.12

관련글 더보기