TIL

240124수_TIL

30303 2024. 1. 24. 16:36
728x90

알고리즘 코드카타

 

문제 16.

함수 solution은 정수 x와 자연수 n을 입력 받아, x부터 시작해 x씩 증가하는 숫자를 n개 지니는 리스트를 리턴해야 합니다. 다음 제한 조건을 보고, 조건을 만족하는 함수, solution을 완성해주세요.

 

왜 n+1인지 i=0부터 n-1까지 실행된다고..

def solution(x, n):
    answer = []
    for i in range(1,n+1):
        answer.append(x*i)
    return answer

 

문제 17.

자연수 n을 뒤집어 각 자리 숫자를 원소로 가지는 배열 형태로 리턴해주세요. 예를들어 n이 12345이면 [5,4,3,2,1]을 리턴합니다.

def solution(n):
    answer = []
    for i in str(n)[::-1]:
        answer.append(int(i))
    return answer

파이썬 reversed()

https://www.daleseo.com/python-reversed/

 

파이썬의 reversed() 함수로 거꾸로 루프 돌리기 (vs. slicing 연산자 & reverse() 함수)

Engineering Blog by Dale Seo

www.daleseo.com

문제 18.

문자열 s를 숫자로 변환한 결과를 반환하는 함수, solution을 완성하세요.

def solution(s):
    answer = int(s)
    return answer

문제 19.

임의의 양의 정수 n에 대해, n이 어떤 양의 정수 x의 제곱인지 아닌지 판단하려 합니다.
n이 양의 정수 x의 제곱이라면 x+1의 제곱을 리턴하고, n이 양의 정수 x의 제곱이 아니라면 -1을 리턴하는 함수를 완성하세요.

def solution(n):
    n=n**(1/2)
    if n==int(n):
        return (n+1)**2
    else:
        return -1

 

제곱근

https://jimmy-ai.tistory.com/184

 

파이썬에서 제곱, 제곱근을 나타내는 방법 정리(**, math, numpy 이용)

파이썬 제곱과 제곱근 구하기 예제 파이썬에서 m의 n제곱 형태를 구할 수 있는 방법들을 파이썬 기본 연산자인 **을 이용하는 경우와 math, numpy 라이브러리를 사용한 경우로 나누어 총망라해보는

jimmy-ai.tistory.com

 


데이터 전처리 시각화 

2주차

데이터 전처리

- 원하는 데이터를 보기 위해 하는 모든 활동

- 규칙성을 찾아서 데이터를 원하는 값으로 통일

-데이터 전달의 목적성/효과성을 지녀야.

시리즈;컬럼하나

데이터 프레임; 두개 이상의 컬럼

인덱스; 각 행에 부여. 특정 정보를 찾고자 할 때 부여된 번호를 통해 확인


3주차

ModuleNotFoundError                       Traceback (most recent call last)
Cell In[2], line 1
----> 1 import pandas as pd

ModuleNotFoundError: No module named 'pandas'

https://docs.kanaries.net/ko/topics/Pandas/no-module-named-in-pandas

 

Pandas에서 'No Module Named' 오류 해결: 상세 가이드 – Kanaries

판다스(Pandas)에서 'No module named' 오류를 해결하는 방법에 대해 다양한 방법을 탐색하며, 파이썬 데이터 과학 프로젝트를 위한 상세한 설명과 코드 예제를 제공합니다.

docs.kanaries.net

 

 

https://garamdong.tistory.com/151

 

비주얼스튜디오 코드 터미널 단축키 (with Python)

목차 코딩시 단축키를 사용해야 하는 이유 키보드 단축키는 영어로 하면 keyboard shortcut 즉, 지름길이란 뜻이다. 코딩을 할 때 단축키를 사용한다면 마우스를 이용하는 것보다 시간 절약은 물론이

garamdong.tistory.com

단축키..! 새 코드 추가할 때 커맨드 엔터


데이터 저장하기

data.to_csv("tips_data.csv")

csv 파일로 저장/ 데이터 전처리 후 파일화

 

 

데이터 불러오기

unnamed: 왼쪽 인덱스와 비슷, 별도의 인덱스 설정 않고 불러오면 컬럼의 형태로 인덱스가 들어오는 경우 존재.

 

index=False 로 저장해두거나.

index_col=0 으로 데이터를 불러오면 됩니다. 

 

폴더 생성, 파일 경로 지정

파일경로 지정

---------------------------------------------------------------------------
OSError                                   Traceback (most recent call last)
Cell In[18], line 1
----> 1 df.to_csv("temp/tips_data.csv")

File ~/Library/Python/3.9/lib/python/site-packages/pandas/util/_decorators.py:333, in deprecate_nonkeyword_arguments.<locals>.decorate.<locals>.wrapper(*args, **kwargs)
    327 if len(args) > num_allow_args:
    328     warnings.warn(
    329         msg.format(arguments=_format_argument_list(allow_args)),
    330         FutureWarning,
    331         stacklevel=find_stack_level(),
    332     )
--> 333 return func(*args, **kwargs)

File ~/Library/Python/3.9/lib/python/site-packages/pandas/core/generic.py:3961, in NDFrame.to_csv(self, path_or_buf, sep, na_rep, float_format, columns, header, index, index_label, mode, encoding, compression, quoting, quotechar, lineterminator, chunksize, date_format, doublequote, escapechar, decimal, errors, storage_options)
   3950 df = self if isinstance(self, ABCDataFrame) else self.to_frame()
   3952 formatter = DataFrameFormatter(
   3953     frame=df,
   3954     header=header,
   (...)
   3958     decimal=decimal,
   3959 )
-> 3961 return DataFrameRenderer(formatter).to_csv(
   3962     path_or_buf,
   3963     lineterminator=lineterminator,
...
    614 parent = Path(path).parent
    615 if not parent.is_dir():
--> 616     raise OSError(rf"Cannot save file into a non-existent directory: '{parent}'")

OSError: Cannot save file into a non-existent directory: 'temp'
Output is truncated. View as a scrollable element or open in a text editor. Adjust cell output settings...

 

뭔지는 모르겠으나 자꾸 오류 나니까 설치하라고 추천해준... 

 

pip install openpyxl

이거 하며는 엑셀 오류 뚱땅. 하다가 외안되 하다가.. 구르다 보면 바로 뒤에서 해결책을 제시해주시는.. 한국말 끝까지 듣기..


인덱스

인덱스 이름 지정
loc/ index를 활용해 데이터를 확인
인덱스 정렬
인덱스 지정

=> A라는 컬럼을 인덱스로 사용하겠다.

index 값과 type 확인
다시 또 인덱스 추가도 가능
index를 기존 값으로
기존 index 없어짐

 


컬럼

 

데이터 설정
대괄호 안에 컬럼명 입력 시 컬럼 내 값 가져옴

-> series 형태로 값들을 가져옴

 

현 컬럼명과 구성 확인
index와 마찬가지로 column명 변경 가능
특정 컬럼명 변경
동시에 여러 컬럼명 변경 가능. 주의사항 중괄호 사용
컬럼 추가 가능
컬럼 삭제도 가능. 주의사항: 삭제와 동시에 한번에 조회하거나 새 코드 창에서 데이터 조회. 그렇지 않을 경우 이미 제거되었기에 오류 발생


데이터 확인

 

기초 통계량 확인

.head() -- 5개 행에 대한 summary 형태

df.head(3) --> 3개의 행

 

.info()-- 데이터 프레임에 관한 정보

 

.describe() -- 기초 통계량 확인

숫자 값을 가진 컬럼만 기초통계량 확인 가능(float, int)

 

결측치 확인

df.info()

non-null; null이 아닌 값 몇 개 있는지

 

.isna()

true => null 값

 

데이터 타입

 

.dtype -- 해당 컬럼이 무슨 타입인지 확인

 

.astype(str) -- 데이터 타입을 str으로 변환

다시 할당해줘야 적용됩니다.

.dtypes -- 전체 컬럼의 데이터 타입 확인

 


데이터 선택

 

iloc - 번호(인덱스)를 통해 특정 행과 열을 선택

loc - 문자(이름)를 활용해 각 데이터를 선택

 

첫 번째 행 확인

df.iloc[0]

 

첫 번째 행부터 2개 확인

df.iloc[0:2]

 


강의는 오늘 끝.. 내일.. 더 .. 잘.. 하자.. + 굉장히 불건강한 상태; 내일꼭 운동 가긱.


https://spri.kr/posts/view/22068?code=inderstry_trend

 

금융권의 빅데이터 활용 동향 - SPRi

금융산업에서 빅데이터는 잠재가치와 데이터 획득의 용이성이 타 산업 대비 높은 수준이며, 금융산업 전 분야에서 활용이 가능함 (후략)

spri.kr

https://www.itworld.co.kr/news/116694

 

금융 업계의 빅데이터·머신러닝 자동화 흡수 경향

금융은 데이터를 핵심 비즈니스 자산으로 삼는 대표적인 산업이다. 데이터 중심의 비즈니스 트랜포메이션의 전형을 보여주는 금융 업계는 빅데이터와

www.itworld.co.kr

https://medium.com/@aimap.marker/%EA%B8%88%EC%9C%B5-%EC%97%85%EA%B3%84%EC%9D%98-9%EA%B0%80%EC%A7%80-%EB%8C%80%ED%91%9C%EC%A0%81%EC%9D%B8-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EA%B3%BC%ED%95%99-%ED%99%9C%EC%9A%A9-%EC%82%AC%EB%A1%80-7f38804e1401

 

금융 업계의 9가지 대표적인 데이터 과학 활용 사례

금융업계에서 데이터 과학을 이용하는 것은 단순한 유행을 넘어서, 경쟁에 뒤쳐지지 않기 위해서는 꼭 필요한 일이 되었습니다. 은행들은 빅데이터 기술이 자원을 효율적으로 집중시키고, 더

medium.com

https://www.thedatahunt.com/trend-insight/ai-in-finance

 

금융 AI 인공지능, 5가지 활용 방안과 적용 예시

금융업에서 AI 인공지능은 금융 상품 추천과 매매 전략 분석, 금융 사기 탐지, 대출 심사, 자산 포트폴리오 최적화, 보안 감시 등 다양한 분야에서 정확한 판단에 도움을 주고 있습니다.

www.thedatahunt.com

https://dacon.io/competitions/official/82407/talkboard/400442

 

KCB 금융 데이터 시각화 4등 수상작

KCB 금융스타일 시각화 경진대회

dacon.io

https://dataonair.or.kr/data-report/

 

데이터 리포트 – DATA ON-AIR

 

dataonair.or.kr

https://bigdata.seoul.go.kr/noti/selectPageListTabNoti.do?r_id=P260

 

서울특별시 빅데이터 캠퍼스

서울시 빅데이터 캠퍼스 공모전을 통해 빅데이터 분석결과를 도출하고 빅데이터 캠퍼스 웹사이트에 게시하여 시민 누구나 지식과 정보를 공유할 수 있습니다.

bigdata.seoul.go.kr

https://www.hani.co.kr/arti/economy/biznews/1121105.html

 

제3회 소외계층을 위한 AI활용 아이디어 공모전 시상식 개최

□ 전국 21개 사이버대학 운영 협의회체인 (사)한국원격대학협의회(김진성 회장/고려사이버대 총장)는 12월20일(수) 오후 2시 고려사이버대 대강당에서 공모전 수상자들이 참석한 ‘제3회 소외계

www.hani.co.kr