본문 바로가기
IT지식/Python

jupyter notebook 에서 초기사용(패키지, import, os, getcwd,pandas, csv, encoding, isnull(), sum(), sep(), \t)

by 모두의 향연 2021. 10. 19.
728x90
반응형
  • 코드쓰고 enter: 다음줄로 이동
  • shift+enter: 코드 실행
  • 패키지: 다양한 프로그램은 누군가가 미리 만들어 누구나 사용할 수 있도록 등록해 둔 것
  • os패키지: 운영체제의 기능을 사용하여 알 수 있는 정보를 파이썬 안에서 사용할 수 있도록 연결해 주는 프로그램을 담고 있는 패키지
  • import: 패키지를 불러들이는 명령어(주요 패키지는 Anaconda설치 시 함께 설치되기 때문에 import명령어와 사용하고자 하는 패키지 이름만 알면 불러서 사용 가능)
  • 불러온 패키지를 내 프로그램에서 사용하는 방법: os.getcwd()['패키지.함수()' 입력 후 실행]
  • os.+'tab키': 해당 패키지 안에 있는 함수 목록이 나온다.
  • os.getcwd(): current working directory를 찾아주는 함수-결과창에 현재 작업 디렉토리를 보여준다.
  • import pandas as pd: Pandas라는 패키지를 사용하겠다.
  • Pandas: 데이터 분석에 널리 사용되는 대표적인 패키지 중 하나
  • as pd: pandas라는 패키지를 pd라는 별칭으로 부르겠다는 의미(매번 패키지 이름을 길게 쓰기 귀찮아서 쓰임)
  • csv파일 불러오기: pd.read_csv() (ex) date=pd.read_csv('data/seoulpopulation.csv')
  • encoding: 세상에 존재하는 다양한 언어를 컴퓨터가 처리할 수 있도록 코드화하는 방법
  • encoding문제: 윈도우에서 사용하는 기본 encoding과 파이썬에서 사용하는 기본 encoding방법이 일치하지 않아서 생기는 문제
  • 데이터 변수이름/print(데이터변수이름) 차이: 그냥 데이터 변수이름으로 치면 결과창에 데이터의 일부와 요약 정보가 나타난다. print(데이터변수이름)으로 치면 데이터가 텍스트로만 나타난다.
  • 데이터변수.isnull(): 이 변수의 데이터가 비어있니? 라는 함수이고, 대답은 True와 False로만 대답한다.
  • 데이터변수.isnull().sum(): '이 변수의 데이터의 null값의 개수를 보여줘라'라는 뜻. 컬럼이름과 빈칸인 개수를 보여줌
  • 근데 isnull은 True와 False로 나타나는데 어떻게 합계가 계산될까? 참이1/거짓이 0으로 처리가능하기 때문에 합계 계산 가능하다.  
  • sum(): 합계를 계산해 주는 함수
  • 결과값의 내용이 정확하게 읽히지 않은 상태: csv파일의 경우 필드값들이 컴마(,)로 분리되어 있는데, 어떤건 tab으로 분리되어있기 때문이다. 이럴경우 csv파일을 불러오는 식 맨 뒤에 sep='\t'를 적으면 된다. (ex) date=pd.read_csv('data/seoulpopulation.csv', sep='\t')
  • sep(seperator): 필드의 분리자를 의미
  • \t: tap을 의미
728x90
반응형