728x90
반응형
- 코드쓰고 enter: 다음줄로 이동
- shift+enter: 코드 실행
- 패키지: 다양한 프로그램은 누군가가 미리 만들어 누구나 사용할 수 있도록 등록해 둔 것
- os패키지: 운영체제의 기능을 사용하여 알 수 있는 정보를 파이썬 안에서 사용할 수 있도록 연결해 주는 프로그램을 담고 있는 패키지
- import: 패키지를 불러들이는 명령어(주요 패키지는 Anaconda설치 시 함께 설치되기 때문에 import명령어와 사용하고자 하는 패키지 이름만 알면 불러서 사용 가능)
- 불러온 패키지를 내 프로그램에서 사용하는 방법: os.getcwd()['패키지.함수()' 입력 후 실행]
- os.+'tab키': 해당 패키지 안에 있는 함수 목록이 나온다.
- os.getcwd(): current working directory를 찾아주는 함수-결과창에 현재 작업 디렉토리를 보여준다.
- import pandas as pd: Pandas라는 패키지를 사용하겠다.
- Pandas: 데이터 분석에 널리 사용되는 대표적인 패키지 중 하나
- as pd: pandas라는 패키지를 pd라는 별칭으로 부르겠다는 의미(매번 패키지 이름을 길게 쓰기 귀찮아서 쓰임)
- csv파일 불러오기: pd.read_csv() (ex) date=pd.read_csv('data/seoulpopulation.csv')
- encoding: 세상에 존재하는 다양한 언어를 컴퓨터가 처리할 수 있도록 코드화하는 방법
- encoding문제: 윈도우에서 사용하는 기본 encoding과 파이썬에서 사용하는 기본 encoding방법이 일치하지 않아서 생기는 문제
- 데이터 변수이름/print(데이터변수이름) 차이: 그냥 데이터 변수이름으로 치면 결과창에 데이터의 일부와 요약 정보가 나타난다. print(데이터변수이름)으로 치면 데이터가 텍스트로만 나타난다.
- 데이터변수.isnull(): 이 변수의 데이터가 비어있니? 라는 함수이고, 대답은 True와 False로만 대답한다.
- 데이터변수.isnull().sum(): '이 변수의 데이터의 null값의 개수를 보여줘라'라는 뜻. 컬럼이름과 빈칸인 개수를 보여줌
- 근데 isnull은 True와 False로 나타나는데 어떻게 합계가 계산될까? 참이1/거짓이 0으로 처리가능하기 때문에 합계 계산 가능하다.
- sum(): 합계를 계산해 주는 함수
- 결과값의 내용이 정확하게 읽히지 않은 상태: csv파일의 경우 필드값들이 컴마(,)로 분리되어 있는데, 어떤건 tab으로 분리되어있기 때문이다. 이럴경우 csv파일을 불러오는 식 맨 뒤에 sep='\t'를 적으면 된다. (ex) date=pd.read_csv('data/seoulpopulation.csv', sep='\t')
- sep(seperator): 필드의 분리자를 의미
- \t: tap을 의미
728x90
반응형
'IT지식 > Python' 카테고리의 다른 글
파이썬 for문 모든것 (0) | 2021.10.23 |
---|---|
jupyter notebook 초기사용2(describe(), 사분위수, info(), \\N, sum(), std(), skew(), kurt(), 다양한 메소드들) (0) | 2021.10.19 |
파이썬 elif사용하기, if와 elif차이 (0) | 2021.10.14 |
►파이썬 코딩 도장-14.7 심사문제: 합격 여부 판단하기 (0) | 2021.10.12 |
파이썬 else의 모든것 (0) | 2021.10.12 |