jupyter notebook 초기사용2(describe(), 사분위수, info(), \\N, sum(), std(), skew(), kurt(), 다양한 메소드들)
[Cell]-[Run All]: 파이썬을 중단하고 다시 시작했으니, 더 이상 메모리에 존재하지 않는 내용을 다시 읽어 드려 다음 작업이 가능해지도록 하기 위함 변수이름.descibe(): 수치형데이터에 해당하는 열의 데이터 계산 진행(count(개수), mean(평균), std(표준편차), min(최소값), 25%(1사분위수), 50%(중앙값), 75%(3사분위수), max(최대값)), 파이썬의 기본 함수는 아니고 pandas를 import하지 않으면 사용할 수 없음 왜 다양한 값을 계산해 볼 수 있어야할까? 쵀댯값, 최솟값, 범위 등은 데이터 값이 어떤 범위에 해당하느냐에 따라 데이터가 적정한지 알 수 있어서 사분위수: 데이터의 대부분이 어디에 분포하며 그 구간이 넚은지, 좁은지 쉽게 파악 평균, 중앙..
2021. 10. 19.
jupyter notebook 에서 초기사용(패키지, import, os, getcwd,pandas, csv, encoding, isnull(), sum(), sep(), \t)
코드쓰고 enter: 다음줄로 이동 shift+enter: 코드 실행 패키지: 다양한 프로그램은 누군가가 미리 만들어 누구나 사용할 수 있도록 등록해 둔 것 os패키지: 운영체제의 기능을 사용하여 알 수 있는 정보를 파이썬 안에서 사용할 수 있도록 연결해 주는 프로그램을 담고 있는 패키지 import: 패키지를 불러들이는 명령어(주요 패키지는 Anaconda설치 시 함께 설치되기 때문에 import명령어와 사용하고자 하는 패키지 이름만 알면 불러서 사용 가능) 불러온 패키지를 내 프로그램에서 사용하는 방법: os.getcwd()['패키지.함수()' 입력 후 실행] os.+'tab키': 해당 패키지 안에 있는 함수 목록이 나온다. os.getcwd(): current working directory를 찾아..
2021. 10. 19.