본문 바로가기
728x90
반응형

sum()3

[파이썬으로 데이터 분석하기4]DataFrame를 활용한 데이터 분석 오늘의 목표 - Pandas 패키지의 DataFrame 객체를 활용하여 데이터에 대한 탐색적 분석을 수행한다. - DataFrame객체에서 조건에 의한 데이터 추출을 한다. 데이터 분석하기 1. 주피터 노트북에서 실습을 중단하고 다시 시작하는 분들은 [Cell-Run All] 선택 왜? 더 이상 메모리에 존재하지 않는 내용을 다시 읽어 들여 다음 작업이 가능해지도록 하기 위함 데이터를 바꿨습니다. 이걸로 다운받아서 사용하세요. 이 데이터들은 저번 시간처럼 C:\Users\컴퓨터사용자이름\Python\data에 넣어주세요. 2. describe() 함수 변수이름.describe(): 기본적인 통계 값을 한 번에 알아보는 방법, 데이터 중 수치형 데이터에 해당하는 열에 대해서 요약 데이터를 계산한다, 파이썬.. 2021. 11. 28.
jupyter notebook 초기사용2(describe(), 사분위수, info(), \\N, sum(), std(), skew(), kurt(), 다양한 메소드들) [Cell]-[Run All]: 파이썬을 중단하고 다시 시작했으니, 더 이상 메모리에 존재하지 않는 내용을 다시 읽어 드려 다음 작업이 가능해지도록 하기 위함 변수이름.descibe(): 수치형데이터에 해당하는 열의 데이터 계산 진행(count(개수), mean(평균), std(표준편차), min(최소값), 25%(1사분위수), 50%(중앙값), 75%(3사분위수), max(최대값)), 파이썬의 기본 함수는 아니고 pandas를 import하지 않으면 사용할 수 없음 왜 다양한 값을 계산해 볼 수 있어야할까? 쵀댯값, 최솟값, 범위 등은 데이터 값이 어떤 범위에 해당하느냐에 따라 데이터가 적정한지 알 수 있어서 사분위수: 데이터의 대부분이 어디에 분포하며 그 구간이 넚은지, 좁은지 쉽게 파악 평균, 중앙.. 2021. 10. 19.
jupyter notebook 에서 초기사용(패키지, import, os, getcwd,pandas, csv, encoding, isnull(), sum(), sep(), \t) 코드쓰고 enter: 다음줄로 이동 shift+enter: 코드 실행 패키지: 다양한 프로그램은 누군가가 미리 만들어 누구나 사용할 수 있도록 등록해 둔 것 os패키지: 운영체제의 기능을 사용하여 알 수 있는 정보를 파이썬 안에서 사용할 수 있도록 연결해 주는 프로그램을 담고 있는 패키지 import: 패키지를 불러들이는 명령어(주요 패키지는 Anaconda설치 시 함께 설치되기 때문에 import명령어와 사용하고자 하는 패키지 이름만 알면 불러서 사용 가능) 불러온 패키지를 내 프로그램에서 사용하는 방법: os.getcwd()['패키지.함수()' 입력 후 실행] os.+'tab키': 해당 패키지 안에 있는 함수 목록이 나온다. os.getcwd(): current working directory를 찾아.. 2021. 10. 19.
728x90
반응형