본문 바로가기
728x90
반응형

IT지식36

[파이썬으로 데이터 분석하기4]DataFrame를 활용한 데이터 분석 오늘의 목표 - Pandas 패키지의 DataFrame 객체를 활용하여 데이터에 대한 탐색적 분석을 수행한다. - DataFrame객체에서 조건에 의한 데이터 추출을 한다. 데이터 분석하기 1. 주피터 노트북에서 실습을 중단하고 다시 시작하는 분들은 [Cell-Run All] 선택 왜? 더 이상 메모리에 존재하지 않는 내용을 다시 읽어 들여 다음 작업이 가능해지도록 하기 위함 데이터를 바꿨습니다. 이걸로 다운받아서 사용하세요. 이 데이터들은 저번 시간처럼 C:\Users\컴퓨터사용자이름\Python\data에 넣어주세요. 2. describe() 함수 변수이름.describe(): 기본적인 통계 값을 한 번에 알아보는 방법, 데이터 중 수치형 데이터에 해당하는 열에 대해서 요약 데이터를 계산한다, 파이썬.. 2021. 11. 28.
[파이썬으로 데이터 분석하기3] 데이터 파일 업로드 방법, 그 외 문제 해결 데이터 준비 공공데이터 포털에 들어가서 '국민연금공단_국민연금 가입 사업장 내역'으로 가져왔다. csv파일이 있으니 다운로드하기 https://www.data.go.kr/data/15083277/fileData.do 국민연금공단_국민연금 가입 사업장 내역_20211118 (국민연금가입수급정보) 법정동단위 지역별, 국민연금 가입 사업장 정보 * 단, 개인사업장 및 2인 이하 법인 사업장 정보 미제공 *사업장 컬럼별 상세설명 ○ 자료생성년월 → 자격 www.data.go.kr 데이터 업로드 1. C:\Users\사용자이름\Python 폴더로 들어간다. 2. Python 디렉터리에 data라는 파일명을 만든다. 3. 주피터 노트북으로 열고 파일 생성 'python'폴더에 들어가면 'data'라는 파일이 생성되.. 2021. 11. 27.
[파이썬으로 데이터 분석하기2] 주피터노트북 기초 세팅과 기초사용 주피터 노트북 기초 세팅 폴더 만들기 폴더 이름 바꾸기 폴더 왼쪽에 체크박스를 체크하고 Rename 눌러서 폴더 이름을 바꾼다. 파이썬 파일 만들기 아까 만든 파일 이름을 practice라고 하고 그 파일 안에 파이썬 파일을 만들어보겠다. jupyter Notebook 기초 사용법 1. 셀 셀: In [ ] : In은 라인 번호를 의미, 작업을 수행하면 대괄호([ ])안에 라인 번호가 부여됨 2. 코드 작성 후 Enter, Ctrl+Enter, Shift Enter 코드 작성 후에 엔터를 누르면 그냥 다음줄로 이동 코드 작성 후에 Ctrl+Enter를 누르면 코드가 실행됨 코드 작성 후에 Shift Enter를 누르면 코드가 실행되고, 아래에 빈 셀까지 생성함 3. 셀 추가, 삭제 4. 변수 ● 정의 변.. 2021. 11. 23.
[파이썬으로 데이터 분석하기1] 아나콘다설치 방법, 주피터 노트북 실행방법 오늘의 목표 1. 아나콘다를 설치하고 주피터를 실행한다. 2. 주피터 노트북의 기초 사용법을 설명한다. 파이썬의 특징 보편적 목적의 프로그래밍 언어이다. 발표된지는 30년가량 되었다. 비영리 조직인 '파이썬 소프트웨어 파운데이션'에서 오픈소스로 관리되고 있다. 오픈소스이기에 누구나 무료로 사용 가능하다. 무료이기에 기능이 부족하지 않을까? → NO! [꾸준하게 업그레이드 진행 + 패키지]로 모든 사용자의 참여로 고급 기능 사용 가능하다. 다양한 OS(운영체제)를 지원한다. 인터프리터 방식(몇 줄의 코드를 입력 후 엔터로 실행)으로 정상처리/에러 여부를 알 수 있는 대화형 프로그래밍 언어 ↔ 컴파일러: 코딩을 모두 마치고 컴퓨터가 알아들을 수 있는 기계어 수준으로 한 번에 번역해서 실행 가능 데이터 과학을.. 2021. 11. 23.
►파이썬 코딩 도장-17.6 심사문제: 교통카드 잔액 출력하기 문제 표준 입력으로 금액(정수)이 입력됩니다. 1회당 요금은 1,350원이고, 교통카드를 사용했을 때마다의 잔액을 각 줄에 출력하는 프로그램을 만드세요(input에서 안내 문자열은 출력하지 않아야 합니다). 단, 최초 금액은 출력하지 않아야 합니다. 그리고 잔액은 음수가 될 수 없으며 잔액이 부족하면 출력을 끝냅니다. judge_while.py ________________ ________________ ________________ ________________ 예 입력 10000 결과 8650 7300 5950 4600 3250 1900 550 입력 13500 결과 12150 10800 9450 8100 6750 5400 4050 2700 1350 0 정답 price=int(input()) while.. 2021. 10. 23.
파이썬 while의 모든것 1. Hello world! 100번 출력하기 i=0 # 초기식 while i 0: print('Hello wolrd!') i -= 1 초깃값을 100으로 시작하게 하고, 조건식을 0보다 크게 잡는다. 변화식을 i-=1로 잡아 1씩 감소하게 둔다. 그럼 i가 0이 되면 Flase로 반복문을 끝낸다. 4. 입력한 횟수만큼 반복하기 n = int(input('반복할 횟수를 입력하세요.')) i = 0 while i > import random >>> random.random() 0.62436674062417 >>> random.random() 0.5313903194478214 >>> random.random() 0.6865509394592064 random.random()을 실행할 때마다 다른 실수가 출력된.. 2021. 10. 23.
►파이썬 코딩 도장-16.6 심사문제: 구구단 출력하기 문제 표준 입력으로 정수가 입력됩니다. 입력된 정수의 구구단을 출력하는 프로그램을 만드세요(input에서 안내 문자열은 출력하지 않아야 합니다). 출력 형식은 숫자 * 숫자 = 숫자처럼 만들고 숫자와 *, = 사이는 공백을 한 칸 띄웁니다. judge_for_range_multiplication_table.py ________________ ________________ ________________ 예 입력 2 결과 2 * 1 = 2 2 * 2 = 4 2 * 3 = 6 2 * 4 = 8 2 * 5 = 10 2 * 6 = 12 2 * 7 = 14 2 * 8 = 16 2 * 9 = 18 입력 7 결과 7 * 1 = 7 7 * 2 = 14 7 * 3 = 21 7 * 4 = 28 7 * 5 = 35 7 * 6.. 2021. 10. 23.
파이썬 for문 모든것 'Hello World!'를 100번 출력한다고 하자. print('Hello World!') print('Hello World!') print('Hello World!') …(생략) print('Hello World!') print('Hello World!') 이런 식으로 100번 쓰고 앉아 있을 순 없잖아? 1. for와 range 사용하기 for 변수 in range(횟수): 반복할 코드 for반복문은 range에 반복할 횟수를 지정하고 앞에 in과 변수를 입력한다. 끝에 콜론(:)을 붙이고 반복할 코드를 넣는다. for다음 줄에는 반드시 들여 쓰기를 해준다. for i in range(100): print('Hello World!') Hello World! Hello World! Hello Wor.. 2021. 10. 23.
jupyter notebook 초기사용2(describe(), 사분위수, info(), \\N, sum(), std(), skew(), kurt(), 다양한 메소드들) [Cell]-[Run All]: 파이썬을 중단하고 다시 시작했으니, 더 이상 메모리에 존재하지 않는 내용을 다시 읽어 드려 다음 작업이 가능해지도록 하기 위함 변수이름.descibe(): 수치형데이터에 해당하는 열의 데이터 계산 진행(count(개수), mean(평균), std(표준편차), min(최소값), 25%(1사분위수), 50%(중앙값), 75%(3사분위수), max(최대값)), 파이썬의 기본 함수는 아니고 pandas를 import하지 않으면 사용할 수 없음 왜 다양한 값을 계산해 볼 수 있어야할까? 쵀댯값, 최솟값, 범위 등은 데이터 값이 어떤 범위에 해당하느냐에 따라 데이터가 적정한지 알 수 있어서 사분위수: 데이터의 대부분이 어디에 분포하며 그 구간이 넚은지, 좁은지 쉽게 파악 평균, 중앙.. 2021. 10. 19.
728x90
반응형