728x90 TIL/파이썬9 22.11.01 시각화 방식비교 lambda,map()함수 시각화 방식비교 subplot 상태기반방식 (state-based framework) 그림을 순서에 맞게 코딩하여 그리는 방식(논리적 흐름이 아닌 시간의 흐름에 따라 ) 즉 그리기의 한계를 벗어나지 못한다 plt뒤에 오는 명령어만 익히면되서 입문서에 많이쓰임 간단하고 빠르게 형상만 확인하는데 유리 공간제어를 코드순서와 일치시켜야해서 코딩을 오르락 내리락해야한다 즉 체계를 갖추기도어렵고 나열식 코드로 진행된다 같은데이터지만 일부분이 완전히 다른 그림을 만들수 있다 subplots 객체 지향방식 (objeck-oriented framework) 대상을 지정하여 그리는 방식 (논리에 따라 코딩) 결과물의 일부를 수정하기 유리한 방식 (코드를 재사용, 유지보수에 유리) 레이아웃 전체를 한번에 정의하고 시작 (전.. TIL/파이썬 2022. 11. 2. 22.10.30 pandas 연습문제 1. groupby 1개만 묶기 df.groupby("묶고 싶은 컬럼")["원하는 값 컬럼 "].원하는 연산 () ex df.groupby("class")["fare"].mean() # class별 평균 fare계산하기 여러개의 함수를 연상하고 싶을떄 agg를 사용 df.groupby("묶고 싶은 컬럼")["원하는 값 컬럼 "].agg([원하는 연산1,원하는연산2] ) ex df.groupby("class")["fare"].agg(["mean","sum"])\ # 클래스별 fare의 평균, 합계 계산하기 2개 이상으로 그룹화하기 df.groupby(["묶고 싶은 컬럼1","묶고 싶은 컬럼2"])["원하는 값 컬럼 "].agg(원하는 연산 ) ex df.groupby(["class",.. TIL/파이썬 2022. 10. 30. 22.10.12 0304 파일불러오기 from glob import glob glob ("data/apt*.csv")) glob함수를 이용하면 인자로 받은 패턴과 이름이 일치하는 모든 파일과 디렉터리를 반환한다 이를 통해 apt*는 apt로 시작하는 파일을 가져와라~ 데이터 타입 변경하기 pd.to_numeric - 함수를 이용한 문자열 칼럼의 숫자형으로 변경 이떄 쓸수있는 옵션 3개 ㄱ. errors = 'ignore' = 숫자로 변경할수 없을시 원본 그대로 반환 ㄴ.errors = 'coerce' = 숫자로 변경할수 없을시 NaN으로 반환 ㄷ. errors = 'raise' = 숫자로 변경할수 없는데이터라면 에러후 중단 astype() 메소드를 이용한 문자열 칼럼의 숫자형 변환 ex astype(int) 컬럼문구를 .. TIL/파이썬 2022. 10. 12. 오늘 공부한거 요약해보기 df.groupby() 와 df.pivot_table() 공통점 groupby로 할수있는건 pivot_table로도 할수있고 그반대도 마찬가지이다 즉 둘가 같은 연산을 수행할수 잇는 기능이다 차이점 groupby가 연산속도가 더빠르다 pivot_table은 직관적인사용법을 가졌다 또한 groupby 는 결과물이 series 라면 series 로 반환되고 pivot_table은 항상 데이터프레임으로 반환한다 사용법 1. 1개 그룹화 df.groupby('age').mean() age 컬럼 기준으로 평균 2개 그룹화 df.groupby(['age', 'sex']).mean() age, sex 그준으로 평균 그룹에서 특정 컬럼 값만을 뽑아내고 싶을떄 df.groupby(['age', 'sex'])['survi.. TIL/파이썬 2022. 10. 10. 시리즈와 데이터프레임 파이썬에는 데이터 분석 모듈인 Pandas가 있다 판다스의 자료구조는 Series(시리즈)와 DataFrame(데이터 프레임)이있다! 그리고 모든 자료구조에는 index를 가지고있다 1. Series(시리즈) 시리즈는 1차원 데이터로 리스트와 유사하다 단 리스트와 달리 인덱스를 부여할수있다 그러므로 key값이 index : valie값에 값으로 들어감으로서 딕셔너리와 구조가 비슷하다 딕셔너리 , 리스트 , 튜플을 pandas.Series(딕셔너리 , 리스트 , 튜플)로 시리즈로 변활할수있고 리스트와 튜플은 index이름을 지정하거나 지정하지않으면 정수형 위치인덱스가 자동 지정된다 원소 선택하기ㄱ. 정수형 [숫자] / ["인덱스이름"] / [[여러개선택시, 대괄호도 두개]] / [ : ] 슬라이싱도가능 2.. TIL/파이썬 2022. 10. 6. 프로그래머스 문제풀기 - 핸드폰 번호 가리기 프로그래머스 모바일은 개인정보 보호를 위해 고지서를 보낼 때 고객들의 전화번호의 일부를 가립니다. 전화번호가 문자열 phone_number로 주어졌을 때, 전화번호의 뒷 4자리를 제외한 나머지 숫자를 전부 *으로 가린 문자열을 리턴하는 함수, solution을 완성해주세요. 입출력 예 phone_numberreturn "01033334444" "*******4444" "027778888" "*****8888" 푸는법 1. 정답 값지정 2. 주어진 번호에서 마지막 4자리를 제외한 숫자를 *로 더함 3. 주어진 번호에서 마지막 4자리를 잘나내서 정답값에 추가 정답 def solution(phone_number): answer = '' phone_number_len = len(phone_number) answ.. TIL/파이썬 2022. 10. 2. 멋쟁이 사자처럼 al스쿨7기 3주차 EDA 22-09-26 오늘의 암기할거 컨트롤 or 커맨드 +/ == 주석달기 배운것 파이썬 데이터 분석기초 기본 EDA 이해하기 추상화된 도구를 통한 기술 통계 구하기 : Pandas-profiling, sweetviz, autoviz 범주형 데이터의 기초 기술통계 수치형 데이터의 기초 기술통계 기술통계, 데이터 색인, 원하는 데이터 찾기, 빈도수 구하기와 집계 05 기술통계(오전) 1. 라이브러리 로드 import pandas as pd #데이터 분석을 위한 판다스 불러오기 import numpy as np # 수치계산을 위한 배열을 다루기위해 넌파이 불러오기 import seaborn as sns # 데이터 시각화도구 불러오기 print(pd.__version__) # 버젼확인하기 print(sns.__v.. TIL/파이썬 2022. 9. 27. 멋쟁이 사자처럼 al스쿨7기 2주차 판다스 멋쟁이 사자처럼 al스쿨7기 판다스 - 파이썬의 대표적인 데이터분석도구 다차원 구조의 데이터를 다룰수 있기떄문에 Panel Data System 을 의미하는 이름으로 지어졌습니다. 쓰는이유 간편하다 (코드한줄로 간단히 데이터를 데이터 프레임이란 데이터타입으로 불러와 작업 빠르다 (메모리위에서만 데이터가 올라가서 빠르게 이루어짐) Pandas는 쉽게 엑셀과 같은 행과 열로 된 구조를 다루는 데이터 분석 도구입니다. 판다스 기본 데이터 구조 데이터프레임, 시리즈 데이터프레임 시리즈 수학적표현 행렬 벡터 리스트 2차원 1차원 예시 [[1.2.3.],[4,5,6]] [1,2,3] 시리즈가 리스트와 다른점 인덱스의 이름부여가능 판다스 사용법 import pandas as pd (as는 약칭으로 축약호칭) 데이터베.. TIL/파이썬 2022. 9. 25. 자기주도학습 정리해보기 멋쟁이 사자처럼 al스쿨7기 파이썬의 특징 오픈소스이다/ 인간다운언어이다 / 비교적배우기쉽다 ㅡ/다양한셍태계가있다/접착제언어이다 파이썬으로 할수있는것 시스템 유틸리티 제작/ gui 프로그래밍 / c/c++와의 결합/웹프로그래밍 / 수치연산프로그래밍 / 데이터분석 파이썬에서 외부모듈을 가져오는법 - import 모듈 일부 기능만을 가져오고싶을떄 - form 모듈 import 이름 모듈이 더 이상 필요없을시 del bool - boolean : 논리적인 데이터유형 True ==1 ,False == 0 주의 첫글자는 대문자 (파이썬은 대소문자 구별을 함) 자료형 수치형 int , flat, complex 문자열 str 리스트 list 사전 dict 집합 set 타입을 알아보는법 type() "1" .. TIL/파이썬 2022. 9. 23. 이전 1 다음 728x90