Python 30

[plotly] 사용법 간단 정리

* plotly란? : 파이썬으로 시각화를 할 수 있는 그래픽 라이브러리 * plotly 공식문서 : https://plotly.com/python-api-reference/generated/plotly.graph_objects.Figure.html plotly.graph_objects.Figure — 5.18.0 documentation ’carpet’, ‘choropleth’, ‘choroplethmapbox’, ‘cone’, ‘contour’, ‘contourcarpet’, ‘densitymapbox’, ‘funnel’, ‘funnelarea’, ‘heatmap’, ‘heatmapgl’, ‘histogram’, ‘histogram2d’, ‘histogram2dcontour’, ‘ic plotly.c..

Python 2024.01.09

[pandas] 데이터 둘러보기, 다뤄보기

- 결측치(=값이 중간에 비어있음)가 존재하는지 확인 + 데이터 분석을 할 때 결측치가 있으면 수식 작동이 안된다. > 확인하기 데이터를 불러온다. import pandas as pd df = pd.read_csv("data/Lemonade2016.csv") 이후 info()를 통해 결측치가 있는지 확인할 수 있다. df.info() # out : >> Non-Null Count로 Null 값의 개수를 확인(Non-Null : Null이 아니다) >> 위 예시에서는 전체 값이 32개이므로 31개의 non-null을 가진다면 결측치가 1개 있다는 뜻 결측치는 .dropna()로 삭제할 수 있다. 1) 행 기준으로 결측치 제거 : .dropna() 2) 열 기준으로 결측치 제거 : .dropna(axis=1..

Python 2024.01.09

[seaborn] 데이터 시각화(+matplotlib)

- seaborn : 데이터 시각화를 위한 Python 라이브러리 중 하나 * seaborn 튜토리얼 링크 : https://seaborn.pydata.org/tutorial.html User guide and tutorial — seaborn 0.13.1 documentation seaborn.pydata.org - 필요한 라이브러리 불러오기 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd import numpy as np - savefig() : 이미지 파일 추가 tips = sns.load_dataset("tips") fig, ax = plt.subplots() sns.scatterplot(x = 'total_bil..

Python 2024.01.08

[pandas] 엑셀 파일 불러오기, 내보내기

- openpyxl 라이브러리가 없다면 설치한다. !pip install openpyxl - 다음과 같은 형식으로 엑셀 파일을 불러온다. import pandas as pd df = pd.read_excel('data/학생시험성적.xlsx') df >> pd.read_excel('') 안에 불러오고 싶은 엑셀 파일의 링크를 복사하여 붙여넣으면 된다. # out : - pandas를 이용해 엑셀 파일에서 특정 시트의 내용을 읽어올 수 있다. df = pd.read_excel("data/학생시험성적.xlsx", sheet_name = '2차시험', index_col = '학생') df # out : sheet_name 옵션에는 시트 번호를 입력하거나 시트 이름을 입력하면 되고, index_col 옵션에는 번..

Python 2024.01.08

[pandas] 데이터 통합하기

- 세로 방향(index 증가 방향)으로 통합하기 우선 통합할 두 DataFrame 데이터를 생성한다. import pandas as pd import numpy as np df1 = pd.DataFrame({ 'Class1' : [95,92,98,100], 'Class2' : [91,93,97,99] }) df1 # out : df2 = pd.DataFrame({ 'Class1' : [87,89], 'Class2' : [85,90] }) df2 # out : 이후 'append()'를 이용했는데 오류가 났다. https://pandas.pydata.org/pandas-docs/version/1.4/reference/api/pandas.DataFrame.append.html pandas.DataFrame..

Python 2024.01.08

[matplotlib] 데이터 시각화

- matplotlib: 파이썬에서 데이터를 효과적으로 시각화하기 위해 만든 라이브러리 import matplotlib.pyplot as plt # matplotlib의 서브모듈 불러오기 - matplotlib에서 2차원 선 그래프를 그리는 형식 plt.plot(x,y,fmt) # x, y : 각각 x축과 y축 좌표의 값을 의미 # fmt : format string, 다양한 형식으로 그래프를 그릴 수 있는 옵션 * subplot() plt.subplot(m, n, p) # m * n 행렬로 이뤄진 하위 그래프 중에서 p번 위치에 그래프가 그려지도록 지정 가능 * 예시 # plt.plot(data1) 책에는 이렇게 나와있는데, 잘못된 것이고 아래(객체지향 방식)처럼 해야한다. fig, ax = plt.s..

Python 2024.01.06

[pandas] 데이터 불러오기

- 데이터셋 불러오기 import seaborn as sns # 데이터셋 찾기 위해 이름 출력해보는 방법 sns.get_dataset_names() # ['anagrams', # 'anscombe', # 'attention', # 'brain_networks', # 'car_crashes', # 'diamonds', # 'dots', # 'dowjones', # 'exercise', # 'flights', # 'fmri', # 'geyser', # 'glue', # 'healthexp', # 'iris', # 'mpg', # 'penguins', # 'planets', # 'seaice', # 'taxis', # 'tips', # 'titanic'] load_dataset()을 통해 원하는 데이터셋을 불..

Python 2024.01.06

pandas 간단 정리

- pandas 튜토리얼 : https://pandas.pydata.org/docs/getting_started/intro_tutorials/index.html Getting started tutorials — pandas 2.1.4 documentation next What kind of data does pandas handle? pandas.pydata.org - pandas 불러오기 import pandas as pd pd.__version__ # 불러왔는지 확인 # '2.1.4' - pandas의 데이터 구조 1) Series() : 라벨을 갖는 1차원 데이터 s1 = pd.Series([10, 20, 30, 40, 50]) s1 # 0 10 # 1 20 # 2 30 # 3 40 # 4 50 #..

Python 2024.01.06

Numpy 배열 생성 정리

- Numpy란? * 파이썬으로 과학 연산을 쉽고 빠르게 할 수 있게 만든 외부 패키지 * 다차원 배열 데이터를 효과적으로 처리할 수 있음 - Numpy 패키지 불러오기 import numpy as np # Numpy 라이브러리를 불러오기 # ModuleNotFoundError: No module named '~~' 오류 : ~~ 라이브러리 설치하기! # !pip install ~~ : 가상환경 말고 주피터랩 안에서 임시로 설치하는 방법 print(np.__version__) # 불러왔는지 확인하기 # 1.26.3 위와 같이 선언하면 Numpy를 이용할 때 numpy를 다 적는 대신 np로 줄여서 작성 가능 - 배열 객체(array object) 생성 num1 = [1,2,3,4] # 리스트 형식 arr..

Python 2024.01.06

반복문

- for-loop, while - 반복문이 필요한 이유 : 같은 코드를 반복해서 입력하지 않고 효율적으로 코드 작성 가능 # 똑같은 코드 반복 > 불편 print("Hello Python") print("Hello Python") print("Hello Python") print("Hello Python") print("Hello Python") print("Hello Python") print("Hello Python") print("Hello Python") print("Hello Python") print("Hello Python") for i in range(10): print("Hello Python") # 두 식 모두 결과값은 같다 #Hello Python #Hello Python #Hell..

Python 2024.01.06