Analysis 14

[데이터마이닝] VEGA DATA-barley,earth,tip

# 1932에 수확한 Manchuria 종의 지역별 수확량 그리기 import pandas as pdimport altair as alt # Altair 임포트# barley 데이터셋 예제from vega_datasets import data # vega_datasets에서 barley 데이터셋 로드barley = data.barley()# Manchuria 품종만 선택barley_M = barley[barley['variety'] == 'Manchuria']# 특정 연도(1932년) 데이터만 선택barley_M = barley_M[barley_M['year'] == 1932]# Altair로 시각화chart = alt.Chart(barley_M).mark_point().encode( x='si..

Analysis 2024.12.05

[데이터마이닝]seaborn -titanic,taxis,mpg,penguins,flights,tips

[타이타닉]타이타닉 데이터셋: 생존 여부에 따른 fare와 age의 값 범위를 비교import seaborn as snstitanic= sns.load_dataset('titanic')titanicfare_die = titanic[titanic['survived']==0][['fare','age']]fare_survival = titanic[titanic['survived']==1][['fare','age']]f = lambda x: x.max() - x.min()print("died person min-max fare and age ")print(fare_survival.apply(f))print("survival person min-max fare and age ")fare_die.apply(f) "..

Analysis 2024.12.05

[데이터마이닝] Lab8-지도그리기

import pandas as pdimport folium# 데이터 불러오기bike_data = pd.read_csv('./bike202406.csv')# 서울 중심 좌표로 지도 생성seoul_map = folium.Map(location=[37.5665, 126.9780], zoom_start=12)# 따릉이 대여소 위치를 지도에 점으로 표시for idx, row in bike_data.iterrows(): folium.CircleMarker( location=[row['위도'], row['경도']], # 위도, 경도 컬럼명 확인 필요 popup=row['보관소(대여소)명'], radius=2 # 대여소 이름이 있는 컬럼명 ).add_to(seoul_..

Analysis 2024.12.05

[데이터마이닝] Lab7-aggregation group by

import pandas as pdimport seaborn as snsimport matplotlib.pyplot as pltplanets = sns.load_dataset("planets")planets 행성의 발견 방법에 따른 갯수를 그래프로 그리고 분석# 1번문제planets_grouped1 = planets.groupby("method")["number"].sum().reset_index()plt.figure(figsize=(25, 20))sns.barplot(data=planets_grouped1, x="method", y="number")## 1번문제 분석- 행성발견 방법들 중 Radial Velocity 방법과 Transit 방법이 행성을 찾는데에 있어 주요적으로 많이 사용된 모습을 보인다..

Analysis 2024.12.05

[데이터마이닝] worldcloud lab6

import numpy as npfrom PIL import Imagefrom wordcloud import WordCloud, STOPWORDSimport matplotlib.pyplot as pltimport requestsfrom bs4 import BeautifulSoupimport matplotlib.font_manager as fm# 한글 폰트 설정font_path = './NanumGothic.ttf' # 폰트 경로를 본인 환경에 맞게 수정하세요.# 이미지 마스크alice_mask= np.array(Image.open('./cloud.png'))# 웹 크롤링url ="https://news.naver.com/section/105"headers={'User-Agent':'Mozilla/5.0..

Analysis 2024.12.05

[데이터마이닝] Scikit-learn Winedata Lab4-sample

1번import numpy as npimport matplotlib.pyplot as pltfrom sklearn.datasets import load_winewineData = load_wine()# print(data.data.shape) # 178 x 13# print(data.data) # 데이터 전체# print(data.target) # target => 분류해야 하는 데이터(여기서는 178개)# print(data.target_names) # class임 => 얘네로 분류해야 하는 것# print(data.feature_names) # 열 이름들def makeScatter(): n_classes = 3 # 분류되는 class 개수 plot_colors = 'r..

Analysis 2024.12.05