'분류 전체보기' 카테고리의 글 목록 (3 Page)

[데이터마이닝] Lab8-Plotly

import seaborn as snsimport pandas as pdimport plotly.express as pxdf = sns.load_dataset('titanic')class_order = ['Third', 'First', 'Second']df['class'] = pd.Categorical(df['class'], categories=class_order, ordered=True)grouped = df.groupby(['alive', 'class']).size().reset_index(name='count')fig = px.bar(grouped, x='alive', y='count', color='class', ..

Analysis 2024.12.05

[데이터마이닝] Lab8-지도그리기

import pandas as pdimport folium# 데이터 불러오기bike_data = pd.read_csv('./bike202406.csv')# 서울 중심 좌표로 지도 생성seoul_map = folium.Map(location=[37.5665, 126.9780], zoom_start=12)# 따릉이 대여소 위치를 지도에 점으로 표시for idx, row in bike_data.iterrows(): folium.CircleMarker( location=[row['위도'], row['경도']], # 위도, 경도 컬럼명 확인 필요 popup=row['보관소(대여소)명'], radius=2 # 대여소 이름이 있는 컬럼명 ).add_to(seoul_..

Analysis 2024.12.05

[데이터마이닝] Lab7-aggregation group by

import pandas as pdimport seaborn as snsimport matplotlib.pyplot as pltplanets = sns.load_dataset("planets")planets 행성의 발견 방법에 따른 갯수를 그래프로 그리고 분석# 1번문제planets_grouped1 = planets.groupby("method")["number"].sum().reset_index()plt.figure(figsize=(25, 20))sns.barplot(data=planets_grouped1, x="method", y="number")## 1번문제 분석- 행성발견 방법들 중 Radial Velocity 방법과 Transit 방법이 행성을 찾는데에 있어 주요적으로 많이 사용된 모습을 보인다..

Analysis 2024.12.05

[데이터마이닝] worldcloud lab6

import numpy as npfrom PIL import Imagefrom wordcloud import WordCloud, STOPWORDSimport matplotlib.pyplot as pltimport requestsfrom bs4 import BeautifulSoupimport matplotlib.font_manager as fm# 한글 폰트 설정font_path = './NanumGothic.ttf' # 폰트 경로를 본인 환경에 맞게 수정하세요.# 이미지 마스크alice_mask= np.array(Image.open('./cloud.png'))# 웹 크롤링url ="https://news.naver.com/section/105"headers={'User-Agent':'Mozilla/5.0..

Analysis 2024.12.05

[데이터마이닝] pandas-taxis 5lab

import seaborn as snsimport matplotlib.pyplot as pltdf=sns.load_dataset('taxis')def payment(): sns.scatterplot(data=df, x='fare', y='tip', hue='payment')payment() def pickup_dropoff(): with sns.axes_style('white'): g = sns.catplot(x="pickup_borough", data=df, aspect=2, kind="count", color='steelblue') k = sns.catplot(x="dropoff_borough", data=df, a..

Analysis 2024.12.05

[데이터마이닝] Scikit-learn Winedata Lab4-sample

1번import numpy as npimport matplotlib.pyplot as pltfrom sklearn.datasets import load_winewineData = load_wine()# print(data.data.shape) # 178 x 13# print(data.data) # 데이터 전체# print(data.target) # target => 분류해야 하는 데이터(여기서는 178개)# print(data.target_names) # class임 => 얘네로 분류해야 하는 것# print(data.feature_names) # 열 이름들def makeScatter(): n_classes = 3 # 분류되는 class 개수 plot_colors = 'r..

Analysis 2024.12.05

[데이터마이닝] matplotlib - random 3 lap 과제

한글 폰트깨질 경우import matplotlib # windows의 경우 matplotlib.rcParams['font.family'] = 'Malgun Gothic' import numpy as npimport matplotlib.pyplot as pltScore = np.random.randint(100, size=(10, 4))korea_point=Score[:,0]english_point=Score[:,1]math_point=Score[:,2]science_point=Score[:,3]average_score = (korea_point + english_point + math_point + science_point)/4average_score"""array([28.75, 49.75, 53.2..

Analysis 2024.12.05

[데이터마이닝] Numpy-학생 SAMPLE upload- Lab2 과제

import numpy as npdef Math_score(score_array): ##문제1 math_score_array = score_array[:, 2] #모든 행(학생)의 세 번째 열(수학 점수) 추출 for i, score in enumerate(math_score_array): print(f"학생{i+1}: {score}") def Total_score(score_array): ##문제2 total_score_array = np.sum(score_array, axis=1) #각 행(학생)별로 모든 열의 값(과목 점수) 더하기 for i, score in enumerate(total_score_array): print(f"학생{..

Analysis 2024.12.05

[데이터마이닝] Numpy 배열

import 해주기import numpy as np Numpy 배열과 파이썬의 리스트의 성능 차이 비교import numpy as npmy_arr = np.arange(1000000)my_list = list(range(1000000))%time for _ in range(10): my_arr2 = my_arr * 2%time for _ in range(10): my_list2 = [x * 2 for x in my_list]CPU times: total: 15.6 ms Wall time: 10.1 ms CPU times: total: 484 ms Wall time: 532 ms Numpy를 사용한 코드 순수한 파이썬으로 작성한 코드보다 속도 열배~백배빠르며 메모리 적게 사용 The Numpy ndarr..

Analysis 2024.12.05

[데이터마이닝] 파이썬 기초(2주차)

import random# 문제 1번def test1(): Lst= [random.randint(1,100) for i in range(20)] Lst2=[random.randint(1,100) for i in range(20)] result=Lst+Lst2 #1.1 print(result) result=list(set(result)) #1.2 print(result)# 문제 2번 def test2(): student=[[chr(random.randint(65, 69)) for _ in range(10)] for _ in range(8)] print(student) answer=[chr(random.randint(65,69)) for _ in ran..

Analysis 2024.12.05

ialleejy 님의 블로그

분류 전체보기 45

티스토리툴바