[머신러닝]/[Numpy, Pandas]
[Pandas] CSV파일에 데이터 쓰기
판다스를 이용한 csv 파일에 데이터 저장 딕셔너리를 이용한 저장방법import pandas as pddf = pd.DataFrame({'rank': ['1위', '2위'], 'keyword': ['심재철', '서미경']})# 인덱스는 없이 컬럼만 가진 csv표 생성df.to_csv('daum_real_time_keyword.csv', index=False, encoding='cp949') .to_csv() 함수를 이용해서 csv파일을 생성해 줍니다.주피터 노트북을 이용해 코드를 실행했다면 주피터 노트북이 실행된 폴더에 csv파일이 저장되어 있습니다.
[Pandas] 판다스 기초1
먼저 아래의 코드를 import해줍니다.from matplotlib import pyplot as pltimport pandas as pdimport numpy as np 목차1. 데이터 오브젝트 생성하기2. 데이터 확인하기 (viewing data)3. 데이터 선택하기 (selection)4. 결측치 (missing data)5. 연산 (operations)6. 합치기 (merging)7. 묶기 (grouping)8. 변형하기 (reshaping)9. 시계열 데이터 다루기 (time series)10. 범주형 데이터 다루기 (categoricals)11. 그래프로 표현하기 (plotting)12. 데이터 입/출력 (getting data in/out) 1. 데이터 오브젝트 생성하기 데이터 오브젝트..
[Numpy] numpy.meshgrid함수
넘파이(Numpy)에서 meshgrid 함수는 격자 포인트의 좌표를 생성하는 데 사용되는 함수입니다. 이 함수는 두 개 이상의 1차원 배열을 받아서 각 배열의 요소들로 구성된 모든 가능한 좌표 쌍을 반환합니다. 반환된 좌표 쌍은 다차원 격자 형태로 구성됩니다. P = (xi, yi)는 그림과 같이 하나의 좌표로써 표현할 수 있는데 그림과 같이 직사각형 그리드 안에서 될 수 있도록 배치를 하는게 meshgrid의 역할입니다. 매개변수의 종류 meshgrid()의 파라미터는 다음과 같은 형태를 가지고 있습니다. np.meshgrid(xi, copy=True, sparse=False, indexing='xy') x1, x2, ..... 배열, 그리드의 좌표를 나타내는 1차원 배열 indexing {xy, ij..
[Numpy] linspace함수 (구간 내에 숫자 채우기)
파이썬을 이용하여 y = sinx 같은 그래프를 그리고 싶을 때 x를 어떻게 지정하는지 궁금한 경우가 있습니다. 구간 내에 숫자를 꼼꼼하게 채울 수 있는 np.linspace 함수를 사용할 수 있습니다. 사용법 # 기본형태 numpy.linspace('구간 시작점', '구간 끝점', '구간 내 숫자 개수') 1. 기본적인 사용법 import numpy as np print(np.linspace(1, 2, 100)) # 1~2까지 숫자 100개(끝점 포함) >>> [1. 1.01010101 1.02020202 1.03030303 1.04040404 1.05050505 1.06060606 1.07070707 1.08080808 1.09090909 1.1010101 1.11111111 1.12121212 1...
[Numpy] np.arange 사용법과 range와의 차이
파이썬에서 for문을 이용하여 특정 수열을 만들려고 할때 사용합니다. np.arange('시작점'(생략시 0으로 시작), '도착점'(포함X), step size(생략시 1)) 예시1) import numpy as np print(np.arange(10)) >>> [0 1 2 3 4 5 6 7 8 9] print(np.arange(1, 15, 2)) >>> [ 1 3 5 7 9 11 13] print(np.arange(9, -2, -1.5)) >>> [ 9. 7.5 6. 4.5 3. 1.5 0. -1.5] np.arange와 range의 차이 1. np.arange는 실수도 표현하지만 range는 정수 값만 표현할 수 있습니다. 2. range는 range iterator 자료형을 반환하고 np.arang..
[Pandas] 판다스 설치
1. pandas란? 리스트(series 클래스) 뿐만 아니라 테이블(DataFrame 클래스) 데이터의 통계(엑셀, R) 기능을 제공.두 데이터의 엑셀 파일 읽고 쓰기 기능도 지원 2. 설치 cmd 열고 명령어 입력 pip install pandas