본문 바로가기
함수 설명/기본 및 범용

[NumPy] 텍스트 파일 데이터를 배열로 로드하기: np.genfromtxt() 사용 및 설명

by First Adventure 2024. 10. 4.
반응형

소개

  np.genfromtxt(fname, dtype=<class 'float'>, delimiter=None, skip_header=0, skip_footer=0, converters=None, missing_values=None, filling_values=None, usecols=None, names=None, excludelist=None, deletechars=None, replace_space='_', autostrip=False, case_sensitive=True, defaultfmt='f%i', unpack=None, usemask=False, loose=True, invalid_raise=True, max_rows=None, encoding='bytes', *, like=None) 함수는 텍스트 파일에서 데이터를 읽어와 배열로 변환하는 함수입니다. 텍스트 파일은 CSV 파일, 공백으로 구분된 파일 등 다양한 형식을 가질 수 있으며, 이 함수는 결측값 처리와 데이터 변환 기능을 지원합니다. **np.genfromtxt()**는 데이터 분석 및 전처리 작업에서 파일로부터 데이터를 로드할 때 자주 사용됩니다.

 

기본 사용법

import numpy as np

# 'data.csv' 파일에서 데이터를 불러와 배열로 변환
data = np.genfromtxt('data.csv', delimiter=',', skip_header=1)

print("불러온 데이터 배열:\n", data)

상세 설명

  • fname: 데이터를 읽어올 파일 경로입니다. CSV, TSV 등 다양한 텍스트 형식의 파일을 지원합니다.
    • 예시: np.genfromtxt('data.csv', delimiter=',')는 CSV 파일의 데이터를 불러옵니다.
  • dtype (선택사항): 배열의 데이터 타입을 지정합니다. 기본값은 float입니다.
    • 예시: np.genfromtxt('data.csv', dtype=int)는 데이터를 정수형 배열로 변환합니다.
  • delimiter (선택사항): 파일에서 열을 구분하는 구분자를 지정합니다. 기본값은 공백입니다.
    • 예시: np.genfromtxt('data.csv', delimiter=',')는 콤마로 구분된 데이터를 불러옵니다.
  • skip_header (선택사항): 파일의 상단에서 건너뛸 줄 수를 지정합니다. 주로 헤더 행을 생략할 때 사용합니다.
    • 예시: np.genfromtxt('data.csv', skip_header=1)은 첫 번째 줄을 건너뜁니다.
  • missing_values (선택사항): 결측값으로 처리할 값을 지정할 수 있습니다. 결측값이 포함된 데이터를 불러올 때 유용합니다.
  • filling_values (선택사항): 결측값을 대체할 값을 지정합니다.
  • usecols (선택사항): 불러올 열을 지정할 수 있습니다. 특정 열만 불러오고 싶을 때 사용됩니다.
    • 예시: np.genfromtxt('data.csv', delimiter=',', usecols=(0, 2))는 첫 번째와 세 번째 열만 불러옵니다.
  • 활용
    • 데이터 전처리 및 분석: CSV, 텍스트 파일에서 데이터를 불러와 분석하거나 전처리할 때 유용합니다. 결측값 처리와 특정 열 선택 기능이 있어 유연하게 사용할 수 있습니다.
    • 과학적 연구 및 시뮬레이션: 실험 데이터, 시뮬레이션 결과를 텍스트 파일로 저장한 후 다시 불러와 분석할 수 있습니다.

 

라이센스

  NumPy는 BSD-3-Clause 라이센스를 따릅니다. 자유롭게 사용, 수정, 배포할 수 있으며 상업적 목적으로도 사용할 수 있습니다. 라이센스와 저작권 정보는 NumPy의 공식 GitHub 리포지토리에서 확인할 수 있습니다.

 

관련 내용

  [NumPy] 함수 벡터화하여 배열 처리하기: np.vectorize() 사용 및 설명

  [NumPy] 텍스트 파일 데이터를 배열로 로드하기: np.genfromtxt() 사용 및 설명

  [NumPy] 저장된 배열 불러오기: np.load() 사용 및 설명

  [NumPy] 배열을 파일로 저장하기: np.save() 사용 및 설명

반응형