[NumPy] 상관 계수 구하기: np.corrcoef() 사용 및 설명
소개 np.corrcoef(x, y=None, rowvar=True, bias=, ddof=, dtype=None) 함수는 주어진 데이터 x와 선택적으로 y의 상관 계수 행렬을 계산하는 함수입니다. 상관 계수는 두 변수 간의 선형 관계를 측정하며, -1에서 1 사이의 값을 가집니다. 1에 가까울수록 양의 상관, -1에 가까울수록 음의 상관, 0에 가까울수록 무상관을 나타냅니다. 이 함수는 데이터 분석과 통계학에서 변수 간의 관계를 파악할 때 자주 사용됩니다. 기본 사용법import numpy as np# 두 변수 간의 상관 계수 행렬 계산x = np.array([1, 2, 3, 4, 5])y = np.array([10, 9, 6, 3, 1])corr_matrix = np.corrcoef(x, y)pri..
2024. 10. 3.
[NumPy] 공분산 구하기: np.cov() 사용 및 설명
소개 np.cov(m, y=None, rowvar=True, bias=False, ddof=None, fweights=None, aweights=None) 함수는 주어진 데이터 m의 공분산 행렬을 계산하는 함수입니다. 공분산은 두 변수 간의 선형 관계를 나타내며, 이 함수는 변수 간의 상관성을 분석할 때 유용합니다. np.cov()는 데이터 분석, 통계학, 금융 분석 등에서 자주 사용됩니다. 기본 사용법import numpy as np# 두 변수 간의 공분산 계산x = np.array([1, 2, 3, 4, 5])y = np.array([5, 4, 6, 8, 10])cov_matrix = np.cov(x, y)print("공분산 행렬:\n", cov_matrix)상세 설명m: 공분산을 계산할 데이터 배..
2024. 10. 3.
[NumPy] 배열의 백분위수 구하기: np.percentile() 사용 및 설명
소개 np.percentile(a, q, axis=None, out=None, overwrite_input=False, interpolation='linear', keepdims=False)는 배열 a에서 q 백분위수를 계산하는 함수입니다. 백분위수는 데이터 분포에서 주어진 비율에 해당하는 값을 나타냅니다. 예를 들어, q=50은 중앙값(50번째 백분위수), q=25는 1사분위수(25번째 백분위수) 등을 의미합니다. 이 함수는 데이터 분석, 통계 처리, 그리고 머신러닝에서 자주 사용됩니다. 기본 사용법import numpy as np# 1차원 배열에서 25%, 50%, 75% 백분위수 계산array = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])percentiles = n..
2024. 10. 3.
[NumPy] 배열의 중앙값 구하기: np.median() 사용 및 설명
소개 np.median(a, axis=None, out=None, overwrite_input=False, keepdims=False)는 주어진 배열 a의 중앙값(중위수)을 계산하는 함수입니다. 중앙값은 데이터셋을 오름차순으로 정렬했을 때, 가운데 위치한 값을 의미하며, 데이터 분포의 중심을 측정하는 데 자주 사용됩니다. 배열의 전체 중앙값을 구하거나, 특정 축(axis)에 따라 중앙값을 계산할 수 있습니다. 기본 사용법import numpy as np# 1차원 배열의 중앙값 계산array = np.array([1, 2, 3, 4, 5])median_value = np.median(array)# 2차원 배열에서 축(axis)별 중앙값 계산array2d = np.array([[1, 2, 3], [4, 5..
2024. 10. 3.
[NumPy] 배열 정렬 인덱스 구하기: np.argsort() 사용 및 설명
소개 np.argsort(a, axis=-1, kind=None, order=None)는 배열 a의 요소들을 지정한 축(axis)을 따라 정렬한 후, 그 정렬된 순서에 해당하는 인덱스를 반환하는 함수입니다. 정렬된 배열을 생성하는 것이 아니라, 배열을 정렬하는 데 필요한 인덱스를 반환하므로, 이 인덱스를 통해 원본 배열을 정렬된 상태로 재구성할 수 있습니다. 기본 사용법import numpy as np# 1차원 배열의 정렬된 순서의 인덱스 반환array = np.array([3, 1, 2, 5, 4])sorted_indices = np.argsort(array)# 정렬된 순서대로 배열 재구성sorted_array = array[sorted_indices]print("정렬된 순서의 인덱스:", sorte..
2024. 10. 3.
[NumPy] 배열 정렬하기: np.sort() 사용 및 설명
소개 np.sort(a, axis=-1, kind=None, order=None)는 주어진 배열 a의 요소들을 지정한 축(axis)을 따라 정렬하는 함수입니다. 배열 전체 또는 특정 축에 따라 오름차순으로 정렬할 수 있으며, 다양한 정렬 알고리즘과 구조화된 배열의 필드를 선택적으로 사용할 수 있습니다. 이 함수는 데이터 처리, 정렬, 분석 작업에서 자주 사용됩니다. 기본 사용법import numpy as np# 1차원 배열의 정렬array1 = np.array([3, 1, 2, 5, 4])sorted_array1 = np.sort(array1)# 2차원 배열에서 축(axis)별 정렬array2d = np.array([[3, 1, 2], [6, 5, 4]])sorted_axis0 = np.sort(arr..
2024. 10. 3.
[NumPy] 배열의 중복 제거 및 고유 값 찾기: np.unique() 사용 및 설명
소개 np.unique(ar, return_index=False, return_inverse=False, return_counts=False, axis=None)는 배열 ar의 중복된 요소를 제거하고 고유한 값들을 반환하는 함수입니다. 필요에 따라 고유 값의 인덱스, 역 인덱스, 각 값의 빈도 수도 반환할 수 있어 데이터 분석 및 중복 제거 작업에 매우 유용합니다. 기본 사용법import numpy as np# 1차원 배열에서 고유 값 찾기array = np.array([1, 2, 2, 3, 3, 3])unique_values = np.unique(array)print("배열의 고유 값:", unique_values)상세 설명ar: 고유 값을 추출할 배열로, 다차원 배열도 가능합니다. 배열에서 중복된 ..
2024. 10. 3.
[NumPy] 조건에 따른 배열 선택: np.where() 사용 및 설명
소개 np.where(condition, [x, y])는 주어진 condition이 참인 경우 x를 반환하고, 거짓인 경우 y를 반환하는 함수입니다. 조건에 따라 배열의 값을 선택하거나, 조건을 만족하는 요소의 인덱스를 반환할 수 있습니다. 이 함수는 데이터 분석, 조건부 연산, 마스킹 처리 등에서 자주 사용됩니다. 기본 사용법import numpy as np# 조건이 참이면 1, 거짓이면 0을 반환array = np.array([1, 2, 3, 4, 5])result = np.where(array > 3, 1, 0)print("조건에 따른 배열 선택 결과:", result)# 조건을 만족하는 인덱스 반환index_result = np.where(array > 3)print("조건을 만족하는 요소의 인..
2024. 10. 3.