수강한 강의
30강. Python 프로그래밍 - 09. 패키지와 import / 31강. numpy란? / 32강. import와 alias 설정 / 33강. ndarray생성, array에서의 데이터 타입 / 34강. Ch06.numpy - 04. index, slicing / 35강. Ch06.numpy - 05. fancy, indexing / 36강. Ch06.numpy - 06. boolean indexing
요번에는 오늘들은 내용과 전에 들었던 내용이 연결이 되기 때문에 전날 들은 내용도 같이 다루도록 하겠습니다.
30강. Python 프로그래밍 - 09. 패키지와 import
앞으로 사용하게 될 numpy, pandas 패키지 등을 사용하기 위해서는 import를 사용해야지 패키지를 활용할 수 있다.
패키지와 모듈 그리고 함수의 관계도
- 함수들이 뭉쳐진 하나의 .py 파일 안에 이루어진 것을 모듈이라고 한다.
- 여러 개의 모듈을 그룹화 하면 패키지가 된다.
- 패키지는 종종 라이브러리라고도 불리운다.
모듈 import 하기
- import는 다른 사람이 이미 만들어 놓은 좋은 모듈을 우리가 쉽게 가져가 쓸 수 있다.
- import 하는 방법은
import pandas
처럼 하게 되면 패키지를 불러와서 사용할 수 있다.
패키지에서 import 하기
[예시] 파일1, 파일2, 파일3을 하나의 '직박구리'라는 폴더 안에 넣어놨다고 가정해 보면
'직박구리' 폴더는 패키지
파일1, 파일2, 파일3는 각각의 모듈이 된다.
from pandas import DataFrame
from pandas import DataFrame DataFrame()
통째로 패키지나 모듈을 불러올 수 있다
import pandas pandas.DataFrame()
별칭(alias) 지어주기
별칭이란 약어를 말하는 것이다.
import pandas as pd pd.DataFrame()
위 코드에서
as pd
부분이 별칭에 해당되는 부분이다.
앞으로 자주 사용할 패키지, 모듈 미리보기
import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns
- numpy : 과학 계산을 위한 패키지
- Pandas : 데이터 분석을 할 때 가장 많이 쓰이는 패키지
- Matplotlib : 시각화를 위한 패키지
- seaborn : 시각화를 위한 패키지 (matplotlib을 더 쉽게 사용할 수 있도록 도와주는 패키지)
31강. numpy란?
numpy : 수학, 과학 계산용 패키지
import numpy as np
array(배열) : 여러 값들의 그룹 ex) 1차원 배열, 2차원 배열.....
1차원 배열
import numpy as np np.array([1,2,3,4])
2차원 배열
import numpy as np np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12], [13,14,15,16]])
ndarray : n dimension array, n차원 배열
1차원 행렬 (열, ) / 2차원 (행, 열) / 3차원 (행, 열, 축)
ndarray에서 shape과 axis 개념은 반드시 알고 넘어가야 된다.
shape는 차원의 수를 확인
ex)
(3, )=> 3의 배열, (4, 3) => 4(row) X 3(column)의 배열, (2,5,3) => 2 X 5 X 3의 배열axis는 기준이 되는 축
2차원 부터는 axis 0은 행, axis 1은 열
axis는 앞에서부터 0,1,2...
import와 alias 설정
import numpy numpy
<module 'numpy' from '/usr/local/lib/python3.7/dist-packages/numpy/__init__.py'>
32강. import와 alias 설정
import numpy as np np
<module 'numpy' from '/usr/local/lib/python3.7/dist-packages/numpy/__init__.py'>
- numpy의 별칭(alias)는 보통 np로 하여 사용한다.
33강. ndarray생성, array에서의 데이터 타입
arr = np.array([1,2,3,4], dtype = int) arr
array([1,2,3,4])
[1,2,3,4]
[1,2,3,4]
type(arr)
numpy.ndarray
위에 작성된 코드처럼 dtype을 선언하게 되면 해당 하는 타입으로 배열의 값이 정해져서 출력이 된다.
리스트와 array의 차이는 출력 되었을 때 나오는 값의 차이가 있다. 리스트의 경우에는
[]
이 상태로 출력이 되는데 array의 경우에는array([])
의 상태로 출력이 된다.배열 변수의 타입을 확인하는 방법은 파이썬 기본 문법인
type()
안에 배열 변수를 넣고 출력을 하게되면numpy.ndarray
의 타입값이 출력되게 된다.list로 부터 생성하기
- 위에 명시된 사진처럼 맨 처음 변수에 리스트 형식으로 작성한 다음에
np.array(리스트 변수명)
를 사용하여 새로운 변수명에 지정해주게 되면 리스트로 배열을 만들수가 있다. - 그리고 작성된 배열의 모양을 확인하기 위해서는
shape
을 사용하여 확인할 수가 있다.
- 위에 명시된 사진처럼 맨 처음 변수에 리스트 형식으로 작성한 다음에
배열에서의 데이터 타입
- 정수형과 실수형이 같이 작성되면 정수형이 실수형으로 변환된다.
- 정수형과 실수형이 혼재되어 있지만
dtype
이 정해져 있을 때는 dtype 값을 변환된다. - 정수형과 문자열이 혼재되어 있으면 정수형이 문자열로 변환된다.
- 정수형과 문자열이 혼재되어 있을 때 dtype을 int로 했을 때 리스트 안에 숫자형 문자 외에는 에러가 발생한다.
34강. Ch06.numpy - 04. index, slicing
슬라이싱
배열의 부분 선택 (과일을 슬라이스해서 부분만 먹듯..)
arr = np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]) arr.shape
(10, )
index 지정하여 색인
- 위에 명시된 사진처럼 1차원의 경우에는 리스트에서 indexing 하는 것처럼 배열도 인덱싱하면 원하는 위치의 값을 출력받는다
- 2차원의 경우에는 리스트에서의 indexing과 같은데 2차원은 (행, 열) 순으로 indexing을 하고 싶은 범위의 값을 작성하면 된다.
범위 색인
- 범위로 indexing 하는 방법은 index 지정하여 색인는 것과 동일하나 범위를 나타내기 위해서는
: 콜론
을 사용해서 하면 된다. - 1차원 뿐만 아니라 2차원에서도 범위를 사용하여 indexing을 할 수 있다.
- 범위로 indexing 하는 방법은 index 지정하여 색인는 것과 동일하나 범위를 나타내기 위해서는
35강. Ch06.numpy - 05. fancy, indexing
- Fancy 인덱싱
- fancy 인덱싱은 범위가 아닌 특정 index의 집합의 값을 선택하여 추출하고 싶을 떄 활용할 수 있다.
- 사용 방법은 반드시 [추출하고 싶은 인덱스], 예시는 아래 사진과 같다
- Fancy 인덱싱
36강. Ch06.numpy - 06. boolean indexing
- boolean indexing
- 조건 필터링을 위해서는 참, 거짓이라는 값이 존재해야 된다.
arr2d[조건필터]
- boolean indexing을 하기 위해서는 배열에 속해 있는 배열의 갯수와 동일하게 boolean 값이 존재해야지 boolean 값으로 인덱싱을 할 수가 있다.
- 그리고 마지막으로 조건을 활용하여 인덱싱을 하는 방법은 배열 변수명 작성 후 조건을 작성하면 된다.
- 아래 사진과 동일하게 작성을 하게되면 된다.
- boolean indexing
이렇게 요번에 공부를 한 패키지 불러오는 import와 numpy에서 데이터 타입과 index, slicing, fancy, boolean indexing에 관한 내용을 작성해보았습니다. 부족한 부분이 있겠지만 부족한 부분은 이해해주셨으면 합니다. 이상으로 공부를 마치겠습니다.
데이터 분석
홈페이지에서 강의 찾는 방법
패스트 캠퍼스 -> 온라인 -> 올인원 패키지 -> [데이터 분석 강의 보러 가기] -> 직장인을 위한 파이썬 데이터 분석 올인원 패키지 Online.
패스트 캠퍼스 - [데이터 사이언스] 직장인을 위한 파이썬 데이터 분석
'데이터 분석' 카테고리의 다른 글
[패스트 캠퍼스 수강 후기] 직장인을 위한 파이썬 데이터 분석 올인원 패키지 Online 6일차 (0) | 2021.03.01 |
---|---|
[패스트 캠퍼스 수강 후기] 직장인을 위한 파이썬 데이터 분석 올인원 패키지 Online 5일차 (0) | 2021.02.27 |
[패스트 캠퍼스 수강 후기] 직장인을 위한 파이썬 데이터 분석 올인원 패키지 Online 3회차 (0) | 2021.02.25 |
[패스트 캠퍼스 수강 후기] 직장인을 위한 파이썬 데이터 분석 올인원 패키지 Online 2회차 (0) | 2021.02.16 |
[패스트 캠퍼스 수강 후기] 직장인을 위한 파이썬 데이터 분석 올인원 패키지 Online 1회차 (0) | 2021.02.15 |
댓글