본문 바로가기
데이터 분석

[패스트 캠퍼스 수강 후기] 직장인을 위한 파이썬 데이터 분석 올인원 패키지 Online 4회차

by HIMMEL95 2021. 2. 26.

수강한 강의
30강. Python 프로그래밍 - 09. 패키지와 import / 31강. numpy란? / 32강. import와 alias 설정 / 33강. ndarray생성, array에서의 데이터 타입 / 34강. Ch06.numpy - 04. index, slicing / 35강. Ch06.numpy - 05. fancy, indexing / 36강. Ch06.numpy - 06. boolean indexing

요번에는 오늘들은 내용과 전에 들었던 내용이 연결이 되기 때문에 전날 들은 내용도 같이 다루도록 하겠습니다.

  1. 30강. Python 프로그래밍 - 09. 패키지와 import

    • 앞으로 사용하게 될 numpy, pandas 패키지 등을 사용하기 위해서는 import를 사용해야지 패키지를 활용할 수 있다.

    • 패키지와 모듈 그리고 함수의 관계도

      • 함수들이 뭉쳐진 하나의 .py 파일 안에 이루어진 것을 모듈이라고 한다.
      • 여러 개의 모듈을 그룹화 하면 패키지가 된다.
      • 패키지는 종종 라이브러리라고도 불리운다.
    • 모듈 import 하기

      • import는 다른 사람이 이미 만들어 놓은 좋은 모듈을 우리가 쉽게 가져가 쓸 수 있다.
      • import 하는 방법은
        import pandas
        처럼 하게 되면 패키지를 불러와서 사용할 수 있다.
    • 패키지에서 import 하기

      • [예시] 파일1, 파일2, 파일3을 하나의 '직박구리'라는 폴더 안에 넣어놨다고 가정해 보면

        • '직박구리' 폴더는 패키지

        • 파일1, 파일2, 파일3는 각각의 모듈이 된다.
          from pandas import DataFrame

            from pandas import DataFrame
          DataFrame()
        • 통째로 패키지나 모듈을 불러올 수 있다

            import pandas
          pandas.DataFrame()
    • 별칭(alias) 지어주기

      • 별칭이란 약어를 말하는 것이다.

          import pandas as pd
        pd.DataFrame()
      • 위 코드에서 as pd 부분이 별칭에 해당되는 부분이다.

    • 앞으로 자주 사용할 패키지, 모듈 미리보기

            import numpy as np
        import pandas as pd
        import matplotlib.pyplot as plt
        import seaborn as sns
      • numpy : 과학 계산을 위한 패키지
      • Pandas : 데이터 분석을 할 때 가장 많이 쓰이는 패키지
      • Matplotlib : 시각화를 위한 패키지
      • seaborn : 시각화를 위한 패키지 (matplotlib을 더 쉽게 사용할 수 있도록 도와주는 패키지)
  2. 31강. numpy란?

    • numpy : 수학, 과학 계산용 패키지

    • import numpy as np

    • array(배열) : 여러 값들의 그룹 ex) 1차원 배열, 2차원 배열.....

    • 1차원 배열

        import numpy as np
      np.array([1,2,3,4])
    • 2차원 배열

        import numpy as np
      np.array([[1,2,3,4],
             [5,6,7,8],
             [9,10,11,12],
             [13,14,15,16]])

      • ndarray : n dimension array, n차원 배열

      • 1차원 행렬 (열, ) / 2차원 (행, 열) / 3차원 (행, 열, 축)

      • ndarray에서 shapeaxis 개념은 반드시 알고 넘어가야 된다.

      • shape는 차원의 수를 확인
        ex)
        (3, )=> 3의 배열, (4, 3) => 4(row) X 3(column)의 배열, (2,5,3) => 2 X 5 X 3의 배열

      • axis는 기준이 되는 축

      • 2차원 부터는 axis 0은 행, axis 1은 열

      • axis는 앞에서부터 0,1,2...

      • import와 alias 설정

          import numpy
        numpy

        <module 'numpy' from '/usr/local/lib/python3.7/dist-packages/numpy/__init__.py'>

  3. 32강. import와 alias 설정

      import numpy as np  
    np

    <module 'numpy' from '/usr/local/lib/python3.7/dist-packages/numpy/__init__.py'>

    • numpy의 별칭(alias)는 보통 np로 하여 사용한다.
  1. 33강. ndarray생성, array에서의 데이터 타입

       arr = np.array([1,2,3,4], dtype = int)
     arr

    array([1,2,3,4])

         [1,2,3,4]

    [1,2,3,4]

         type(arr)

    numpy.ndarray

    • 위에 작성된 코드처럼 dtype을 선언하게 되면 해당 하는 타입으로 배열의 값이 정해져서 출력이 된다.

    • 리스트와 array의 차이는 출력 되었을 때 나오는 값의 차이가 있다. 리스트의 경우에는 [] 이 상태로 출력이 되는데 array의 경우에는 array([])의 상태로 출력이 된다.

    • 배열 변수의 타입을 확인하는 방법은 파이썬 기본 문법인 type()안에 배열 변수를 넣고 출력을 하게되면 numpy.ndarray의 타입값이 출력되게 된다.

    • list로 부터 생성하기

      • 위에 명시된 사진처럼 맨 처음 변수에 리스트 형식으로 작성한 다음에 np.array(리스트 변수명) 를 사용하여 새로운 변수명에 지정해주게 되면 리스트로 배열을 만들수가 있다.
      • 그리고 작성된 배열의 모양을 확인하기 위해서는 shape을 사용하여 확인할 수가 있다.
    • 배열에서의 데이터 타입

      • 정수형과 실수형이 같이 작성되면 정수형이 실수형으로 변환된다.
      • 정수형과 실수형이 혼재되어 있지만 dtype이 정해져 있을 때는 dtype 값을 변환된다.
      • 정수형과 문자열이 혼재되어 있으면 정수형이 문자열로 변환된다.
      • 정수형과 문자열이 혼재되어 있을 때 dtype을 int로 했을 때 리스트 안에 숫자형 문자 외에는 에러가 발생한다.
  2. 34강. Ch06.numpy - 04. index, slicing

    • 슬라이싱

      • 배열의 부분 선택 (과일을 슬라이스해서 부분만 먹듯..)

          arr = np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
        arr.shape

        (10, )

      • index 지정하여 색인

        • 위에 명시된 사진처럼 1차원의 경우에는 리스트에서 indexing 하는 것처럼 배열도 인덱싱하면 원하는 위치의 값을 출력받는다
        • 2차원의 경우에는 리스트에서의 indexing과 같은데 2차원은 (행, 열) 순으로 indexing을 하고 싶은 범위의 값을 작성하면 된다.
      • 범위 색인

        • 범위로 indexing 하는 방법은 index 지정하여 색인는 것과 동일하나 범위를 나타내기 위해서는 : 콜론을 사용해서 하면 된다.
        • 1차원 뿐만 아니라 2차원에서도 범위를 사용하여 indexing을 할 수 있다.
  3. 35강. Ch06.numpy - 05. fancy, indexing

    • Fancy 인덱싱
      • fancy 인덱싱은 범위가 아닌 특정 index의 집합의 값을 선택하여 추출하고 싶을 떄 활용할 수 있다.
      • 사용 방법은 반드시 [추출하고 싶은 인덱스], 예시는 아래 사진과 같다
  4. 36강. Ch06.numpy - 06. boolean indexing

    • boolean indexing
      • 조건 필터링을 위해서는 참, 거짓이라는 값이 존재해야 된다.
      • arr2d[조건필터]
      • boolean indexing을 하기 위해서는 배열에 속해 있는 배열의 갯수와 동일하게 boolean 값이 존재해야지 boolean 값으로 인덱싱을 할 수가 있다.
      • 그리고 마지막으로 조건을 활용하여 인덱싱을 하는 방법은 배열 변수명 작성 후 조건을 작성하면 된다.
      • 아래 사진과 동일하게 작성을 하게되면 된다.
  • 이렇게 요번에 공부를 한 패키지 불러오는 import와 numpy에서 데이터 타입과 index, slicing, fancy, boolean indexing에 관한 내용을 작성해보았습니다. 부족한 부분이 있겠지만 부족한 부분은 이해해주셨으면 합니다. 이상으로 공부를 마치겠습니다.

  • 데이터 분석

  • 홈페이지에서 강의 찾는 방법

  • 패스트 캠퍼스 -> 온라인 -> 올인원 패키지 -> [데이터 분석 강의 보러 가기] -> 직장인을 위한 파이썬 데이터 분석 올인원 패키지 Online.

  • 패스트 캠퍼스 - [데이터 사이언스] 직장인을 위한 파이썬 데이터 분석

https://bit.ly/2MJqrMs

댓글