본문 바로가기

Etc/Data Science5

파이썬을 통한 데이터 사이언스_05 facebook Innovation Lab Class파이썬을 통한 데이터 사이언스 입문 과정 6일차 ● 데이터 시각화 (data visualization) - 데이터 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하고 전달되는 과정- 데이터 시각화의 목적은 도표(graph)라는 수단을 통해 정보를 명확하고 효과적으로 전달하는 것 ● 파이썬 그래프 라이브러리 갤러리 - matplotlib- Seaborn- Bokeh- Plot.ly- Python Graph Gallery 2018. 8. 29.
파이썬을 통한 데이터사이언스_04 facebook Innovation Lab Class파이썬을 통한 데이터 사이언스 입문 과정 4일차 ● 배열 만들기 - numpy 배열- 배열을 생성할 때는 효율성을 높이려고 배열을 데이터에 연결 import numpy as npnumbers = np.array(range(1, 11), copy=True)numbers>>>array([1,2,3,4,5,6,7,8,9,10]) - 배열 차원의 개수, 모양과 데이터 타입을 ndim, shape, dtype 속성에 저장- reshape(d0, d1, ...) 함수 ● 인덱싱과 자르기 - numpy 배열은 인덱싱[i]과 슬라이싱[i:j]과 불 인덱싱이 가능함 ● 브로드 캐스팅 - 배열에서의 벡터 여산 noise - np.eye(4) + 0.01 * np.ones.. 2018. 8. 22.
파이썬을 통한 데이터 사이언스_03 facebook Innovation Lab Class파이썬을 통한 데이터 사이언스 입문 과정 3일차 ● 올바른 자료 구조 선택하기 튜플리스트셋 - 리스트 데이터를 셋으로 변환 시 성능 차이 확인 -> %time 매직 명령어로 시간 측정! (Set이 훨씬 빠름) 딕셔너리 - 리스트에서 딕셔너리 만들기 seq = ["alpha", "bravo", "charlie", "delta"]dict(enumerate(seq)) - 클래스 생성자를 이용하여 만들기 zip : 파이썬에서 두 개의 시퀀스를 결합해주는 함수 ● 리스트 컴프리헨션(comprehension)으로 리스트 이해하기 - 리스트 내포 (컴프리헨션) - 컬렉션을 리스트로 변환하는 형식 - 예) myList - range(10) [x for x in myL.. 2018. 8. 20.
파이썬을 통한 데이터 사이언스_02 facebook Innovation Lab Class파이썬을 통한 데이터 사이언스 입문 과정 2일차 ● 데이터 과학에 사용되는 파이썬 핵심 라이브러리 - NumPy : 숫자로 이뤄진 배열을 제공하는 범용 라이브러리 - SciPy : 과학 및 공학 관련 계산 함수 라이브러리 - Pandas : 데이터 프레임 및 시리즈 자료구조 제공, 테이블 및 시계열 데이터를 다루는 통합 라이브러리 - matplotlib : 플롯, 그래프 지원 라이브러리 - scikit-learn : 파이썬 머신러닝 라이브러리 ● 데이터 과학에 사용되는 파이썬 환경 - Ipython : 대화형 쉘 기능 제공, 대화식 데이터 시각화도 지원- Jupyter notebook : 시각화 및 라이브 코드로 문서를 작성하며 공유하는 웹 기반 대화형.. 2018. 8. 17.
파이썬을 통한 데이터 사이언스_01 facebook Innovation Lab Class파이썬을 통한 데이터 사이언스 입문 과정 1일차 ● 과정 소개 ● 데이터 사이언스란? - 데이터에서 지식을 추출하는 학문- 다양한 형태의 데이터에서 지식과 인사이트를 추출하기 위해 과학적 방법, 절차, 알고리즘과 시스템을 활용하는 학제 간 분야- 데이터 과학은 '데이터로 실제 현상을 이해하고 분석'하기 위해 통계, 데이터 분석, 기계 학습 및 관련 방법을 통합하는 개념.- 수학, 통계학, 정보 과학 및 컴퓨터 과학 맥락 안의 많은 분야에서 이끌어낸 기술과 이론을 사용함 ● 데이터과학 - 업계와 학계의 많은 응용 영역에서 점점 더 중요해지고 있는 여러 학문 분야의 기술을 통칭하기에 가장 적합한 용어 ● 데이터 과학 벤 다이어그램 - 드류 콘웨이의 데이터 .. 2018. 8. 13.