3일차에서는 데이터 분석 환경 세팅과 함께 파이썬의 핵심 문법을 바탕으로 실제 데이터를 다루는 방법을 학습했다. 특히 pandas를 중심으로 데이터프레임과 시리즈 개념을 이해하고, CSV 파일을 불러와 데이터를 확인하는 과정을 실습했다. pd.read_csv()를 활용해 외부 데이터를 불러오고, 표 형태의 데이터를 구조적으로 관리할 수 있다는 점이 인상적이었다.
또한 파이썬의 기본 데이터 타입인 정수(int), 실수(float), 문자열(str)에 대해 학습하며 변수 선언과 데이터 표현 방식을 정리했다. 문자열 슬라이싱, 대소문자 변환(upper/lower), split과 같은 메서드를 활용해 데이터를 가공하는 과정은 향후 데이터 전처리 단계에서 매우 중요하다고 느꼈다. 더불어 리스트와 딕셔너리를 활용해 데이터를 구조화하고 필요한 값을 추출하는 방식도 다시 한번 정리할 수 있었다.
이번 학습을 통해 데이터 분석은 단순히 데이터를 보는 것이 아니라, 데이터를 구조화하고 가공하는 과정이 핵심이라는 것을 이해하게 되었다. 특히 반도체 공정 데이터와 같이 대량의 데이터를 다루는 환경에서는 pandas 기반의 데이터 처리 역량이 필수적이라 생각하며, 이를 바탕으로 공정 이상 탐지 및 최적화에 기여할 수 있는 엔지니어로 성장하고자 한다.
반도체 #AI #파이썬 #데이터분석 #윈스펙 #이공계
0
0
댓글 0
