3일차 학습에서는 파이썬 기본 문법부터 데이터 분석을 위한 핵심 도구인 Pandas까지, 실제 데이터를 다루기 위한 기초를 단계적으로 익혔다. 단순 개념 이해를 넘어 데이터를 어떻게 구조화하고 활용할것인지에 대한 흐름을 잡는 시간이었다.
먼저 데이터타입과 변수에 대해 학습하며 데이터를 저장하고 활용하는 기본구조를 이해했다. 변수는 단순한 저장공간이 아닌 연산과 조건문을 통한 흐름을 제어하는 핵심요소라는 점을 알게 되었다. 이어서 리스트와 딕셔너리를 학습하며 데이터 구조에 대한 이해를 확장했다. 리스트는 순서를 기반으로 데이터를 관리하는 데 적합하고, 딕셔너리는 키-값 구조를 통해 특정 정보를 빠르게 탐색하고 수정할 수 있어, 성격이 다른 데이터를 다루는 데 효과적인 방식임을 확인했다. 두 자료구조 차이를 직접 실습하며, 상황에 따라 어떤 구조를 선택해야 하는지 기준을 세울 수 있었다.
또한 모듈 개념을 통해 코드 재사용성과 확장성으 ㄹ이해했다. import를 활용해 필요한 기능을 불러오는 방식은, 반복 작업을 줄이고 구조적으로 코드를 관리하는 데 중요한 역할을 한다는 점에서 인상깊었다.
이후 JupyterLab환경에서 Pandas를 활용한 데이터 처리 실습을 진행했다. DataFrame이라는 2차원 구조를 기반으로 엑셀이나 CSV 파일의 데이터를 불러와 이를 코드로 다루는 과정을 진행했는데, 이는 기존의 수작업 중심 데이터 처리방식과는 확연히 다른 경험이었다.
실습중에는 실제 공정 데이터를 가정한 컬럼(Date, Step, Value, USL, TGT, LSL 등)을 다루며 데이터가 단순 숫자 나열이 아닌 공정상태를 해석할 수 있는 중요한 정보라는 걸 체가했다.
앞으로 이번에 익힌 파이썬 문법과 Pandas활용을 바탕으로 실제 데이터를 직접 불러와 분석하고 의미있는 결과를 도출하는 연습을 하고자 한다. 단순 코드 작성에 그치지 않고 데이터를 기반으로 문제를 구조적으로 이해하여 개선방향을 도출할 수 있는 역량을 갖추는 것이 목표다.
#반도체 #AI #파이썬 #데이터분석 #윈스펙 #이공계