반도체 공정 데이터의 특성을 이해하고 이를 기반으로 한 분석이 본격적으로 진행되었다. 반도체 공정에서는 온도, 압력, 시간과 같은 다양한 변수들이 복합적으로 작용하여 결과에 영향을 미치기 때문에, 이러한 변수 간의 관계를 파악하는 것이 중요하다. 이를 위해 matplotlib과 seaborn을 활용한 데이터 시각화를 수행하였으며, 그래프를 통해 데이터의 분포와 경향성을 직관적으로 확인할 수 있었다. 수치 데이터만으로는 파악하기 어려웠던 패턴이 시각화를 통해 명확하게 드러났고, 특정 변수들이 결과값에 어떤 영향을 미치는지를 보다 쉽게 이해할 수 있었다. 또한 상관관계 분석을 통해 주요 변수들 간의 연관성을 확인하고, 이상치를 탐지 및 제거하는 과정을 경험하면서 데이터 분석이 단순한 계산이 아닌 문제 해결을 위한 과정이라는 점을 다시 한번 인식하게 되었다.
0
0
댓글 0