<윈스펙 반도체 공정 데이터 분석 (feat. 파이썬) 3일 완성 스터디> 2일차 학습일지

#반도체 #AI #파이썬 #데이터분석 #윈스펙 #이공계

<윈스펙 반도체 공정 데이터 분석 (feat. 파이썬) 3일 완성 스터디> 2일차 학습일지


1. Python 개발 환경 구축
(1) Anaconda Prompt 실행

Python 패키지 관리 및 가상환경 생성을 위해 Anaconda Prompt를 사용하였다.

(2) 가상환경 생성

프로젝트별 독립적인 개발 환경을 구축하기 위해 가상환경을 생성하였다.

conda create -n [가상환경 이름] python=[버전]

가상환경은 하나의 독립된 작업 공간을 만드는 개념으로, 서로 다른 프로젝트 간 라이브러리 충돌을 방지할 수 있다.

(3) 가상환경 활성화
conda activate [가상환경 이름]

생성한 가상환경에 진입하여 해당 환경에서 패키지 설치 및 개발을 진행하였다.

 

2. JupyterLab과 가상환경 연동

JupyterLab은 데이터 분석과 머신러닝 분야에서 널리 사용되는 오픈소스 웹 기반 통합 개발 환경이다.

(1) ipykernel 설치
conda install ipykernel

Jupyter Notebook이 현재 가상환경을 인식할 수 있도록 Kernel을 설치하였다.

(2) JupyterLab 설치
conda install -c conda-forge jupyterlab

JupyterLab을 설치하여 데이터 분석 환경을 구축하였다.

(3) JupyterLab 커널 등록
python -m ipykernel install --user --name [가상환경 이름] --display-name [가상환경 이름]

생성한 가상환경을 JupyterLab에서 선택할 수 있도록 커널을 등록하였다.

(4) 가상환경 비활성화
conda deactivate

작업 종료 후 가상환경을 비활성화하였다.

(5) JupyterLab 실행
jupyter lab

이후 재부팅한 경우에는 JupyterLab만 실행하면 기존 환경을 그대로 사용할 수 있다.

 

3. Jupyter Notebook 활용
Jupyter Notebook의 장점

일반적인 Python 개발은 스크립트 전체를 작성한 뒤 실행하는 방식이다. 반면 Jupyter Notebook은 셀(Cell) 단위로 코드를 실행할 수 있어 데이터 분석에 매우 유용하다.

예를 들어 대용량 반도체 공정 데이터를 분석할 때, 데이터 로딩, 데이터 전처리, 시각화, 통계 분석,과정을 각각의 셀로 나누어 실행할 수 있다.

따라서 데이터 일부만 수정하거나 중간 결과를 확인하면서 분석을 진행할 수 있어 생산성이 높다.

 

4. Jupyter Notebook 주요 단축키
단축키    기능
A    현재 셀 위에 새로운 셀 생성
B    현재 셀 아래에 새로운 셀 생성
DD    현재 셀 삭제

이를 활용하여 Notebook 환경에서 보다 빠르게 코드를 작성하고 관리할 수 있었다.

 

5. 학습 내용 정리
Conda를 활용한 Python 가상환경 구축 방법 학습
JupyterLab과 가상환경 연동 방법 습득
데이터 분석에 적합한 Notebook 기반 개발 환경 이해
셀 단위 실행을 통한 효율적인 데이터 분석 방법 학습
향후 Pandas, NumPy, Matplotlib 등 데이터 분석 라이브러리를 활용할 수 있는 환경 구축 완료


느낀 점

반도체 공정 데이터는 용량이 크고 분석 과정이 복잡하기 때문에 개발 환경 구축이 매우 중요하다는 것을 알게 되었다. 특히 Jupyter Notebook은 데이터 전처리 결과를 즉시 확인하며 분석할 수 있어 공정 데이터 분석 및 수율 개선 업무에 적합한 도구라고 느꼈다. 향후 Python 라이브러리를 활용하여 실제 반도체 품질 데이터 분석 프로젝트에 적용해 보고자 한다.

 

원스펙의 AI와 파이썬을 이용한 이공계 반도체 데이터 분석 강의 수강

0
0
댓글0