<윈스펙 반도체 공정 데이터 분석 (feat. 파이썬) 3일 완성 스터디> 3일차 학습일지
[1일차 학습 내용 요약]
오늘은 반도체 공정 데이터를 다루기 위한 첫 단계로 파이썬 기초 문법과 데이터 로드 과정을 학습했습니다.
1. 파이썬 기초 및 변수 설정
-
데이터 저장의 기본인 변수 선언과 할당 방법을 익혔습니다. 특히 total_score와 같이 의미 있는 변수명을 사용해야 추후 코드 유지보수가 쉽다는 점을 배웠습니다.
-
데이터 타입: 정수(int), 실수(float), 문자열(str)의 차이를 이해하고, 문자열 슬라이싱이나 메서드(upper, lower 등)를 통해 텍스트 데이터를 가공하는 기초를 다졌습니다.
2. 리스트와 딕셔너리 (자료구조)
-
리스트(List): 대괄호
[]를 사용해 여러 데이터를 순서대로 관리하며, 인덱싱과 슬라이싱을 통해 원하는 위치의 값을 추출하는 실습을 진행했습니다. -
딕셔너리(Dictionary): 키(Key)와 값(Value)의 쌍으로 이루어진 구조로, 특정 공정 조건이나 속성 데이터를 매칭할 때 매우 유용할 것 같다는 생각이 들었습니다.
3. Pandas를 이용한 2차원 데이터 로드
-
가장 기대했던 Pandas 라이브러리 활용 파트입니다.
-
pd.read_csv()와 pd.read_csv()을 사용하여 실제 반도체 검사(inspection) 데이터와 주가 데이터를 파이썬 환경으로 불러오는 실습을 했습니다. 엑셀에서 보던 표 형태의 데이터를
DataFrame객체로 변환하여 확인해 보니, 대용량 데이터를 다루는 AI 기반 데이터 분석의 효율성을 실감할 수 있었습니다.
[학습 소감 및 다짐]
짧은 시간 동안 기초 문법과 데이터 로드까지 빠르게 달려왔는데, 실제 데이터를 가지고 가공하거나 시각화하는 단계까지 직접 실습해보지 못한 점은 조금 아쉬움으로 남습니다.
하지만 데이터를 다루기 위한 '도구' 사용법은 확실히 익혔기에, 앞으로 프로젝트나 직무 현장에서 실제 공정 데이터를 마주하게 된다면 이번에 배운 Pandas 활용법을 적극적으로 응용해 볼 생각입니다.
#반도체 산업에서 #AI와 #데이터분석 능력을 갖춘 #이공계 인재가 되기 위한 발판을 마련한 소중한 시간이었습니다. 이번 #윈스펙 스터디에서 배운 내용을 잊지 않고, 저만의 데이터 분석 포트폴리오를 계속해서 쌓아 나가겠습니다!
[필수 키워드 체크]
#반도체 #AI #파이썬 #데이터분석 #윈스펙 #이공계