3일차에는 파이썬의 기본 문법과 데이터 분석을 위한 기초 개념들을 학습하였습니다.
먼저, 변수의 개념에 대해 이해하였습니다. 변수는 데이터를 저장하는 공간으로, 값을 저장하고 이름을 부여함으로써 프로그램의 동작을 제어하는 데 사용됩니다. 변수에 값을 할당할 때는 = 기호를 사용하며, 오른쪽의 값을 왼쪽 변수에 저장하는 구조임을 학습하였습니다. 또한 문자열은 반드시 작은따옴표('') 또는 큰따옴표("")로 감싸야 한다는 점을 확인하였습니다. 변수명을 설정할 때에는 의미 있는 이름을 사용하는 것이 중요하며, 예약어는 사용할 수 없고 대소문자를 구분하며 숫자로 시작할 수 없다는 규칙도 함께 익혔습니다.
다음으로, 파이썬의 데이터 타입에 대해 학습하였습니다. 정수형(int), 실수형(float), 문자열(str)의 개념과 특징을 이해하였으며, 특히 문자열은 불변성을 가지는 데이터 타입이라는 점이 인상적이었습니다. 문자열 슬라이싱을 통해 원하는 부분을 추출할 수 있고, 다양한 문자열 메서드를 활용하여 데이터를 가공할 수 있다는 점도 확인하였습니다.
이어서 리스트(list)에 대해 학습하였습니다. 리스트는 여러 데이터를 순서대로 저장할 수 있는 자료형으로, 대괄호([])를 사용하여 표현하며 서로 다른 데이터 타입도 함께 저장할 수 있다는 특징이 있습니다. 각 요소는 인덱스를 통해 접근할 수 있으며, 인덱스는 0부터 시작한다는 점을 다시 한번 확인하였습니다. 또한 리스트의 길이를 확인하거나 슬라이싱을 통해 일부 데이터를 추출하는 방법도 익혔습니다.
그 다음으로는 딕셔너리(dictionary)를 학습하였습니다. 딕셔너리는 키(:)와 값(value)의 쌍으로 이루어진 자료형으로, 중괄호({})를 사용하여 표현합니다. 리스트와 달리 순서를 보장하지 않으며, 키를 통해 빠르게 값을 찾을 수 있는 특징이 있습니다. 다양한 데이터 타입을 값으로 사용할 수 있다는 점도 확인하였습니다.
또한, 모듈(module)의 개념에 대해 학습하였습니다. 모듈은 함수, 변수, 클래스 등을 포함하는 하나의 파이썬 파일로, 코드의 재사용성과 유지보수성을 높여주는 역할을 합니다. 파이썬은 다양한 표준 라이브러리를 제공하고 있어 필요한 기능을 효율적으로 활용할 수 있음을 이해하였습니다.
마지막으로, 데이터 분석에 활용되는 Pandas 모듈에 대해 학습하였습니다. Pandas는 1차원 및 2차원 데이터를 처리하는 데 특화된 라이브러리로, Series와 DataFrame 객체를 중심으로 구성되어 있습니다. 엑셀, CSV 파일, 데이터베이스 등 다양한 형태의 데이터를 쉽게 불러오고 저장할 수 있으며, 정렬, 필터링, 그룹화, 통계 계산 등을 간단한 코드로 수행할 수 있다는 점을 확인하였습니다.
특히, 실습을 통해 df.to_clipboard()와 pd.read_clipboard()를 활용하여 데이터를 복사 및 불러오는 방법을 익혔으며, pd.read_excel() 함수를 사용하여 특정 엑셀 시트 데이터를 불러오는 방법도 학습하였습니다. 또한 데이터 컬럼으로 사용되는 Date, Step, Value, USL, TGT, LSL 등의 의미를 이해하며 실제 공정 데이터 분석에 어떻게 활용될 수 있는지에 대해 생각해보는 시간을 가졌습니다.
이번 학습을 통해 파이썬의 기본 구조와 데이터 처리 방식에 대한 전반적인 이해를 높일 수 있었으며, 향후 반도체 공정 데이터 분석 및 실무 적용에 중요한 기초를 다질 수 있었습니다.
#반도체 #AI #파이썬 #데이터분석 #윈스펙 #이공계