포스트

포트폴리오

Desktop View

Park Jae Min

e-mail : jaemin2056@naver.com
TEL : 010-2387-2056
전북대학교 시각지능 연구실 (2023. 03 ~ 2024. 12)
전북대학교 IT 정보공학과 학사 (2018. 02 ~ 2025. 02)

About Me

Github : https://github.com/kidcat2
Blog : https://kidcat2.github.io/
Language : Python, C++
Skills : Pytorch, Numpy, OpenCV, Pandas, GeoPandas
Field : Deep Learning(Image Enhancement), Spaitial Analysis
Interest : 3D Reconsturction, Coumputer Graphics, VR, AR, Game Engine, HCI

전북대학교 시각지능 연구실 (2023. 03 ~ 2024. 12.)

  1. 전북대학교 VILab(Visual Intelligence Lab)
  2. 2023-03 ~ 05. 딥러닝, OpenCV 기초 (밑바닥부터 배우는 딥러닝, OpenCV-Python)
  3. 2023-05 ~ 07. AlexNet, ResNet, Transformer, RNN, word2vec 등 논문 읽어보기
  4. 2023-07 ~ 09. 3D Reconstruction (NeRF, Instant NGP)
  5. 2023-10 ~ 12. Object Detection (DETR, CO-DETR, YoLo)
  6. 2024-01 ~ 04. Image Enhancement (Retouching)
    • Retouching(LUT) : 3DLUT, 4DLUT, AdaInt, ATTENTIONLUT, CLUT, Pixelwise3DLUT, SepLut
    • Retouching(Pixel) : RSFNet, White-box framework
    • References : Retinexformer, RetinexNet, MAXIM, DPE, HDRNET
  7. 2024-05 ~ 11. Image Enhancement(Personalized Image Retouching)
    • PieNet, PIE by Masked Style Modeling, StarEnhancer
  8. 2024-12 ~ 12. 25년도 신진연구 신규과제 연구계획서 작성
  9. 논문 세미나 (논문 발표)
    논문 리스트
    • NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
    • Instant Neural Graphic Primitives
    • End-to-End Object Detection with Transformers
    • RSFNet - A White-Box Image Retouching Approach using Region-Specific Color
    • SepLUT : Separable Image-adaptive Lookup Tables for Real-time Image Enhancement
    • Retinexformer: One-stage Retinex-based Transformer for Low-light Image Enhancement
    • PieNet: Personalized Image Enhancement Network
    • StarEnhancer - Learning Real-Time and Style-Aware Image Enhancement
    • Enhancement by Your Aesthetic - An Intelligance Unsupervised Personalized Enhancer for Low-Light Image
    • Rethinking the Up-Sampling Operations in CNN-based Generative Network for Generalizable Deepfake Detection
    • 3D Gaussian Splatting for Real-Time Radiance Field Rendering
  10. 학회 참여
    • 2023 IEIE 대한전자공학회 하계종합학술대회(포스터 발표 - 특징 변환 기반의 전역 영상 화질 개선기법)
    • 2024 KCCV (Korean Conference on Computer Vision)


Project

  1. Capstone. 치매노인을 위한 CCTV 설치 최적지 분석
  2. 딥러닝 기반의 개인화된 이미지 향상(Personalzied-Image Enhancement) 모델 연구
  3. Viterbi Pos Tagging 모델 제작
  4. 블로그
  5. 텔레그램 채팅 봇 만들기



Capstone. 치매노인을 위한 CCTV 설치 최적지 분석

기간 : 2024년 9월 ~ 2024년 12월

인원 : 2명

목표 : 전라북도 치매 노인 사고를 예방하기 위한 CCTV 최적지 분석 및 시각화

사용 기술 : Python, Geopandas, pandas, XGBoost, K-Fold, plt

git : https://github.com/kidcat2/Capstone

진행 과정 : Link

소개

최적의 CCTV 장소를 분석하기 위해 기존 전라북도 노인 사고자 수를 바탕으로 사고 위치를 예측하는 프로그램 입니다.
공공 데이터들을 Geopandas 를 이용해 취합하고 전처리하여 데이터 셋을 제작해 진행하였습니다.
학습 모델은 XGBoost을 사용하였고, StratifiedKFold을 이용해 불균형 데이터를 보정함으로써 모델의 성능을 향상시켰습니다.
모델이 예측한 노인 사고지 위치와 기존 CCTV 위치를 고려해 CCTV 최적지를 분석하고 matplotlib를 통해 시각화합니다.

담당

  • PM
  • 데이터 전처리
  • 훈련 데이터셋 제작
  • 시각화
  • Model Training & Tuning

회고

대학교 4학년 졸업 프로젝트로 기업 과제를 수행했습니다. 단순히 결과를 도출하는 데 그치지 않고, 실질적인 활용 가능성을 증명해야 한다는 점에서 까다로운 부분이 많았습니다.
처음 프로젝트를 시작할 때 기업 관계자분들께서 현업에서는 데이터셋 구성과 전처리 과정이 매우 복잡하고 핵심적이라고 강조하셨습니다.
실제로 이를 직접 경험하면서 데이터 처리의 복잡성과 중요성을 깊이 체감할 수 있었습니다. 또한 기업 관계자분들과 지속적으로 소통하며 프로젝트의 전 과정을 주도적으로 수행한 점이 매우 뜻깊었습니다.
데이터를 수집하고 가공하는 초기 단계부터 결과를 검증하고 활용 방안을 모색하는 최종 단계까지 모두 경험하면서 현업에서 요구되는 문제 해결 과정을 몸소 익힐 수 있었습니다.
이 프로젝트는 데이터 중심의 문제 해결 능력을 키우고 실무에 가까운 과정을 체험해볼 수 있었던 좋은 기회였습니다.

딥러닝 기반의 개인화된 이미지 향상(Personalzied-Image Enhancement) 모델 연구

기간 : 2024년 5월 ~ 2024년 11월

인원 : 2명

목표 : 사용자 선호도에 따른 이미지 개선 모델

사용 기술 : Python, Pytorch, matplotlib, opencv, t-SNE

git : https://github.com/kidcat2/Lab01

진행 과정 : Link

소개

이미지 개선(Image Enhancement)이란 색상 복원, 디테일 향상, 또는 특정 스타일 반영 등을 통해 이미지의 품질을 높이는 작업으로, 컴퓨터 비전에서 중요한 연구 주제 중 하나입니다.
제안된 모델은 단순한 개선이 아닌, 사용자가 원하는 색상 스타일에 맞춰 이미지를 개선하는 것을 목표로 합니다.
이를 위해 스타일 특징 벡터(style feature vector) 를 이미지 개선 모델에 추가적으로 입력하여 최종 개선 이미지에 반영합니다.
추가적으로, End-to-End 구조를 활용하여 스타일 특징(style feature)가 사용자-선호도에 영향을 미치는 지 관계를 명확하게 파악합니다.
자세한 연구 과정은 ‘진행 과정’ 링크에 기록하였습니다.

담당

  • Base Model 구축 (PieNet, StarEnhancer)
  • Style Encoder 개선
  • 다양한 딥러닝 기법(Attention, Adain..) 기반 Enhancer 개발
  • 추가 데이터셋 구축
  • T-SNE 를 통한 시각화

회고

이번 프로젝트는 제가 직접 모델을 개선하고 새로운 방법을 탐구한 첫 경험이었습니다.
기존 연구나 프로젝트들은 명확한 목표와 정해진 답이 있는 문제를 해결하는 데 초점이 맞춰져 있었던 반면, 이 연구에서는 모든 과정이 새로운 도전이었습니다.
새로운 접근 방식을 찾기 위해 다수의 논문을 분석하며 다양한 아이디어를 탐구했고, 이를 코드로 구현하기 위해 며칠간 집중적으로 고민했습니다.
이러한 과정을 통해 모델 구현과 문제 해결 능력을 향상시킬 수 있었습니다.
그 과정에서 이미지 개선뿐만 아니라 컴퓨터 비전 분야에 대한 실질적인 지식을 쌓을 수 있었습니다.

Viterbi Pos Tagging 모델 제작

기간 : 2024년 4월 ~ 5월

인원 : 1명

목표 : 단어-품사를 매칭하는 Viterbi POS Tagging, Bigram 모델 만들기

사용 기술 : Python, Numpy

git : https://github.com/kidcat2/Viterbi

개발 진행 과정

  1. 데이터셋 전처리 (오류 문장 제거, Counting)
  2. Adding one 기법을 적용한 확률 계산 및 모델 설계
  3. 설계된 모델을 바탕으로 test dataset의 품사를 예측 및 정답률 측정
  4. 사용자가 문장을 입력할 경우와 데이터셋으로 입력을 줄 경우를 고려해 확장

소개

Viterbi 알고리즘을 이용해 문장을 입력받으면 각 단어의 품사를 예측하는 모델입니다.
Bigram을 이용하여, train-dataset 에서 단어의 개수를 counting하고, 등장하지 않는 두 단어 매칭에 대해 Adding-one Algorithm을 통해 보정합니다.
최종적으로 모델은 입력으로 문장 또는 txt 파일을 받아서 각 문장의 단어마다 품사를 예측합니다.
Stanford Random POS Tagging 을 통해 제작된 데이터셋을 사용했습니다.

문제 및 해결

  1. 학습 과정에서 한번도 등장하지 않는 단어 또는 단어A-단어B 구조는 확률이 0으로 측정되는 문제가 발생
    • Adding one 을 통해 모든 경우에 횟수를 +1 해줌으로써 해결
  2. Unsupervised Dataset 에 대한 문제
    • k-means 알고리즘으로 해결할 수 있다는 점은 알았지만, 구현에 실패함

Github 블로그 만들기

기간 : 2023년 2월 ~

인원 : 1명

목표 : 전공 분야 및 대학 활동 전반 정리

사용 기술 : Markdown

git : https://github.com/kidcat2

소개

컴퓨터 공학 과정에 대한 전반적인 요약과 정리를 남기고, 대학 생활 동안 진행한 프로젝트와 다양한 경험을 남기기 위해 블로그를 시작했습니다.

회고

이전의 티스토리 블로그에서 GitHub로 블로그를 옮기며 마크다운 언어를 능숙하게 다루고, VSCode와 Git에 대한 지식을 확장하려는 목표를 가지고 진행했습니다.
전공 과정을 정리하고 대학 활동을 기록하는 목표는 다소 미흡하게 끝났지만, 그 과정에서 ‘내가 잘못 알고 있던 것은 아닐까?’라는 고민을 통해 더욱 깊이 있는 전공 지식을 쌓을 수 있었습니다.
블로그를 통해 내 지식과 경험을 다른 사람들과 공유하는 과정은 매우 즐거운 일이었습니다.
비록 많은 양을 기록으로 남기지는 못했지만, 정보를 필요로 하는 사람들이 내 블로그를 통해 유익한 정보를 얻을 수 있도록 지속적으로 운영해 볼 생각입니다.

텔레그램 채팅 봇 만들기 (Boogie)

기간 : 2022년 4월 ~ 2022년 6월

인원 : 4명

목표 : 크롤링을 이용해 교내 소식 및 실시간 내용을 가져오는 텔레그램 채팅 봇 제작하기

사용 기술 : Python, Selenium, BeautifulSoup

git : https://github.com/kidcat2/TelChattingbot

개발 진행 과정

  1. 텔레그램과 연동이 되고, 사용자 마다 개별 답변 기능을 가지는 기본 채팅 봇 구조 제작
  2. 사용자가 특정 명령어를 통해 원하는 정보 취득하는 구조로 설계
  3. 기본적인 정보(교내 공지 등)를 크롤링 하는 명령어 업데이트
  4. 실시간으로 변하는 동적 웹크롤링 시도 (ex. 실시간 인기 동영상)

소개

텔레그램 채팅 봇 ‘Boogie’는 간단한 명령어 입력만으로 봇이 자동으로 크롤링한 정보를 사용자에게 제공하는 프로그램입니다.
이 프로젝트는 학과 홈페이지에 접속하지 않고도 교내 공지와 소식을 빠르게 확인할 수 있는 기능을 제공합니다.
또한, 교내 공지 외에도 새로운 정보들을 손쉽게 추가할 수 있도록 확장성을 핵심으로 고려해 설계했으며, 이를 기반으로 몇 가지 기능을 시험적으로 구현한 결과 정상적으로 작동한 것을 확인했습니다.

담당

  • PM
  • 전체 프로그램 진행 방향성 및 코드 통합
  • 초기 텔레그램-봇 연동 구조 제작
  • 동적 크롤링

문제 및 해결

  1. 웹 사이트의 정보를 가져오는 과정에서 사용자에게 웹 사이트가 보여지는 문제
    • Chorme Option의 disable 기능을 이용해 사용자에게 안보이도록 해결
  2. 실시간으로 변하는 정보의 경우 크롤링이 안되고 백지로 나오는 현상
    • Selenium의 동적 크롤링을 이용한 데이터 추출을 통해 해결

회고

대학교 2학년 1학기 처음으로 진행한 팀 프로젝트였습니다. 모든 인원이 파이썬 기초 문법 지식 정도만 보유한 상태에서 한 학기에 대한 결과물을 내야 한다는 것이 가장 힘들었습니다.
특히, 직접적인 개발 작업 외에도 팀원별 역할 분배, 코드 통합, 시간 관리, 환경 설정 등 여러 측면에서 많은 어려움을 겪었습니다.
이런 문제를 해결하는 과정에서 모르는 분야에서 지식을 찾아내는 방법, 각자의 역할을 명확히 하고 팀원들과 지속적으로 소통하며 협력하는 방법을 배웠습니다.

이 기사는 저작권자의 CC BY 4.0 라이센스를 따릅니다.