목록ComputerVision (15)
주뇽's 저장소
프로젝트 시작(커스텀 데이터) 커스텀 데이터(Pokemon) Step0. 데이터 준비 및 라벨링을 위한 Roboflow 회원가입 포켓몬 데이터 셋(파이리, 꼬부기, 이상해씨) 크롤링을 통해 이미지 데이터 확보 Roboflow Roboflow Universe: Open Source Computer Vision Community Step1. 데이터 라벨링- 이미지 하나씩 라벨링 시작 smart 기능을 이용하면 더욱 정교하게 라벨링 가능(신세계 경험) ❗ 객체 탐지에서는 정교한 라벨링을 하면 인식을 못함 ㅠㅠ 사각형으로 다시 라벨링!! Segmentation에서 했어야 하는듯…. 이 문제 때문에 몇 시간을 날림.. 만약 라벨링을 실수한경우 손바닥 모양을 클릭하면 쉽게 수정 가능!! 위처럼 하면 안됨 아래처럼 ..
1. 필요 라이브러리 다운로드 로컬에서 사용시 python 3.10 버전을 사용해야 한다 3.11 버전은 아직 에러가 많음 #-- requirements.txt super-gradients==3.1.1 opencv-python pip install -r requirements.txt 2. 코드 작성 이미지에서 YOLO 사용 import cv2 import torch from super_gradients.training import models #-- GPU 설정 device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu") print(device) use_cuda = torch.cuda.is_available() print(use_cuda..
2023.07.01 - [ComputerVision/YOLO] - YOLO_NAS_커스텀 데이터 (포켓몬 도감 만들기) YOLO_NAS_커스텀 데이터 (포켓몬 도감 만들기) 프로젝트 시작(커스텀 데이터) 커스텀 데이터(Pokemon) Step0. 데이터 준비 및 라벨링을 위한 Roboflow 회원가입 포켓몬 데이터 셋(파이리, 꼬부기, 이상해씨) 크롤링을 통해 이미지 데이터 확보 Roboflow jypark1111.tistory.com YOLO-NAS vs YOLOv8 참고 블로그 : YOLO-NAS vs. YOLOv8: A Comprehensive Comparison 객체 인식 분야에서 가장 인기 있고 효율적인 모델 중에는 YOLO 시리즈가 있다. 해당 블로그에서는 2가지의 최신 모델을 비교하고 각가의..
YOLO V4 YOLO(You Only Look Once) : 다중 객체 인식 YOLO V4모델은 You Only Look Once의 약자로써, 객체 탐지(Object detection)분야에서 많이 알려져 있으며 이미지를 한 번 보는 것으로 물체의 종류와 위치를 추측하며 이미지의 전체 맥락을 이해하므로 빠르고 정확하다 YOLO v4는 이전v3버전을 더욱 개량하여 정확도를 향상시켰다. 학습환경 Google Colab (코랩에서 진행하는 이유) YOLO를 학습시키기 위해서는 Darknet을 사용해야하는데 설치 조건이 까다롭기 때문에 공통적인 환경을 위함 Linux 환경 GPU연산 가능 python #주의점 : Colab 무료버전은 최대 런타임 시간은 12시간이므로 구글 드라이브를 통한 데이터 백업 필요 학..
NeRF NeRF (Neural Radiance Fields)는 신경망을 사용하여 3D 공간의 시각적인 표현을 학습하는 방법이다. NeRF는 3D 장면의 형상과 텍스처 정보를 캡처하여 다양한 관점에서의 렌더링을 수행할 수 있다. 특징 3D 시각화: NeRF는 3D 공간의 형상과 텍스처를 고해상도로 재구성하여 현실적이고 자연스러운 시각화를 제공하며 이를 통해 실제 세계와 유사한 시각적인 품질을 달성할 수 있다. 시야 변화에 대한 일관성: NeRF는 여러 각도에서의 뷰를 학습하여 3D 공간을 모델링하므로 시야 변화에 따라 일관된 렌더링 결과를 제공한다. 이는 회전, 이동 등의 변환에 대해 시각적인 일관성을 유지할 수 있다. 장면의 광원 모델링: NeRF는 공간 내의 광원에 대한 모델링도 수행한다. 이는 장면..
1. VAE VS GAN VAE vs GAN VAEs(Variational Autoencoders) reale data에 데이터를 압축하여 핵심만을 학습하여 그 핵심으로 다시 real data를 예측 사람이 암기과목을 학습할 때와 비슷함 학습 부담이 적다 창의성은 없다 학습이 완료된 후 decoder부분만을 사용 GAN(generative Adversarial Networks) 생성 모델이 random noise로부터 data를 생성한 후 판별 모델이 real data와 생성 data를 비교 학습 부담이 크다(학습이 잘 안될 수 있음) real data뿐 아니라 창의적이 data가 나올 수 있음 학습이 완료된 후 generative 부분만을 사용 머신러닝 기초 데이터로부터 학습능력을 가진 알고리즘 E :..
4-1 심층학습의 등장 배경 1980년대에 이미 깊은 신경망 아이디어 등장(다층 퍼셉트론) 하지만 당시 기술로는 실현 불가능 경사 소멸 (gradient vanishing)문제 작은 훈련집합 과다한 연산과 시간 소요(낮은 연산의 범용 컴퓨터, 값비싼 슈퍼컴퓨터) 일부 연구자(캐나다)들은 실망스러운 상황에서도 지속적인 연구 학습률에 따른 성능 변화 양상 모멘텀과 같은 최적 탐색 방법 모색 은닉 노드 수에 따른 성능 변화 데이터 전처리의 영향 활성함수의 영향 규제 기법의 영향 등 # 보통 다층 퍼셉트론이 4개 이상일 때 심층학습이라 부른다. 경사 소멸 문제(gradient vanishing problem) # Back_prob 단계에서 경사 소멸 문제 발생 #위 그림 처럼 오류 역전파를 통해 계산하는 도중 ..