목록분류 전체보기 (233)
주뇽's 저장소
1. 필요 라이브러리 다운로드 로컬에서 사용시 python 3.10 버전을 사용해야 한다 3.11 버전은 아직 에러가 많음 #-- requirements.txt super-gradients==3.1.1 opencv-python pip install -r requirements.txt 2. 코드 작성 이미지에서 YOLO 사용 import cv2 import torch from super_gradients.training import models #-- GPU 설정 device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu") print(device) use_cuda = torch.cuda.is_available() print(use_cuda..
2023.07.01 - [ComputerVision/YOLO] - YOLO_NAS_커스텀 데이터 (포켓몬 도감 만들기) YOLO_NAS_커스텀 데이터 (포켓몬 도감 만들기) 프로젝트 시작(커스텀 데이터) 커스텀 데이터(Pokemon) Step0. 데이터 준비 및 라벨링을 위한 Roboflow 회원가입 포켓몬 데이터 셋(파이리, 꼬부기, 이상해씨) 크롤링을 통해 이미지 데이터 확보 Roboflow jypark1111.tistory.com YOLO-NAS vs YOLOv8 참고 블로그 : YOLO-NAS vs. YOLOv8: A Comprehensive Comparison 객체 인식 분야에서 가장 인기 있고 효율적인 모델 중에는 YOLO 시리즈가 있다. 해당 블로그에서는 2가지의 최신 모델을 비교하고 각가의..
YOLO V4 YOLO(You Only Look Once) : 다중 객체 인식 YOLO V4모델은 You Only Look Once의 약자로써, 객체 탐지(Object detection)분야에서 많이 알려져 있으며 이미지를 한 번 보는 것으로 물체의 종류와 위치를 추측하며 이미지의 전체 맥락을 이해하므로 빠르고 정확하다 YOLO v4는 이전v3버전을 더욱 개량하여 정확도를 향상시켰다. 학습환경 Google Colab (코랩에서 진행하는 이유) YOLO를 학습시키기 위해서는 Darknet을 사용해야하는데 설치 조건이 까다롭기 때문에 공통적인 환경을 위함 Linux 환경 GPU연산 가능 python #주의점 : Colab 무료버전은 최대 런타임 시간은 12시간이므로 구글 드라이브를 통한 데이터 백업 필요 학..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bHeKg1/btslZ6smJ6o/PJfBLukkvZnhwQ9wIQAjV0/img.png)
RNN, LSTM, SelfAttention을 원하는 문제에 활용하여 문제 해결하고 결과에 대한 고찰 및 분석하기. 목표 예제를 통해 NLP(RNN, LSTM, SelfAttention) 모델에 대해서 이해하기 RNN RNN은 순차적인 데이터를 처리하기에 적합한 모델로 각 단어를 순차적으로 입력으로 받고, 내부의 순환 구조를 통해 이전 단계의 정보를 현재 단계로 전달한다. 이전 단계의 정보가 현재 단계에 영향을 미치기 때문에 문맥을 파악하는 데 유용하지만 장기 의존성 문제가 있다. LSTM LSTM은 RNN의 변형 모델로, RNN의 단점인 장기 의존성 문제를 해결하기 위해 고안되었다. LSTM은 게이트 메커니즘을 도입하여, 어떤 정보를 기억하고 어떤 정보를 잊을지를 결정한다. 이를 통해 장기 의존성을 유..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/crpwYd/btslZ1x1jso/hXQ9pRlEuDoNwUUCYAKKo0/img.png)
2023.08.08 - [DeepLearning/Paper Riview] - Attention Is All You Need Attention Is All You Need Attention Attention Is All You Need Transformer : Attention Is All You Need RNN (Recurrent Neural Network): RNN은 순차적인 데이터를 처리하는 데 사용되는 신경망 구조이다. RNN은 이전 시간 단계의 입력을 현재 시간 단계 jypark1111.tistory.com Transformer는 자연어 처리(Natural Language Processing) 분야에서 주로 사용되는 모델 구조이다. Attention 메커니즘을 사용하여 입력 시퀀스를 처리하고, 병..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/kJf0a/btslZOyVgZE/KlnKh99JKk6Zw311SI7T30/img.png)
LSTM은 RNN의 단점 중 하나인 장기 의존성 문제를 해결하기 위해 제안된 변형된 RNN 구조이다. LSTM은 시간적인 의존성을 잘 다룰 수 있도록 설계되었다. LSTM은 게이트를 이용하여 특정 시간 단계에서 중요한 정보를 기억하고, 필요에 따라 이를 장기적으로 전달하거나 삭제할 수 있다. 특징: 장기 의존성을 다루기 위한 메모리 셀, 입력 게이트, 삭제 게이트, 출력 게이트 등의 구조 장점: 장기 의존성 문제를 해결, 시계열 데이터 처리에 적합 단점: 많은 파라미터와 연산이 필요하여 학습과정이 복잡함, 계산량이 크고 처리 속도가 상대적으로 느릴 수 있음 LSTM을 이용하여 IMDB 영화 리뷰 감성 분석 import numpy as np import tensorflow as tf import matpl..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bGQd7t/btsl2cZj7HZ/lpfJ0ECT6jjPBl9PjDQSj0/img.png)
2023.07.01 - [NLP/Transformer] - RNN, LSTM, Transformer IMDB 결과 분석 RNN, LSTM, Transformer IMDB 결과 분석 RNN, LSTM, SelfAttention을 원하는 문제에 활용하여 문제 해결하고 결과에 대한 고찰 및 분석하기. 목표 예제를 통해 NLP(RNN, LSTM, SelfAttention) 모델에 대해서 이해하기 RNN RNN은 순차적인 데이터를 처리하 jypark1111.tistory.com RNN (Recurrent Neural Network): RNN은 순차적인 데이터를 처리하는 데 사용되는 신경망 구조이다. RNN은 이전 시간 단계의 입력을 현재 시간 단계의 입력과 함께 처리하여 순차적인 정보를 유지하고 활용할 수 있고 ..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/kGmwk/btsryo9eZFv/Y30kSWwWtWHe3RtdmY9G9K/img.png)
NeRF NeRF (Neural Radiance Fields)는 신경망을 사용하여 3D 공간의 시각적인 표현을 학습하는 방법이다. NeRF는 3D 장면의 형상과 텍스처 정보를 캡처하여 다양한 관점에서의 렌더링을 수행할 수 있다. 특징 3D 시각화: NeRF는 3D 공간의 형상과 텍스처를 고해상도로 재구성하여 현실적이고 자연스러운 시각화를 제공하며 이를 통해 실제 세계와 유사한 시각적인 품질을 달성할 수 있다. 시야 변화에 대한 일관성: NeRF는 여러 각도에서의 뷰를 학습하여 3D 공간을 모델링하므로 시야 변화에 따라 일관된 렌더링 결과를 제공한다. 이는 회전, 이동 등의 변환에 대해 시각적인 일관성을 유지할 수 있다. 장면의 광원 모델링: NeRF는 공간 내의 광원에 대한 모델링도 수행한다. 이는 장면..