전체 글 337

DBScan

https://pineapple-receipt-183.notion.site/DBSCAN-da5976d74bb74f97ab2fc67458a6425e?pvs=4 DBSCAN | NotionDBSCAN (Density-Based Spatial Clustering of Applications with Noise)은 밀도 기반 클러스터링 알고리즘으로, 데이터의 밀도가 높은 지역을 클러스터로 식별합니다. 이 알고리즘은 비구형 클러스터를 탐지할 수pineapple-receipt-183.notion.site현재 프로젝트에서 사용할 데이터는, GPT를 사용한 유튜브 영상/썸네일을 멀티모달 모델로 임베딩한 데이터셋입니다.따라서 비슷한 부류의 영상을 클러스터링하여 시각화 하는게 목표입니다. 하지만 아직 데이터가 라벨링되어있..

Feature Extraction with Resnet

https://pineapple-receipt-183.notion.site/Feature-Extraction-with-Resnet50-e8e8e8389cd5475dabca22062f3494c6?pvs=4 Feature Extraction with Resnet50 | NotionCIFAR-10 데이터에 대해 tsne로 data를 시각화하는 과정입니다.pineapple-receipt-183.notion.site 여러가지 데이터셋을 사용해서 시각화를 수행해봤습니다.Digit, MNIST 같은 데이터셋은 그냥 2차원으로 시각화하면 클러스터링이 잘 되는 반면,CIFAR-10 데이터는 TSNE만을 사용해서는 클러스터링이 잘 이루어지지 않는 문제가 있었습니다. CIFAR-10 는 이미지데이터이므로, 해당 이미지의 피..