工具分享#
Queryable可以在手機上使用自然語言離線模糊搜索照片。
特點#
Queryable 是一個開源的 iOS 應用程序,利用 OpenAI 的 CLIP 模型在相冊中進行離線搜索。Queryable 使用自然語言語句搜索照片。離線運行,隱私友好。
原理#
這個工具基於CLIP模型,CLIP 的原理是將所有相冊照片使用 CLIP Encoder 進行編碼,計算圖像向量並保存它們。對於每個新的文本查詢,使用 Text Encoder 計算相應的文本向量。比較此文本向量與每個圖像向量之間的相似性。排名並返回前 K 個最相似的結果。
項目使用的是 CLIP ViT-B/32 模型微調,使用中文效果會差點。
平台#
声明#
本文僅作為工具分享記錄。
本文與Hblog保持同步。