ツールの共有#
Queryableは、スマートフォンで自然言語によるオフラインのぼかし検索ができるようになりました。
特徴#
Queryable は、オープンソースの iOS アプリであり、OpenAI の CLIP モデルを使用してアルバム内でオフライン検索を行います。Queryable は自然言語の文を使用して写真を検索します。オフラインで動作し、プライバシーに配慮しています。
原理#
このツールは、CLIPモデルに基づいています。CLIP の原理は、すべてのアルバムの写真を CLIP エンコーダを使用してエンコードし、画像ベクトルを計算して保存することです。新しいテキストクエリごとに、テキストエンコーダを使用して対応するテキストベクトルを計算します。このテキストベクトルと各画像ベクトルの類似性を比較します。上位 K 個の最も類似した結果をランキング付けして返します。
このプロジェクトでは、CLIP ViT-B/32 モデルの微調整を使用していますが、中国語では効果が少し劣るかもしれません。
プラットフォーム#
免責事項#
この記事は、ツールの共有記録としてのみ提供されています。
この記事はHblogと同期しています。