中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

怎么在Colab上實現近200萬圖片的精準檢索匹配

發布時間:2021-12-18 13:51:31 來源:億速云 閱讀:146 作者:柒染 欄目:大數據

本篇文章為大家展示了怎么在Colab上實現近200萬圖片的精準檢索匹配,內容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細介紹希望你能有所收獲。


OpenAI 同時發布了兩個連接文本與圖像的神經網絡:DALL·E 和 CLIP。其中,DALL·E 可以基于文本直接生成圖像,CLIP 能夠完成圖像與文本類別的匹配。這兩個模型發布之后,機器學習社區出現了一些復現 DALL·E 模型的嘗試,如開發者 Phil Wang 的 GitHub 項目 DALLE-pytorch,短短二十余天就收獲了 1.9k star。

近日,又有開發者創建了一個利用 CLIP 模型搜索文本精準匹配圖片的項目。該項目所有圖片出自 Unsplash 數據集,大約有 200 萬張,利用 CLIP 模型進行處理。項目既可以在給定的免費谷歌 Colab notebook 中運行,也可以在用戶自己的機器上運行。

怎么在Colab上實現近200萬圖片的精準檢索匹配


項目地址:https://github.com/haltakov/natural-language-image-search#two-dogs-playing-in-the-snow

在具體實現上,項目作者在 Colab Notebook 上將所有圖片處理成了預計算特征向量,然后找到與自然語言搜索查詢(即輸入的文本)最匹配的圖片。
項目作者提供了一些效果展示圖,如輸入搜索詞條「"Two dogs playing in the snow"」,就會出現以下幾幅圖片:

怎么在Colab上實現近200萬圖片的精準檢索匹配

攝自:Richard Burlton、Karl Anderson 和 Xuecheng Chen。

輸入搜索詞條「"The word love written on the wall"」,就會出現以下包含「love」的文本:

怎么在Colab上實現近200萬圖片的精準檢索匹配

攝自:Genton Damian、Anna Rozwadowska 和 Jude Beck。  

此外,你還可以選擇搜索圖片的數量,例如:通過修改「search_unslash(search_query, photo_features, photo_ids, 3)」,將該行中的 3 更改為想要的搜索結果數量。

如何實現?

谷歌 Colab notebook 上運行

在給定的 Colab 會話中進行首次搜索的步驟如下:

1. 首先需要進入 Colab 界面;

2. 登錄谷歌賬戶,單擊右上角的「S」按鈕即可完成此操作。注意:注冊谷歌賬戶會影響隱私,比如你的谷歌搜索歷史記錄會記錄在谷歌帳戶中;

3. 單擊單元格中的某個位置(三角形除外),該行顯示「search_query = "Two dogs playing in the snow"」;

4. 單擊菜單「Runtime→Run before」,等待執行結束;

5. 找到讀取(或最初讀取)「search_query = "Two dogs playing in the snow"」這一行,將「 "Two dogs playing in the snow"」改變成你想要的查詢。例如:「search_query = "A clock with gold-colored numbers on a black background"」;

6.(可選)查找讀取(或最初讀取)的行「search_unslash(search_query, photo_features, photo_ids, 3)」。將該行中的 3 更改為想要的搜索結果數量;

7. 單擊最初讀取「search_query = "Two dogs playing in the snow"」這一行左側的三角形, 等待搜索結果。


Colab 界面地址:https://colab.research.google.com/github/haltakov/natural-language-image-search/blob/main/colab/unsplash-image-search.ipynb#scrollTo=xbym_cYJJH6v

在 Colab 會話中執行更多搜索,請參考上述步驟 5-7。在 Google Colab 會話后,可以選擇注銷谷歌帳戶,因為登錄谷歌帳戶會影響隱私。

本機上運行  

想要在本機上實現該功能,首先需要安裝必要的依賴項,安裝代碼如下:

pip install -r requirements.txt

如果想要運行所有的代碼,打開 Jupyter notebooks,按照以下編號順序以及說明依次操作:

01-setup-clip.ipynb:設置環境,檢查并準備 CLIP 代碼;

02-download-unsplash-dataset.ipynb:從 Unsplash 數據集下載圖片;

03-process-unsplash-dataset.ipynb:使用 CLIP 處理數據集中的所有圖片;

04-search-image-dataset.ipynb:使用自然語言查詢在數據集中檢索圖片;

05-search-image-api.ipynb:使用 Unsplash Search API 檢索圖片,CLIP 過濾搜索結果。


注意:只有精簡版的 Unsplash 數據集是公開可用的。如果你想使用完整版,你需要申請(免費)訪問權限;使用 Unsplash Search API 搜索圖像不需要訪問 Unsplash 數據集,但可能會產生糟糕的結果。

上述內容就是怎么在Colab上實現近200萬圖片的精準檢索匹配,你們學到知識或技能了嗎?如果還想學到更多技能或者豐富自己的知識儲備,歡迎關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

友谊县| 云龙县| 信阳市| 威海市| 龙南县| 云林县| 建水县| 贵德县| 万宁市| 黑水县| 菏泽市| 汉中市| 宁波市| 四川省| 铁力市| 得荣县| 新平| 荣昌县| 通江县| 同江市| 桐乡市| 新余市| 宣威市| 南涧| 五常市| 连州市| 仙游县| 漳平市| 阿拉善右旗| 华容县| 平度市| 长岭县| 合肥市| 巫山县| 清涧县| 安龙县| 汝阳县| 湟源县| 寿宁县| 司法| 军事|