partner serwisu

Wyszukiwanie obrazem - Google, TinEye i inni

Wyszukiwanie obrazem - Google, TinEye i inni
Autor:
Agnieszka Serafinowicz
Data publikacji:
15 czerwca 2015, 02:21
Średnia ocena:
Twoja ocena:
Tagi:
bing, google, google images, image raider, karma decay, poszukiwanie zdjęć, reverse image search, tineye, wyszukiwanie obrazem, wyszukiwarka, yandex

Dynamiczny rozwój technik przetwarzania danych, stale rosnąca moc obliczeniowa oraz coraz efektywniejsze algorytmy umożliwiają korzystanie z graficznych metod wyszukiwania informacji, czyli tzw. wyszukiwania obrazem. Technika zwana odwrotnym wyszukiwaniem grafiki (ang. reverse image search) jest dziś dostępna za pośrednictwem wielu aplikacji i usług internetowych. Korzysta z niej najpotężniejsza wyszukiwarka świata - Google, ale jest ona dostępna również za pośrednictwem innych ciekawych rozwiązań, jak np. serwis TinEye. W naszym poradniku wyjaśniamy kiedy wyszukiwanie obrazem może się przydać, prezentujemy praktyczne zastosowanie różnych usług oferujących taki rodzaj wyszukiwania i podpowiadamy jak z tych usług efektywnie korzystać.

Większość użytkowników wyszukiwarek internetowych, poszukując jakichkolwiek informacji, stron WWW itp. wpisuje po prostu zapytania do wyszukiwarki w formie zwykłego tekstu. W polu wyszukiwania wpisywane są poszukiwane słowa, nazwy produktów, zdania, fragmenty tekstów itp. Taki sposób pracy z wyszukiwarką, zwłaszcza z najpopularniejszą z nich, firmowaną przez Google, jest na ogół dobrze znany każdemu internaucie. Jednak w sytuacji, gdy np. chcemy znaleźć tytuł filmu, ale jedyną informacją, jaką na temat tegoż filmu posiadamy, jest plik graficzny ze stopklatką, wpisywanie jakichkolwiek fraz tekstowych nie wchodzi w grę. W takim przypadku rozwiązaniem jest skorzystanie z tzw. silników odwrotnego wyszukiwania grafiki (z jęz. ang.: reverse image search engines). Są to mechanizmy wyszukiwawcze, w których informacją wejściową, stanowiącą zapytanie użytkownika, jest głównie obraz, a nie tekst. Tego typu usługi są wbudowywane w klasyczne wyszukiwarki, jak również funkcjonują jako odrębne rozwiązania. Przedstawimy ciekawsze z nich, zaczynając od najpopularniejszej wyszukiwarki świata - Google - i wbudowanego w nią mechanizmu odwrotnego wyszukiwania grafiki.

Google i wyszukiwanie grafiką

Korzystanie z wbudowanego w wyszukiwarkę Google mechanizmu odwrotnego wyszukiwania grafiki jest bardzo proste. Wystarczy po wywołaniu strony głównej Google kliknąć widoczną w górnym pasku menu pozycję Grafika.

 

Spowoduje to przełączenie wyszukiwarki w dobrze znany tryb wyszukiwania grafiki, aktywację funkcji wyszukiwania obrazem uzyskamy klikając wskazaną na powyższej ilustracji ikonkę.

Oferowany przez Google mechanizm obsługuje kilka metod przesłania grafiki stanowiącej źródło danych do wyszukania. Standardowo aktywna jest karta Wklej adres obrazu, co oznacza, że wyszukiwarka oczekuje od użytkownika wprowadzenia adresu URL źródłowej ilustracji. Uzyskanie takiego adresu jest banalnie proste.

Wystarczy po prostu kliknąć w przeglądarce WWW prawym klawiszem myszki interesujący nas element graficzny, mający stanowić źródło wyszukiwania, a następnie wybrać z menu kontekstowego pozycję Kopiuj adres URL grafiki.

Teraz pozostaje tylko przełączyć się na otwarty w innej karcie/oknie przeglądarki mechanizm Google Grafika, kliknąć w pole tekstowe i wkleić skopiowany adres używając doskonale znanego skrótu klawiszowego [Ctrl]+[V].

Może pojawić się pytanie, jaki jest sens poszukiwania grafiki w Google, skoro źródłową ilustrację bierzemy właśnie ze strony WWW. Scenariuszy może być kilka, np. szukamy ilustracji o większym rozmiarze, albo podobnych wizualnie. Mechanizm ten jest też pomocny dla właścicieli praw autorskich do zdjęć umieszczonych w Sieci, gdyż umożliwia wykrycie "nieautoryzowanych zapozyczeń" należących do nich i prawnie chronionych fotografii czy ilustracji.

Druga z kart dostępnych w interfejsie mechanizmu wyszukiwania grafiką w Google Grafika pozwala bezpośrednio przesłać do serwerów Google dowolny plik graficzny zapisany na dysku komputera.

Jeszcze prostym sposobem przekazania ilustracji stanowiącej źródło wyszukiwania jest użycie techniki "przeciągnij i upuść". Działa ona w Eksploratorze Windows czy w innym menedżerze plików systemu operacyjnego, na którym uruchomiona jest przeglądarka z usługą Google. Oprócz tego możliwe jest przeciąganie ilustracji bezpośrednio ze stron internetowych, choć w tym przypadku nie zawsze operacja się uda, gdyż niekiedy zdjęcia osadzone są na stronach w nietypowy sposób (wtedy można wykonać np. zrzut ekranowy z danej ilustracji).

Jeżeli korzystamy z Google Chrome, mamy jeszcze jedną możliwość wyszukiwania obrazem, dostępną bezpośrednio w menu kontekstowym wyświetlanym przez przeglądarkę po kliknięciu dowolnej ilustracji prawym klawiszem myszki.  

 

W trakcie przesyłania obrazów wybranych z dysku komputera, na pasku przeglądarki wyświetlany jest stan przesyłania.

Choć usługa Google dobrze radzi sobie z obsługą wielu różnych formatów graficznych (bez najmniejszych problemów działa BMP, PNG, GIF, TIFF, WebP, SVG czy JPEG), to jednak przesłanie zbyt dużych obrazów zakończy się widocznym powyżej komunikatem błędu informującym o maksymalnej rozdzielczości fotografii mającej stanowić źródło wyszukiwania.

Usługa Google służy nie tylko do znajdywania ilustracji na podstawie innych ilustracji. Ilustracja jako źródło może stanowić również dane umożliwiające znalezienie innego typu danych, np. tytułu filmu. Oto przykład:

Powyższa ilustracja to stopklatka z filmu - obraz nie pochodzi z internetu, został przez nas wykonany ręcznie podczas odtwarzania pliku wideo zapisanego na dysku komputera. Tego typu grafika może być umieszczona np. bez opisu na jakiejś stronie WWW, użyta przez użytkownika jakiegoś forum internetowego - możliwości jest tu wiele. Korzystając wyłącznie z wyszukiwarki tekstowej, znalezienie odpowiedzi na pytanie "Z jakiego filmu pochodzi to zdjęcie?" jest po prostu niemożliwe. Zupełnie inaczej rzecz się ma w przypadku wyszukiwania obrazem.

Po przesłaniu zdjęcia, wyszukiwarka Google znalazła podobne zdjęcia. Oczywiście nie identyczne, bo zrzut losowo wybranej klatki filmu został wykonany przez nas w redakcji i nigdy nie był wcześniej umieszczany w Sieci. Nie przeszkodziło to wyszukiwarce, obok wyświetlonych wyników łatwo znaleźć tytuł filmu: "Battleship".

Korzystając z wyszukiwania obrazem w opisywanej warto pamiętać, że Google nie tylko przetwarza i analizuje obraz podany jako źródło, ale bierze pod uwagę również kontekst zdjęcia, czyli wszystkie towarzyszące fotografii dane. W przypadku ilustracji pochodzącej ze strony WWW może to być tytuł strony na której jest ilustracja, jej treść, odnośniki, tekst alternatywny (tekst odnośnika), podpis w mapie witryny, nazwa pliku itd. Podobnie jest w przypadku fotografii przesłanych z dysku komputera - wtedy oprócz samego obrazu analizowane są dane pliku (nazwa, typ) oraz jego metadane, m.in: data wykonania zdjęcia, czym wykonano, z jakimi parametrami, rozdzielczość itd. Google potrafi korzystać z informacji (metadanych) przechowywanych w standardzie EXIF czy XMP. 

TinEye - weteran na rynku usług wyszukiwania obrazem

Google jest najpopularniejszą wyszukiwarką, ale oczywiście nie jedyną. W kontekście rozpatrywanego tu zagadnienia nie sposób pominąć usługi TinEye oferowanej przez kanadyjską firmę  Idée Inc. Działająca już od 2008 roku usługa jest jednym z pierwszych rozwiązań przeszukiwania Sieci obrazem. Od początku jej twórcy deklarowali stosowanie zaawansowanych algorytmów przetwarzania i analizy obrazu, zamiast opieranie się wyłącznie na metadanych zdjęcia czy słowach kluczowych towarzyszących ilustracji znalezionej w internecie.

Przez długi czas TinEye zaskakiwał trafnością wyszukiwania, jednak dziś skuteczność działania zaimplementowanych w tym serwisie mechanizmów zauważalnie ustępuje tym wypracowanym przez Google, co wynika choćby z różnicy w ilości indeksowanych danych. TinEye zindeksowało blisko 11,5 miliarda obrazów. To olbrzymia liczba, ale mniejsza od ilości zindeksowanej przez Google. Niemniej ze względu na różnice w działaniu algorytmu, warto wypróbować TinEye, może własnie wyniki uzyskane za pomocą tego mechanizmu będą bardziej odpowiadać oczekiwaniom użytkownika.

Korzystanie z TinEye jest równie proste, co w przypadku analogicznej usługi Google Grafika. Obsługiwana jest technika "przeciągnij i upuść", można bezpośrednio wybrać i przesłać plik z dysku komputera, bądź wkleić adres URL obrazu mającego stanowić źródło wyszukiwania. Dostępne są również rozszerzenia dla różnych przeglądarek WWW umożliwiające korzystanie z TinEye bezpośrednio z poziomu przeglądarki bez potrzeby wywoływania strony głównej serwisu

Spróbowaliśmy zatrudnić TinEye do "znalezienia" naszego logotypu. W niespełna 5 sekund wyszukiwarka wyświetliła informację o znalezieniu 181 wyników. Niestety żaden z rezultatów nie prowadził do właściwego źródła, wynikami były podobne logotypy, przy czym wyraźnie widać, że algorytm wyszukiwarki preferował ilustracje charakteryzujące się krojem pisma zbliżonym do zastosowanego w naszym logo.

Próba ze stopklatką z filmu, użytą podczas testów wyszukiwarki Google, tym razem zakończyła się kompletnym fiaskiem:

Ciekawostką w TinEye jest możliwość nietypowego sortowania rezultatów wyszukiwania. Jeżeli uda się uzyskać sensowną listę wyników, to znalezione ilustracje można posortować według najlepszego dopasowania (w sensie - zdjęcia/grafiki najbardziej przypominające zadany kadr), według największych (rozmiarami/rozdzielczością) obrazów oraz według najbardziej różniących się ilustracji (wśród tych, które algorytm TinEye zakwalifikował jako pasujące do zapytania użytkownika). Oprócz tego można listę wyników ułożyć względem najnowszych lub najstarszych zindeksowanych zdjęć. Takich metod sortowania w usłudze Google nie ma.

Bing - największy konkurent Google

W funkcję odwrotnego wyszukiwania grafiki wyposażona jest również wyszukiwarka Microsoftu. Mechanizm, nazwany tutaj Image Match (dopasowanie obrazu) działa co prawda podobnie, jak w przypadku Google, ale jest inaczej obsługiwany. Standardowy interfejs Binga nie udostępnia kontrolek umożliwiających bezpośrednie przesłanie obrazu.

Po wywołaniu głównej witryny tej wyszukiwarki w przeglądarce WWW i przełączeniu się na moduł Obrazy zobaczymy coś podobnego do powyższej ilustracji - pojedyncze pole tekstowe umożliwiające wpisanie zapytania. W tym przypadku nie działa metoda "przeciągnij i upuść" i inne sposoby przesłania pliku zdjęcia. Standardowo funkcja Image Match, będąca w przypadku Binga algorytmem odwrotnego wyszukiwania grafiki, jest funkcją pomocniczą w stosunku do zwykłej wyszukiwarki grafiki w Bingu. 

Jak widać na powyższej ilustracji, po wpisaniu wyszukiwanej frazy Bing wyświetlił listę ilustracji pasujących do zapytania (w tym przypadku to ilustracje z zamieszczonych w naszym serwisie artykułów), gdy teraz wskażemy dowolną ilustrację-wynik kursorem myszki, wyświetlone zostaną dodatkowe kontrolki interfejsu, z widoczną po lewej stronie danej miniatury, niewielką ikonką Image Match. Jej kliknięcie aktywuje właśnie funkcję wyszukiwania odwrotnego grafiki. Źródłem w tym przypadku jest fotografia z poziomu której wywołaliśmy tę funkcję.

Kliknięcie ikonki Image Match uruchamia odwrotne wyszukiwanie grafiki, po chwili w wynikach powinniśmy zobaczyć charakterystyczne dla tego typu mechanizmów rezultaty: listę ilustracji podobnych, inne rozmiary danej ilustracji itp. Proszę zwrócić uwagę na wyświetlony obok pola wyszukiwania napis Dopasowanie obrazu. Jego kliknięcie pozwala na ręczne przesłanie obrazu w sposób podobny jak w przypadku wyszukiwania odwrotnego grafiki w Google czy TinEye.

Po kliknięciu Dopasowanie obrazu wyświetlona zostaje ramka, w której możemy wkleić URL obrazka mającego stanowić źródło wyszukiwania, albo kliknąć Przekaż obraz i wskazać plik fotografii/ilustracji z zasobów lokalnego komputera (z dysku, karty pamięci itp.).

Nie wiemy, czemu Microsoft nie udostępnił prostego dostępu do odwrotnego wyszukiwania grafiki z poziomu interfejsu głównej strony Binga, wiemy jednak, że można nieco skrócić opisaną powyżej drogę dotarcia do interesującej nas funkcji wyszukiwarki. Aby móc od razu przesyłać pliki i korzystać z funkcji Dopasowanie obrazu, należy ręcznie w przeglądarce wpisać adres: https://www.bing.com/images/searchbyimage

Nie przejmujmy się wyświetlonym wtedy komunikatem błędu (pokazanym na powyższej ilustracji). Jak widać, obok pola wyszukiwarki widoczne jest od razu polecenie Dopasowanie obrazu. Przy okazji wyświetlona jest informacja o obsługiwanych formatach graficznych przez Binga i największej dopuszczalnej wielkości pliku obrazu.

Karma Decay - przeszukiwarka Reddita

Mechanizm oferowany przez serwis Karma Decay to rozwiązanie o tyle nietypowe, że jest to funkcja odwrotnego wyszukiwania grafiki zawężona wyłącznie do zasobów umieszczonych w popularnym serwisie internetowym Reddit.com.

Obsługa serwisu wygląda podobnie jak w przypadku rozwiązań Google czy TinEye. Możemy wysłać plik z dysku komputera (Wybierz plik) albo wskazać bezpośrednio URL obrazu lub adres strony w serwisie Reddit, na której występuje ilustracja/zdjęcie stanowiące źródło wyszukiwania. Dodatkowo można włączyć/wyłączyć filtr NSFW (Not Safe For Work, czyli po prostu blokujący treści "tylko dla dorosłych"; standardowo jest on włączony), a także zawęzić obszar przeszukiwania do określonych kategorii tematycznych w Reddit poprzez zaznaczenie odpowiednich pól wyboru widocznych w interfejsie wyszukiwarki Karma Decay

Ze względu na fakt, iż usługa ogranicza poszukiwania wyłącznie do jednego serwisu, wyniki wyszukiwania nie będą tak dokładne jak w przypadku Google. Jeżeli jednak mamy ilustrację, o której wiemy, że na pewno pochodzi z Reddita, to za pomocą tej wyszukiwarki z pewnością uda się odnaleźć post, w którym ona występuje. Zwróćmy też uwagę na odsyłacze widoczne w ramce na górze listy wyników. Umożliwiają przekierowanie wyszukiwania do mechanizmów Google i Binga. Widoczny trzeci odsyłacz - ImgOps - nie prowadzi do wyszukiwarki lecz do serwisu z nietypowym edytorem obrazów online.

Yandex - rosyjska wyszukiwarka

Największa rosyjska wyszukiwarka i zarazem najczęściej odwiedzany przez Rosjan serwis internetowy również w swoich zasobach oferuje mechanizm odwrotnego wyszukiwania grafiki.

Interfejs serwisu Yandex wywołany przez polskiego internautę będzie zawsze prezentowany w języku angielskim (twórcy Yandeksa próbowali jeszcze na początku XXI wieku wprowadzić wersję polskojęzyczną, ale znikome zainteresowanie spowodowało szybkie zamknięcie zlokalizowanej wersji witryny), zatem nie znający cyrylicy nie mają się czego obawiać (rosyjskojęzyczna wersja Yandeksa jest dostępna pod adresem Yandex.ru. Aby dostać się do funkcji odwrotnego wyszukiwania grafiki należy na głównej stronie wyszukiwarki Yandex kliknąć ikonę Images, w rezultacie zobaczymy obraz podobny do powyższego. Po prawej stronie paska wyszukiwania widoczna jest ikonka, której kliknięcie uaktywnia panel przesyłania obrazu-źródła wyszukiwania.

Za pośrednictwem tego panelu możemy korzystać z techniki "przeciągnij i upuść", przesłać plik z dysku lub wpisać/wkleić adres URL obrazu, który ma być źródłem danych dla wyszukiwarki.

Tak wygląda lista wyników w Yandeksie. Tutaj ciekawostka - Yandex okazał się jedyną, obok Google'a, wyszukiwarką, która znalazła obraz pochodzący z filmu, z którego wykonaliśmy testową stopklatkę. Niemniej podobieństwo pozostałych ilustracji pozostaje kwestią dyskusyjną. Wyniki wyszukiwarki można filtrować - kontrolka interfejsu do tego przeznaczona widoczna jest po prawej stronie pola wyszukiwania (napis Moderate, co oznacza standardowo aktywny "średni" filtr blokujący treści nieodpowiednie dla dzieci).

Z Yandeksa warto korzystać o tyle, że ma on dostęp do zasobów, które nie są zindeksowane przez Google. Najlepszym przykładem jest choćby wynik naszego wyszukiwania wspomnianej stopklatki z filmu. Yandex znalazł podobny kadr, ale nie była to ta sama ilustracja, co wcześniej znalezione zdjęcia za pomocą odwrotnego wyszukiwania w Google, lecz zupełnie gdzie indziej osadzony obraz.

Image Raider - "multi"-wyszukiwarka

Doświadczeni użytkownicy komputerów, którzy pierwsze szlify w surfowaniu zdobywali jeszcze w zeszłym wieku z pewnością pamiętają takie narzędzia jak multiwyszukiwarki (np. metacrawler) - były to serwisy wyświetlające wyniki różnych wyszukiwarek internetowych w jednym miejscu. Podobnym rozwiązaniem, ale w zakresie wyszukiwania obrazami jest Image Raider.

Image Raider pozwala jednocześnie skorzystać z silników odwrotnego wyszukiwania grafiki wbudowanych w wyszukiwarkę Google, Binga oraz Yandeksa. Formatka do przesyłania plików wygląda podobnie jak w przypadku poprzednio opisywanych serwisów. Z jednej strony mamy możliwość wskazania plików z dysku komputera (Wybierz pliki), a z drugiej możemy podać URL obrazu, który ma być źródłem wyszukiwania. Image Raider oferuje jednak coś więcej - jednorazowo pozwala przeszukiwać do 20 obrazów jednocześnie (podczas przesyłania obrazu z dysku komputera można wskazać jednocześnie więcej niż jeden obraz, należy podczas zaznaczania obrazów przytrzymać klawisz [Shift] lub [Ctrl]).

Wyniki Image Raidera są prezentowane w nieco odmienny sposób, niż we wcześniej opisywanych rozwiązaniach. Zamiast listy miniatur, mamy tutaj listę adresów internetowych wraz z informacją ile podobnych ilustracji do tych, które użytkownik wybrał jako źródło wyszukiwania, znajduje się w danej domenie. Podawana jest również liczba stron w konkretnej domenie, na których znajdują się podobne ilustracje.

Taki sposób prezentacji wyników oraz możliwość hurtowego sprawdzania wielu zdjęć czynią z Image Raidera pomocne narzędziem np. dla fotografów, którzy mogą łatwo sprawdzić, czy przypadkiem ich prawnie chronione zdjęcia nie stały się przedmiotem "zapożyczeń" (mówiąc wprost: kradzieży) przez innych.

2015.06.15, 07:31
Użyteczny artykuł.
2015.06.17, 00:14
Jak najbardziej się z przedmówcą zgadzam, dobra robota.
monortsA
2016.10.02, 16:49
Witam, wystarczy obrócić zdjęcie o 90 stopni i już nie rozpozna ani google ani raider