• Na co patrzy sztuczna inteligencja?

    Cześć! W ostatnim artykule, na przykładzie modelu VGG16, pokazałem Ci, w jaki sposób sztuczna inteligencja przetwarza obraz i czego na nim szuka. Pora zatem odpowiedzieć sobie na kolejne pytanie: które fragmenty obrazu są najbardziej istotne i decydują o danej klasyfikacji? Klasyfikacja to proces przetwarzania obrazu, kończący się przydzieleniem etykiety. Jeżeli do naszego modelu wrzucimy zdjęcia psa i model zadecyduje, że na zdjęciu jest pies, to „PIES” jest etykietą, a „DECYZJA” – klasyfikacją.   Gdzie się patrzy sieć neuronowa? Żeby się tego dowiedzieć, skorzystamy z popularnej metody, jaką jest nanoszenie map ciepła na obraz. Zanim jednak zaczniemy nasz eksperyment, musimy uzyskać mapę ciepła dla danego obrazu. Proces ten jest dość skomplikowany,…

  • Mniaturka wpisu

    Jak sztuczna inteligencja widzi obrazy?

    Cześć! Z pewnością słyszałeś o sztucznej inteligencji oraz jej postępach we wszystkich dziedzinach naszego życia. Czy zastanawiałeś się kiedyś, jak taka sieć neuronowa widzi obrazy, a raczej jak je przetwarza? Postanowiłem zrobić prosty eksperyment i podzielić się z Wami rezultatami, które otrzymałem. Słowem wstępu, model sieci neuronowej, z którego korzystam, to VGG16, standardowo zaimplementowany do biblioteki Keras. Składa się on z 18 warstw i jest podzielony na 5 bloków. VGG16 to model sieci konwolucyjnej i chyba nikogo nie zaskoczy, że są to warstwy typu Conv2D i MaxPooling2D.   Jak sieć neuronowa przetwarza obraz? Zadaniem modelu VGG16 jest rozpoznawanie tego, co znajduje się na zdjęciu. Zdjęcie jest o wymiarach 200×250 pikseli. …