tr
tr

Bilgisayarlı Görü (Computer Vision) Nedir?

Bilgisayarlı Görü

Bu yazı serimizde “Bilgisayarlı Görü Nedir?”den başlayıp alt parçacıklarına kadar her ay bir yazı yayınlayacağız. Gerektiği yerlerde örnek uygulamalar üzerinde anlatılacaktır. İlk yazıma bilgisayarlı görünün ne olduğundan bahsedeceğim.

Bilgisayarlı görünün ilk çalışmaları 1970 yıllarına dayanmaktadır. Bilgisayarlı görü, temel olarak bir insanın görsel olarak yapabileceği görevleri veya işlevleri bilgisayar sistemli ortamda yapmaya çalışmaktır. Dijital görüntülerden veya video görüntüleri üzerinden insanın karar verebileceği bir şekilde işlemler yapıp çıkan sonuca göre karar vermesidir. Bilgisayarlı görü görüntü üzerinde sayısal veya sembolik olarak bilgi üretmek için sayısal görüntüyü oluşturma, işleme, analiz etme ve anlamlı hale getirme yöntemlerine başvurmaktadır.

Bilgisayarlı Görü arka planı çok geniş bir yelpazede yer almaktadır. Görüntü üzerinde işlem gerçekleştirirken istatistik, fizik, geometri ve öğrenme teorisi yardımıyla oluşturulan modellerden dolayı her çalışma dalı ayrı ayrı uzmanlık gerektirmektedir. 

Genel olarak bu dallar şöyle sıralanabilir:

Tanıma (Recognition) 

Bilgisayar görme, görüntü işleme ve makine görmedeki klasik problem, görüntü verilerinin alındıktan sonra belirli bir nesne, özellik veya etkinlik içerip içermediğinin belirlenmesidir.

Nesne Tanıma (Object recognition):

Nesne sınıflandırılması olarak adlandırılmaktadır. Bilgisayarlı görü alanındaki bu teknoloji, herhangi bir görüntü veya videoda nesneleri bulma ve tanıma işlemi yapmak için kullanılmaktadır. Örnek olarak; ağaç, insan, araba ve yapı gibi tespit işlemlerini buna örnek olarak verebiliriz.

Kimlik (Identification):

Hedef alınacak bir nesnenin sahip olduğu sadece bir örneği üzerinde tanıma işlemi yapmasıdır. Buna örnek olarak ev yapılarının herhangi bir türünün özelliğini tanınması diyebiliriz (Dron ile çekilmiş evlerin baca şekilleri).

Tespit Etme (Detection)

Algılama sistemi olarak da bilinmektedir. Temel olarak basit ve hızlı hesaplamalara dayalı dijital görüntü videoların belirli bir koşul için taranmasıdır. Örnek olarak ormanda keşif yapan bir dronun yangın tespit etmesini verebiliriz.

İçeriğe Dayalı Görüntü Alma (Content-based Image Retrieval)

Geniş bir resim kümesindeki belirli bir içeriğe sahip tüm görüntüleri bulma işlemini gerçekleştirmektedir. Örnek olarak elimizde bulunan karmaşık bir verisetini içeriğine göre düzenlemek için insan, hayvan, ev ve araba gibi içeriği olanları analiz edip sınıflandırma yapma işlemi diyebiriz.

Poz Tahmini (Pose estimation)

Kameradan alınan görüntü üzerinde hedef nesnenin konumunu veya yönünün tahmin edilmesidir. Bu sisteme örnek olarak kimlik doğrulamada yüz tanıma sistemleri kullanılırken interaktif olarak kullanıcıya gözünün kapatılması kafasının hareket edilmesi söylenip poz tahmini yaparak doğruluğu kesinleştirilmiş olunur. Poz tahmini yapılırken için dönme matrisi veya kuaterniyona konularına bakabilirsiniz.

2D Kod Okuma (2D code reading)

Veri matrisi ve QR kodları gibi 2D kodların okunması işlemidir.

Yüz Tanıma (Facial Recognition)

Yüz tanıma işlemi, kişiyi dijital görüntü veya video kaynağından tanımlayabilen veya doğrulayabilen bir teknolojidir. Kişinin yüz dokularına ve şekline göre desenleri analiz ederek bir kişiyi benzersiz bir şekilde tanımlayabilen Biyometrik Yapay Zeka tabanlı bir uygulama olarak da tanımlanmaktadır.

Şekil Tanıma Teknolojisi (Shape Recognition Technology)

Örüntü tanıma olarak da bilinmektedir. Verilerdeki örüntülerin ve düzenliliklerin otomatik olarak tanınmasıdır. Örüntü tanıma yapay zeka ve makine öğrenimi ile yakından ilişkilidir veri madenciliği ve veri tabanlarında bilgi keşfi (KDD) gibi uygulamalarla birlikte ve genellikle bu terimlerle birbirinin yerine kullanılır.

Hareket (Motion): 

Daha çok bir görüntü sekansının işlendiği hareket tahmini ile ilgilidir. Bu tür görevlere örnek olarak:

Egomotion

Kameranın 3D döndürme ve çevirme kamera tarafından üretilen bir görüntü dizisinden belirlenmesi. Bilgisayar görme alanında egomotion, bir kameranın hareketini katı bir sahneye göre tahmin etmek anlamına gelir. Egomotion tahmini, otonom robot navigasyon uygulamalarında önemlidir.

Takip (Tracking)

Genellikle görüntü dizisindeki daha küçük bir ilgi noktası veya nesne kümesinin hareketlerini takip etme işlemidir. Bunlar araç, insan veya diğer varlıklar olabilmektedir. Takip sistemleri güvenlik ve gözetim gibi alanlarda çokça tercih edilmektedir. Örneğin askeri İHA’larda bulunan sınır gözetleme sistemleri ile sınırdaki kaçak geçiş yapanların takibi ve izlenmesi işleminin yapılması.

Optik Akış (Optical Flow)

Görüntüdeki ayrı ayrı her nokta için o noktanın görüntü düzlemine göre nasıl hareket ettiğini belirlemek için kullanılmaktadır. Nesne segmantasyonu, temas süresi bilgisi ve parlaklık gibi bir çok alan için de kullanılmaktadır.

Bilgisayarlı Görü
Bir video dizisindeki hareketli bir nesnenin optik akış vektörü
                                    

Sahne Geri Çatımı Scene Reconstruction)

Bir sahnenin ya da bir videonun bir ya da daha fazla görüntüsü verildiğinde, sahnenin yeniden yapılandırılması sahnenin 3D modelini hesaplanması amaçlamaktadır

Görüntü Onarımı (Image Restoration)

Buradaki amaç görüntüde istenilen hatların ortaya çıkarılması ve kullanışlı hale getirilebilmesi için görüntü üzerinde iyileştirme veya parazitlerden (sensör gürültüsü, hareket bulanıklığı gibi.) kurtarmak için bazı filtreleme işlemlerinin uygulanmasıdır. Uygulanan filtrelere örnek vermek gerekirse bulanıklaştırma, keskinleştirme, kabartma ve kenar algılamayı verebiliriz.

Yukarıda sıraladığımız gibi bir çok alt çalışma alanlarına ayrılmaktadır. Bilgisayarlı görü artık birçok alanda kullanılmaktadır. Bunlardan en önemlileri ise medikal, askeri ve otonom araçlar üzerindeki çalışmalardır. İnsanın karar vermekte güçlük yaşayacağı veya karar veremeyeceği şekilde kararlara bile doğru karar veren bu sistemler her geçen gün kendini bir adım ileri götürmektedir.

Kullanım alanlarının bir kaçını inceleyecek olursak:

Medikal Uygulamalar

Bilgisayarlı görünün en çok kullanıldığı alan olarak söylenebilir. Ultrason ve röntgen filimleri üzerinde tespit işlemleri yapılarak daha ayrıntılı ve net bir görüntü elde edilmektedir. Göğüs radyogramlarında görüntü zenginleştirme, sayısal diyot alanlı radyografi tarayıcıları (Diode Array Digital Radiography) ile elde edilen göğüs radyografileri üzerinde uygulanan görüntü işleme teknikleriyle ciğer ve mediastinumun ayrılabilmesi için ve bazı tepe değeri belirleme (peak detection) yöntemleri gibi işlemler için kullanılmaktadır. Bir diğer tıbbi uygulamalardan biri de çeşitli kenar zenginleştirme algoritmaları kullanarak damar görüntülerinin belirginleştirilme işlemidir. Bu gibi birçok alanda kullanılmaktadır.

Bu sayede doktorlara kolaylık sağlayıp işlerini daha iyi yapabilmeyi mümkün kılmaktadır. Medikal uygulamalarda kullanılan görü sistemleri hakkında daha ayrıntılı bir yazı okumak isterseniz Prof. Dr. Neşe Yalabık, Ali H. Göktoğan tarafından yazılan “Görüntü İşleme ve Biyomedikal Uygulamaları adlı yazısını inceleyebilirsiniz.

Askeri Uygulamalar

Günümüzde askeri alanlara yapılan yatırımlar gittikçe artmakta ve bununla birlikte insansız bir şekilde hedef belirleme ve imha etme gibi çalışmalar üzerine çalışmalar hız kazanmaktadır. Gerek insansız hava araçları gerekse kara ve deniz araçlarında bir çok alan için bilgisayarlı görü sistemlerine başvurulmaktadır.

Bu araçlar üzerinde bulunan ya da harici sistem olarak; radarlar, ultrasonik cihazlar, roketler ve lazer gibi araçlar, algılama sistemlerinde artık görüntü sistemleri ile bağdaştırıp doğruluk oranı arttılmaktadır. İnsansız hava araçları ile alınan görüntüler üzerinde bilgisayarlı görü teknikleri kullanılarak haritalama, tespit, lokasyon ve tracking gibi işlemler hızlı ve doğru bir şekilde gerçekleştirmektedirler.

 

Otonom Araç Uygulamaları

Otonom araç teknolojisi dünya çapında oldukça ilgi odağı olmuştur. Otonom sürüş için şerit algılama asistanı, stereo görüntü kullanarak engel algılama, kızılötesi görüntü kullanarak yaya algılama uyarı sistemi, lazer radar ve tek lensli kamera gibi sistemler bulunmaktadır. Bu sistemlere binaen bilgisayarlı görü algoritmaları kullanılarak aracın en verimli şekilde otonom sürüşü gerçekleşmektedir. En çok kullanılan yöntem olarak derin öğrenme ile nesne algılama ve tanıma diyebiliriz. Derin öğrenme yöntemlerinde, yerel algılama alanları katman katman büyür. Çizgi, sınır ve köşe gibi basit özellikleri düşük seviyeli katmanlar algılarken yaya, araba veya trafik işaretleri gibi yüksek özellikleri yüksek seviyeli katmanlar algılar derin öğrenme yöntemleri, nesneleri farklı ayrıntı düzlemlerinde temsil etmeye müsaade eder.

Son olarak yakın zamanda hayatımızın bir çok alnında bilgisayarlı görü ile çalışan teknolojiler göreceğiz. Bu alanda kendini yetiştirmek ve literatüre hakim olmak isterseniz yayınlamış olduğumuz yazıları takip edip okumanızı tavsiye ederiz. İlerleyen konularda örnekler ile bu işlerin nasıl yaıldığını öğrenmiş olacaksınız. Esen kalın…

Muhammed Şara 

Bilgisayar Mühendisi

 

Kaynaklar:

http://en.wikipedia.org/wiki/Computer_vision

http://www.emo.org.tr/ekler/66473650870501e_ek.pdf?dergi=196

https://tel.archives-ouvertes.fr/tel-01727720/file/These_UTC_Alia_Chebly.pdf