Çevrimiçi olarak bir internet sitesinde dolaşırken karşılaştığınız CAPTCHA doğrulamaları, web sitelerinde sıklıkla kullanılan bir Turing Testi metodudur. Peki ya bir internet platformu CAPTCHA’yı neden kullanır ve bu kullanıcı testi ne işe yarar?
İlk defa Carnegie Mellon School of Computer Science araştırmacıları tarafından 2003 yılında internet sitelerinin sadece insanlar tarafından kullanıldığını garantilemek için geliştirilmiş bir güvenlik sistemi olan CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart) projesi; en yalın tabir ile işleyişini Turing Testi metodundan alan bir doğrulama sistemidir. 1950 yılında Alan Turing’in yayımladığı Turing Testi metodu, kısaca bahsetmek gerekirse yapay zeka destekli bir yazılımın, sorduğu sorular vasıtası ile karşısındaki kişinin bir bilgisayar mı yoksa gerçek insan mı olduğunu tespit etmeye yarayan bir metoddur.
2000 yılına gelindiğinde üniversite öğrencisi Luis Von Ahn ile profesör Manuel Blum, bilgisayarların çözemeyeceği ancak insanlar tarafından çözülebilecek testler geliştirmek için biraraya gelmişlerdir. Bunun için sorgulama-yanıt doğrulaması döngüsünü içeren CAPTCHA geliştirilmiştir. Dolayısıyla CAPTCHA da Turing Testi’nden ilham alınarak geliştirilen bir metoddur.
Yukarıda ki sloganla piyasaya sürülen sistem gün geçtikçe her gün milyonlarca CAPTCHA’nın çözüldüğü bir dünyada yaşamamıza yol açtı.
CAPTCHA testlerini çözmenin oldukça fazla zaman alması ise kullanıcılar tarafından tepki vermelerine neden olacak bir zaman kaybı olarak nitelendirilebilinir. İstatistiklere göre her gün yaklaşık 200 milyon CAPTCHA testi çözülüyor ve bu testlerin her biri için ortalama 10 saniye harcanıyor. Bu ortalama süreler hesaplandığında günde yaklaşık 500 bin saat sadece bu testleri çözmek için harcanıyor.
İnternet sitesi yazılımları, kullanıcıların daha konforlu ve güvenli bilgi alışverişi gerçekleştirebilmesi ya da alışveriş yapabilmesi amacı ile spam yazılımlarını engellemek için bu sistemi kullanmaktadır. Bu sayede misafirlerin bot ya da insan olduğunu kolaylıkla tespit etme işlevi görmektedir.
Alışveriş, forum, sözlük, anket, blog ve diğer pek çok branşta internet sitesi tarafından sıklıkla kullanılan CAPTCHA yazılımı, kullanıcılara bozuk görüntüler sunarak doğru yazılışını girmesini talep eder. Özellikle de çevrimiçi satış ve alışveriş siteleri üzerinde neredeyse sürekli gördüğümüz bu sistem, kafa karıştırıcı metotlar sayesinde ziyaretçinin robot olup olmadığını tanımlar. Bir diğer CAPTCHA yazılımı ise bize çoklu görüntüler göstererek, bu görüntüler arasından istediğini bulmamızı talep eder.
CAPTCHA Ne İşe Yarar ?
CAPTCHA’nın hangi amaçla kullanıldığı ve ne işe yaradığı iki farklı şekilde değerlendirilebilir. İlk olarak, CAPTCHA kodları kullanıcılar tarafından oldukça can sıkıcı ve yararsız bir özellik olarak değerlendirilebilir. İkinci olarak ise, uzun vadede bir internet sitesinden sürdürülebilir olarak verim sağlanmak isteniyorsa, CAPTCHA yazılımına oldukça ihtiyaç vardır.
CAPTCHA’nın internet sitesi sahipleri için oldukça önemli bir yazılım olduğunu belirtmek gerek. Örneğin bir forum sitesi açtınız ve ziyaretçilere üyelik şablonu oluşturarak başlık açma hakkı tanıdınız. Eğer zararlı bir yazılım ya da kötü niyetli bir siber saldırgan tarafından siteniz keşfedilirse; bu kişiler basit bir şekilde oluşturacakları bir kod sayesinde sitenize otomatik olarak sınırsız sayıda üyelik açacak ve gereksiz birçok mesaj yazacaktır. Dolayısıyla ortaya spam içerikli mesajlar çıkacağı için siteniz hızla irtifa kaybederek kullanıcıların ve arama motorlarının gözünde zayıflayacaktır.
Tüm bu tehlikeleri kökünden çözmek adına CAPTCHA sistemi kullanılmaktadır. Aksi taktirde ziyaret ettiğiniz internet sitesi sürdürülebilir olmaktan çıkarak, kısa süre içerisinde size sunduğu verimli hizmet sona erecek ve kullanıcılarının güven skorunu yitirecektir.
CAPTCHA Çeşitleri
CAPTCHA kavramının genel bir isim olduğunu, yalnızca tek bir eklentiyi kapsamadığını da bilmeniz gerekiyor. Örneğin hatırlayacağınız üzere birçok internet sitesinde farklı farklı doğrulama yazılımları ile karşılaşılmaktadır. CAPTCHA’lar kimi zaman karmaşık dizilmiş harf ya da sayılardan oluşabiliyor. Bazen ise basit ve dört işlemi kapsayan matematik soruları soruluyor. Bunun dışında yine bilindik genel kültür soruları da CAPTCHA’larda gördüğümüz bir türdür. Son dönemde sıklığı artan CAPTCHA türlerinden biri ise sesli CAPTCHA’lardır.
Hem kullanıcıları yormayacak hem de internet sitesi işletmecilerinin işini karşılayan bir diğer CAPTCHA türü, Google tarafından geliştirilen ReCAPTCHA hizmetidir. ReCAPTCHA oldukça basit bir şekilde sizden yalnızca “Ben Robot Değilim” butonuna basmanızı talep eder. Bu butona basarken kullandığınız fare hareketleri ve yazılımın çerezlerinizi kontrol ederek sizi doğrulaması üzerine birkaç saniye içerisinde sayfaya bağlantı gerçekleştirebilirsiniz. Eğer fare hareketinizde ya da çerezlerinizde dikkat çekici bir unsur var ise sizden birkaç resim doğrulaması istenir. ReCAPTCHA’nın resim doğrulama sistemi de yine birkaç saniye içinde çözülür ve oldukça basit bir şekilde sonlanır.
CAPTCHA Testleri ile Dijital Dönüşümler
CAPTCHA’yı insanlığın dijital dönüşümü yararına kullanmak için geliştirilen reCAPTCHA ise insanlığa faydalı olmak için kullanılıyor. Bu teknoloji beraberinde, müthiş bir beyin gücünün kullanım alanı ihtiyacını doğurdu. Yazılımcılar kitapları tarayıp sanal ortama aktaran yani pdf formatına dönüştüren bir yazılım geliştirdiler. Yazılımın eksik kaldığı karmaşık-silik kelimeleri çözme göreviyse insanlara düştü. Yazılım kendisi çözemediği kelimeleri CAPTCHA’ya yerleştirerek insanların çözmesini sağladı. Sistemin adı da reCAPTCHA olarak değiştirildi.(burada re tekrar eden anlamına geliyor diyebiliriz)
Aslında çözülen her reCAPTCHA testinden elde edilen sonuç, optik karakter tanıma teknolojisi olarak bilinen OCR için kullanılıyor. OCR, bilgisayar ortamında bulunmayan yazılı dokümanların, özel tarayıcılar veya normal olarak taranmış resimlerinin FineReader ve OmniPage gibi bazı özel programlar aracılığıyla bilgisayar ortamında düzenlenebilecek sayısal hale aktarılmasını sağlıyor.
CAPTCHA’nın bu anlamda kullanıldığı alanlardan birisi de dijital kütüphane projesi. OCR teknolojisiyle kütüphanelerdeki eski kitaplar dijital ortama aktarılarak korunuyor. Böylelikle eski bilgilerin kaybolmasının önüne geçiliyor. Örneğin 13 milyondan fazla makaleden oluşan New York Times arşivi, dijital ortama aktarılarak tüm makaleler aranabilir duruma getirildi.
Tamda bu noktada günde 100 milyondan fazla ReCAPTCHA çözülürken – ki bu yılda 2.5 milyon kitap pdf e çevriliyor demek – 2009 yılında Google ReCAPTCHA’yı satın aldı. Sistem ile tüm Google kitaplarını ve New York Times gazetesinin arşivini dijitalleştirdiler.
Google yine parlak bir fikirle çıkarak Google Street numaralarını – yani cadde numaralarını – ReCAPTCHA’larda kullanmaya başladı. Bu sayedede Google Haritalar’a müthiş bir yardım ve geliştirme sağladı. Zaman geçtikçe bilgisayar teknolojisi de ilerledi. Artık yazılım insana ihtiyaç duymadan CAPTCHA’ları kendi kendine çözebilir hale geldi. Google giderek gelişen yazılımlara karşı CAPTCHA’ları zorlaştırdı ama eninde sonunda yazılım çözmeyi başardı. Tam bu noktada tıkanan teknolojiye yeni bir soluk gerekmekteydi. Google mühendisleri de bugünlerde hepimizin aşikar olduğu yeni nesil CAPTCHA’yı geliştirdiler:
Beyaz kutucuğa tıkladığımızda Google’a bazı HTTP bilgileri gidiyor. Bunlar IP adresiniz, bulunduğunuz konum, zaman, tıklamadan hemen önce imleci kaç saniye kaydırdığınız, sayfayı aşağı doğru nasıl ve kaç saniyede kaydırdığınız ve Google’ın gizli tuttuğu diğer bilgiler. Google’ın yazılımı aldığı bu bilgilerle çoğu zaman sizin insan mı robot mu olduğunuza anında karar verse de kimi zaman kararsız kaldığında aşağıdaki görüntüyle karşılaşıyoruz:
Bu resimlerden yazılımın sizden istediği 3 tanesini seçiyorsunuz bu sayede de, yazılım robot insan ayrımını yapabiliyor. Peki, Google’ın sistemi çözemediği kelimeleri CAPTCHA yoluyla insanlara çözdürmek istiyorsa, cevabın doğru olup olmadığını nasıl anlıyor ?
CAPTCHA da çıkan 2 kelimeden 1 ine yazılımın bildiği bir kelime atanıyor, diğer kelimeye ise yazılımın bilmediği bir kelime atanıyor. Aynı CAPTCHA’yı binlerce insan çözdüğü için gelen cevaplara yorum yapıyor(makine öğrenimi açısından tahmin ediyor ifadesi daha uygun olmakla birlikte) ve doğru kelimeyi buluyor.
CAPTCHA’nın bir diğer kullanım alanı da, gelecekteki sürücüsüz araçlar için bizlerden veri toplayabilmek. Günümüzde kullanılan CAPTCHA algoritmasında, yol, köprü ve trafik ışıklarının sorulmasının nedeni bu.
İlk yorum yapan olun